Abstract
Informationsextraktion aus touristischen Webseiten stellt für zahlreiche touristische Anwendungen eine Alternative zur manuellen Datenerfassung dar. Touristische Webseiten bzw. Websites stellen dabei spezifische Herausforderungen an die Web Informationsextraktion, z.B. natürlichsprachige Beschreibungen touristischer Angebote, heterogene Struktur der Webseiten und komplexe Preisstrukturen. Aktuelle Systeme realisieren dabei Ontologie-basierte Informationsextraktion und verwenden eine (existente) touristische Domänenontologie als Wissensbasis. Die Diskussion und Evaluierung des im Beitrag vorgestellten Systems TourIE zeigt, dass Ontologie-basierte Informationsextraktion im eTourismus vielversprechend ist, diese jedoch nur eine semi-automatische Maßnahme sein kann.
| Original language | German (Austria) |
|---|---|
| Pages (from-to) | pp. 63-72 |
| Number of pages | 9 |
| Journal | HMD - Praxis der Wirtschaftsinformatik |
| Issue number | 270 |
| DOIs | |
| Publication status | Published - Dec 2009 |
Fields of science
- 102001 Artificial intelligence
- 102006 Computer supported cooperative work (CSCW)
- 102010 Database systems
- 102014 Information design
- 102015 Information systems
- 102016 IT security
- 102028 Knowledge engineering
- 102019 Machine learning
- 102022 Software development
- 102025 Distributed systems
- 502007 E-commerce
- 505002 Data protection
- 506002 E-government
- 509018 Knowledge management
- 202007 Computer integrated manufacturing (CIM)
- 102033 Data mining
- 102035 Data science