Abstract
Verschiedene Fragestellungen im Data Mining können nur durch eine Kombination der verschiedenen Data Mining Verfahren, wie Clustering, Klassifikation und Assoziation, beantwortet werden. In den bestehenden Ansätzen wird die Kombination der Data Mining Verfahren losgelöst voneinander betrachtet.
Diese Arbeit führt den Begriff des "Kombinierten Data Mining" ein. Dabei werden die verwendeten Data Mining Verfahren nicht mehr isoliert betrachtet, sondern als Einheit mit dem Ziel aus Sicht der Qualität, Interpretierbarkeit und Effizienz ein "besseres" Ergebnis zu erreichen. Eine Möglichkeit besteht darin im ersten Verfahren Hilfsinformationen zu berechnen, die im Nachfolgeverfahren Gewinn bringend verwendet werden können.
Im Rahmen dieser Arbeit werden Clustering und Klassifikation miteinander kombiniert. Dazu wird eine Implementierung der beiden Clustering-Algorithmen K-Means und DBSCAN vorgestellt, die als Vorgängerverfahren so viele Hilfsinformationen wie möglich für eine Klassifikation generieren. Untersucht werden die möglichen Hilfsinformationen, die während des Clustering erzeugt werden können, und der Mehraufwand, der durch diese Ermittlung der Hilfsinformationen, in Form einer längeren Laufzeit der Algorithmen, entsteht.
| Original language | German (Austria) |
|---|---|
| Supervisors/Reviewers |
|
| Publication status | Published - May 2004 |
Fields of science
- 102 Computer Sciences
- 102015 Information systems
Projects
- 1 Finished
-
Anticipatory Data Mining
Goller, M. (Researcher) & Schrefl, M. (PI)
01.01.2004 → 01.08.2006
Project: Other › PhD thesis project
Cite this
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver