Kombiniertes Data Mining: Effiziente Generierung von Hilfsinformationen während des Clustering

  • Klaus Stöttinger

Research output: ThesisMaster's / Diploma thesis

Abstract

Verschiedene Fragestellungen im Data Mining können nur durch eine Kombination der verschiedenen Data Mining Verfahren, wie Clustering, Klassifikation und Assoziation, beantwortet werden. In den bestehenden Ansätzen wird die Kombination der Data Mining Verfahren losgelöst voneinander betrachtet. Diese Arbeit führt den Begriff des "Kombinierten Data Mining" ein. Dabei werden die verwendeten Data Mining Verfahren nicht mehr isoliert betrachtet, sondern als Einheit – mit dem Ziel aus Sicht der Qualität, Interpretierbarkeit und Effizienz ein "besseres" Ergebnis zu erreichen. Eine Möglichkeit besteht darin im ersten Verfahren Hilfsinformationen zu berechnen, die im Nachfolgeverfahren Gewinn bringend verwendet werden können. Im Rahmen dieser Arbeit werden Clustering und Klassifikation miteinander kombiniert. Dazu wird eine Implementierung der beiden Clustering-Algorithmen K-Means und DBSCAN vorgestellt, die als Vorgängerverfahren so viele Hilfsinformationen wie möglich für eine Klassifikation generieren. Untersucht werden die möglichen Hilfsinformationen, die während des Clustering erzeugt werden können, und der Mehraufwand, der durch diese Ermittlung der Hilfsinformationen, in Form einer längeren Laufzeit der Algorithmen, entsteht.
Original languageGerman (Austria)
Supervisors/Reviewers
  • Schrefl, Michael, Supervisor
  • Goller, Mathias, Co-supervisor
Publication statusPublished - May 2004

Fields of science

  • 102 Computer Sciences
  • 102015 Information systems

Cite this