TY - THES
T1 - Kombiniertes Data Mining - Klassifikation unter Verwendung von durch Clustering gewonnenen Hilfsinformationen
AU - Humer, Markus
PY - 2004/10
Y1 - 2004/10
N2 - Die Aufgabenstellungen im Data Mining sind sehr vielseitig und können in manchen Fällen nur durch eine kombinierte Anwendung verschiedener Data-Mining-Verfahren gelöst werden. Zwar existieren bereits Ansätze, in denen unterschiedliche Verfahren hintereinander ausgeführt werden, ihre Anwendung wird jedoch unabhängig voneinander betrachtet. Diese Arbeit vertieft als Weiterführung einer parallel durchgeführten Studie [SK04] den Begriff des "Kombinierten Data Mining". Beim Kombinierten Data Mining interagieren die angewendeten Methoden miteinander. Durch diese Interaktion soll sich hinsichtlich der Qualität und/oder Effizienz eine Verbesserung gegenüber einer unabhängigen Ausführung einstellen. Dies kann z.B. durch die Weitergabe von Hilfsinformationen des vorgelagerten Verfahrens an das nachfolgende Verfahren erreicht werden.
Im Zuge dieser Arbeit werden ein Clustering- und ein Klassifikations-algorithmus miteinander kombiniert. Dazu wird ein Entscheidungsbaum-Klassifikator implementiert, der Hilfsinformationen, die in einem vorher ausgeführten Clustering identifiziert und berechnet wurden, einfließen lässt. Es soll untersucht werden, welche Hilfsinformationen sich für die Konstruktion des Klassifikators eignen und welchen Einfluss sie auf die Qualität des Klassifikators haben.
AB - Die Aufgabenstellungen im Data Mining sind sehr vielseitig und können in manchen Fällen nur durch eine kombinierte Anwendung verschiedener Data-Mining-Verfahren gelöst werden. Zwar existieren bereits Ansätze, in denen unterschiedliche Verfahren hintereinander ausgeführt werden, ihre Anwendung wird jedoch unabhängig voneinander betrachtet. Diese Arbeit vertieft als Weiterführung einer parallel durchgeführten Studie [SK04] den Begriff des "Kombinierten Data Mining". Beim Kombinierten Data Mining interagieren die angewendeten Methoden miteinander. Durch diese Interaktion soll sich hinsichtlich der Qualität und/oder Effizienz eine Verbesserung gegenüber einer unabhängigen Ausführung einstellen. Dies kann z.B. durch die Weitergabe von Hilfsinformationen des vorgelagerten Verfahrens an das nachfolgende Verfahren erreicht werden.
Im Zuge dieser Arbeit werden ein Clustering- und ein Klassifikations-algorithmus miteinander kombiniert. Dazu wird ein Entscheidungsbaum-Klassifikator implementiert, der Hilfsinformationen, die in einem vorher ausgeführten Clustering identifiziert und berechnet wurden, einfließen lässt. Es soll untersucht werden, welche Hilfsinformationen sich für die Konstruktion des Klassifikators eignen und welchen Einfluss sie auf die Qualität des Klassifikators haben.
UR - http://www.dke.jku.at/index.html?/research/index.html
M3 - Master-/Diplomarbeit
ER -