Data MiningWährend beim OLAP die bestätigende Analyse im Mittelpunkt steht, wird Data Mining für die explorative Datenanalyse eingesetzt. Bei der explorativen Datenanalyse ist der Ausgangspunkt der Datenbestand und das Ziel ist die datengetriebene Bildung von Hypothesen durch interaktive Suche nach Strukturen / Abhängigkeiten. Der reine Analyseanteil beim Data-Mining-Prozess beträgt in der Regel nur 20% des Gesamtaufwandes. Der überwiegende Teil der Tätigkeit umfasst die Aufbereitung der Daten, Sicherstellung der Datenqualität, Behandeln fehlender Werte und Transformation der Daten in die vom Data-Mining-Tool erforderliche Datenstruktur.
Da es auch beim Data Mining nicht sinnvoll ist, ohne jegliche Hypothesen-Festlegung an die Arbeit zu gehen, ist die Analyse der Daten mit OLAP-Techniken zu empfehlen, um sich einen Überblick zu verschaffen. Zur Erkennung von Mustern und Abhängigkeiten von Daten kommt der Visualisierungstechnik eine besondere Bedeutung zu. Hier werden Pixel-orientierte, geometrische, Icon-basierte, hierarchische und Graph-basierte Techniken unterschieden. Bei der Data-Mining-Analyse werden ökonometrische Verfahren ebenso wie neuere Verfahren wie Neuronale Netze und Entscheidungsbäume eingesetzt. Es ist wichtig, die Güte dieser Verfahren mit Methoden der Statistik und des gesunden Menschenverstandes permanent zu überprüfen.
Data-Mining-Verfahren werden zunehmend in einer Vielzahl von Anwendungsgebieten eingesetzt. Das reicht von der medizinischen Forschung über den Bereich der Qualitätssicherung bis zur Prognose von Kundenverhalten.