BI allgemein

Crisp DM Alle Phasen nennen + erste zwei näher beschreiben

Cross Industry Standard Process for Data Mining (CRISP-DM)
-> branchenübergreifender Standardprozess für Data Mining
-> Data Mining Prozessmodell
 
 
Business Understanding:
 
1. Problemdefinition oder Zielsetzung (intensiver Austausch zwischen Fachabteilungen nötig)
2. Kriterien zum Erreichen bestimmen (z.B. Artikel an 5% der registrierten Kunden verkaufen)
 
-> Klare Definition und genauer Projektplan helfen dabei, Frustrationen zu vermeiden und später das Projekt zu evaluieren.
 
Data Understanding
Datenquellen werden ermittelt, Datensätze werden gesichtet und auf ihre Qualität hin beurteilt
 
Herausforderungen: unvollständige oder fehlerhafte Daten können die Analyse verfälschen
 
Data Preprocessing/ Preparation
Daten für Analyse vor- und aufbereiten (selektieren, bereinigen, integrieren oder formatieren), wenn
nötig Daten zu Gruppen zusammengefasst oder neue Merkmale aus den Daten ableiten
 
Modelling
Hier findet das eigentliche Data Mining statt  Bildung eines oder mehrerer geeigneter Modelle.
 
1. Auswahl Modellierungsmethode (z.B. Entscheidungsbäume, Clusterverfahren, künstliche
neuronale Netze, Regression oder Regelinduktion)
2. Erstellung eines Test-Designs  generiert Trainings- und Testdaten
3. Modell wird gebaut und mit den richtigen Parametern justiert
 
Evaluation
-Ergebnisse der Datenanalyse werden bewertet  Vergleich Data Mining Resultate mit vorher
definierten Erfolgskriterien
-Modelle werden ermittelt, die der Problemstellung gerecht werden und akzeptable Daten liefern
 
Deployment
-Modell wird auf die aktuellen Daten angewendet
-Plan für sinnvolle Anwendung der Ergebnisse und die Instandhaltung der Modelle wird erstellt
-Plan muss überwacht und gepflegt werden
-Abschlussbericht/ Präsentation informiert andere Personen oder Abteilungen

Diskussion