DB II

Verteilte DBMS

Was ist ETL?

  • Extract-Transform-Load
  • Extract
    • Extraktion eines Ausschnitts der Daten aus Quellsystem
    • Schema Transformation
    • Extraktion periodisch / ereignisgesteuert / anfragegesteuert
  • Transform
    • Syntaktische Transformation (Datentypen, Syntax, …)
    • Sematische Transformation
      - Eliminierung von Duplikaten
      - Anpassung von Datenwerten
      - Umrechnung von Masseinheiten
      - Aggregation
      - Anreicherung der Daten
  • Load
    • Übertragung der Daten ins Zielsystem

Diskussion