Definition Data Warehouse
Ein Data Warehouse ist ein zentraler Speicherplatz für Daten, die aus verschiedenen Quellen gesammelt werden. Das Hauptziel von Data Warehouses ist es, sicherzustellen, dass die in einem Unternehmen gesammelten Daten einen gemeinsamen Bezugspunkt haben und zum Vergleich genutzt werden können (und somit für die Geschäftsanalyse nützlich sind).
Anwendungsfälle für Data Warehouses
- Datenkonsolidierung von mehreren Systemen (wie Apps oder Datenbanken) an einem einzigen Ort.
- Große Mengen an historischen Daten speichern, damit Unternehmen Trends und Muster im Laufe der Zeit analysieren können.
- Benutzern das Teilen von benutzerdefinierten Berichten ermöglichen basierend auf den verfügbaren Daten.
- Bereitstellung einer Plattform für die Geschäftsanalyse und den Vergleich. Die gewonnenen Erkenntnisse helfen Führungskräften und Abteilungen, fundierte Entscheidungen zu treffen.
- Ein Umfeld für KI-Training schaffen,einschließlich Deep Learning und maschinellem Lernen.
Wie Data Warehouses funktionieren (der ETL-Prozess)
- Extraktion (E) ist das Sammeln von Daten aus verschiedenen Quellen, um sie umzuwandeln. Bei der Extraktion geht's darum, die wichtigen Daten zu finden, zu filtern und für die Verarbeitung vorzubereiten.
- Transformation (T) ist der Vorgang, bei dem die extrahierten Daten in ein einheitliches Format gebracht werden. Die Transformation sorgt dafür, dass Daten aus verschiedenen Quellen einen gemeinsamen Bezugsrahmen haben und verglichen werden können.
- Laden (L) beinhaltet das Speichern und Organisieren der umgewandelten Daten (zum Beispiel durch Anordnen in Tabellen).