Ein Data Warehouse (DWH) ist eine zentrale Speichereinheit, in der Daten aus verschiedenen Quellen zusammengefasst, verdichtet und langfristig gespeichert werden. Durch diesen Vorgang vereinfacht sich nicht nur der Zugriff für den Verwender, die Datenbank kann ebenfalls als Analyse Tool verwendet werden, um diverse Unternehmensprozesse zu unterstützen. Diese Daten können von ganz verschiedenen Plattformen kommen, Unternehmensabteilungen wie die Buchhaltung kann Daten liefern, der Shopify Account gibt Auskunft über Lieferadressen, Bestellhäufigkeit und Kaufkraft von Kunden oder es werden bestehende Datenbanken, wie der Kundenstamm, in das Data Warehouse integriert.
Die Daten werden nicht nur einmalig gespeichert, sondern ständig aktualisiert, dies nennt man dann ein ETL-Prozess (Extraktion – Transformation – Laden). Mithilfe des ETL-Prozesses können große Mengen von Daten, auch aus anders strukturierten Datenbanken, in das DWH integriert werden. All diese Daten können nun zentral an einem Ort miteinander verknüpft abgerufen werden was Übersichtlichkeit und Aussagekraft bestimmter Kennzahlen erhöht.
Die 4-Kerneigenschaften eines Data Warehouses sind somit: Datenbeschaffung, Datenhaltung, Datenversorgung und Datenanalyse.
Für wen ist ein Data Warehouse relevant?
Ein DWH wird in den meisten Unternehmen erst dann relevant, wenn es eine bestimmte Größe erreicht hat, und sich die Datenmengen steigern oder es bereits groß ist und noch kein einheitliches Datenbankensystem integriert hat.
Für kleinere Unternehmen mit übersichtlichen Datenmengen reichen einfachere Datenbanksysteme und Analyse Tools. Wer jedoch noch kleiner ist, aber stark expandieren wird kann darüber nachdenken, wer ein solches System früh implementiert spart sich hinterher viel Zeit und Geld.
Außerdem kann das DWH auch allein aus Sicht der Analysefunktion schon für kleinere Unternehmen interessant sein, da sich das CRM somit leichter betreiben lässt und Analysen oftmals besser möglich sind.