Smartstore ETL, Ihr Autopilot für Data Warehousing nach ISO 9001
Donnerstag, 21. November 2019

Smartstore ETL, Ihr Autopilot für Data Warehousing nach ISO 9001

Extract Transform Load (ETL) ist ein Prozess, bei dem Daten aus mehreren gegebenenfalls unterschiedlich strukturierten Datenquellen in einer Zieldatenbank vereinigt werden. Extraktion der relevanten Daten aus verschiedenen Quellen Transformation der Daten in das Schema und Format der Zieldatenbank Laden. Anders erklärt. Verschiedene Datenquellen lassen sich über einen ETL-Prozess Extrahieren und so Aufbereiten das sie sich in ein Data Warehouse integrieren lassen. Quelle: Wikipedia

Das sind die drei Hauptphasen des ETL-Prozesses

Extraktion: Die Extraktion ist der erste Schritt des ETL-Prozesses. Hierbei erfolgt die Auswahl der Daten in den verschiedenen Quellsystemen und die Vorbereitung für die Transformationsphase. In den meisten Fällen extrahiert der Prozess nur Teilbereiche aus einzelnen Quelldatenbanken. Extraktionen finden regelmäßig statt, um das Data Warehouse kontinuierlich mit aktualisierten Daten zu versorgen. Auch ereignisgesteuerte oder anfragegesteuerte Extraktionen sind möglich.

Transformation: Der Extraktion schließt sich die Phase der Transformation an. Die gelieferten Daten werden an das Format und das Schema der Zieldatenbank angepasst. Der Transformationsprozess durchläuft wiederum mehrere Einzelschritte. Diese Einzelschritte können beispielsweise folgende sein:

  • Festlegung grundlegender Aspekte der Formatierung
  • Bereinigung fehlerhafter Daten
  • Prüfen auf ähnliche Informationen und Datenduplikate mit anschließendem Löschen und Ausschließen dieser Daten
  • Gruppieren, Sortieren und Aggregieren der Daten
  • finale Anpassung an Zielformate und Zielschemata

Laden: Der dritte und letzte Schritt ist das Laden der zuvor geprüften und angereicherten Daten. In diesem Schritt erfolgt die eigentliche Integration in die Zieldatenbank oder das Data Warehouse. Die Daten werden physisch zum Ziel verschoben, ohne die Datenbank beim Laden lange zu blockieren. Die Integrität der geladenen Daten ist sicherzustellen. Durch ausführliches Protokollieren und Logging sind sämtliche Änderungen im Zielsystem dokumentiert. Über die Protokollierung ist es möglich, bei Bedarf alte Datenstände wiederherzustellen.

Welchen konkreten Anwendungsfall kann ich mir vorstellen?
Häufig kommen ETL-Prozesse im Umfeld von Big-Data- und Business-Intelligence-Anwendungen zum Einsatz. Besonders die Verarbeitung großer Datenmengen profitiert von der strukturierten ETL-Vorgehensweise. Sind Ihre Informationen auf verschiedenen Subsystemen verteilt, z.B. in einem ERP oder einer Lagersoftware ect. liegt meistens auch redundants vor, und genau hier ist die Anwendung eines ETL-Prozesses sinnvoll. Während des Prozesses erfolgt die Zusammenführung und Aufbereitung der heterogen strukturierten Daten verschiedener Quellen. Die Qualität der Daten wird gesichert und ihre Konsistenz im Data Warehouse hergestellt. An dieser Stelle profitiert Smartstore mit seinem Such Mechanismus, und ist somit in der Lage aus Millionen von Daten in Millisekunden die passende Information zu liefern.

Soweit verstanden. Könnten wir als Beispiel unser ERP über ETL direkt in Smartstore integrieren? 
Ja genauso ist das. Es ist auf jeden Fall die bessere Alternative, als alle Schritte einzeln über Rest-APIs zu entwickeln, diese Art der Daten Integration spart Zeit und beschleunigt Prozesse, am meisten profitiert man aber beim ständigen Abgleich der Daten zur Laufzeit. Typische Einsatzbereiche für ETL finden sich dort, wo Daten in großen Mengen verarbeitet, bereitgestellt und analysiert werden müssen. Beispiele für Anwendungsgebiete sind:

  • Datenspeicherung in einem Data Warehouse
  • Datenbereitstellung für BI-Anwendungen
  • Datenextraktion aus verteilten Datenbankumgebungen oder cloudbasierten Datenbanken
  • Migration von Daten zwischen verschiedenen Anwendungen
  • Replikation von Daten zu Sicherungs- und Redundanzzwecken
Bieten Sie den Smartstore eigenen ETL als Cloud-Dienst an?
Ja. Sie können den Smartstore ETL bei uns als Cloud-Dienst erhalten. Darüber hinaus bieten wir Ihnen die Möglichkeit Smartstore ETL als On-Premises zu nutzen. 

Ab welcher Smartstore Edition können wir diese Form der Daten Verarbeitung nutzen?
Da diese Art der Datenverarbeitung im industriellen Umfeld in Frage kommt bieten wir Smartstore ETL-Cloud und Smartstore ETL On-Premises erst ab der Smartstore Enterprise Commerce an. 


Bereit loszulegen?
Schreiben Sie uns oder probieren Sie Smartstore kostenlos aus. Vertrieb kontaktieren
http://smartstore.com/de/kontakt   
Ihr Kommentar