Moderne Datenverarbeitung erfordert leistungsfähige, flexible und einfach zu bedienende Werkzeuge. Apache Hop ist ein solches Datenverarbeitungswerkzeug. Ich habe es wiederentdeckt, nachdem sein Vorgänger, Pentaho Data Integration, auf ein proprietäres Lizenzmodell umgestellt wurde. Hop eignet sich besonders für Datenaufbereitung, Datenbereinigung, Datenintegration und Datenanreicherung auch von grossen Datenmengen.
Der Name „HOP“ steht für „Hop Orchestration Platform“. Die Software ist leicht zu bedienen. Dank einer grafischen Benutzeroberfläche ermöglicht Hop ein einfaches Arbeiten mit Daten - ohne Code schreiben zu müssen.
Hop ist ähnlich wie Talend oder FME, aber Open Source. Hop ist in Java geschrieben und unterstützt die Betriebssysteme Windows 7 oder höher, Linux und macOS.
Daten-Workflows und Daten-Pipelines werden über eine grafische Benutzeroberfläche (GUI) bearbeitet und verwaltet. Der Kern von Hop ist die Hop Engine. Darauf bauen die Softwarekomponenten Hop GUI (Desktop), Hop Run und Hop Server auf. Die Standardinstallation wird mit über 250 so genannten „Transformationen“ ausgeliefert. Diese ermöglichen das Lesen und Schreiben auf einer Vielzahl von Quell- und Zielsystemen, von Dateien (CSV, Excel) über relationale Datenbanksysteme wie PostgreSQL bis hin zu NoSQL-Datenbanken und Cloud Stores. Hinzu kommen die eigentlichen Transformationen zur Verarbeitung. Es ist auch möglich, JavaScript-Code zu schreiben und eigene Erweiterungen (Plugins) in Java zu entwickeln. Es gibt sogar ein GIS-Plugin, das von Dritten entwickelt wurde.
Hop ermöglicht es Entwicklern, sich auf das „Was“ statt auf das „Wie“ der Implementierung von Datenintegrationsprozessen zu konzentrieren und könnte einen grossen Sprung (engl. hop) in der Produktivität bedeuten.
Wer sich ein eigenes Bild machen möchte, dem empfehle ich das neuste Tutorial auf OpenSchoolMaps mit dem Titel „Daten sichten, bereinigen und integrieren mit Apache Hop“, das soeben veröffentlicht wurde (Link).
Wer Interesse hat, Apache Hop näher kennen zu lernen oder Beratung bei der Anwendung sucht, kann mich gerne kontaktieren.