Aufgaben
- Das Projekt ist in zwei Phasen eingeteilt
- Phase 1: Ablösung Hadoop und Aufbau Zielplattform (bis Q1 2027)
- Ziel der ersten Phase ist die schrittweise Ablösung des bestehenden Hadoop-Clusters sowie die Etablierung der neuen Datenplattform auf Basis von Databricks, Azure Data Factory und (dbt)
- Diese Phase dient insbesondere dazu, die technische Grundlage zu stabilisieren, Erfahrungen mit der Zielarchitektur zu sammeln und Migrationsansätze für die zweite Phase zu standardisieren
- Phase 2: Ablösung Informatica PowerCenter und vollständige Transformation (bis Q1 2029)
-
In der zweiten Phase erfolgt die vollständige Transformation des bestehenden DWH sowie die Ablösung von Informatica PowerCenter als zentralem ETL-Tool
Profil
-
Fundierte, nachweisbare Erfahrung als Data Engineer oder Data Platform Engineer
-
Erfahrung im Aufbau und in der Migration moderner DWH-/Datenplattformen
-
Fundierte Kenntnisse in den relevanten Technologien (dbt, Databricks, Azure Data Factory)
-
Erfahrung in regulierten Umfeldern von Vorteil
-
Erfahrung mit Cloud-basierten Datenplattformen (idealerweise Microsoft Azure)
-
Praxis in Datenmodellierung und Aufbau mehrschichtiger Architekturen
-
Erfahrung mit ETL/ELT-Prozessen und deren Modernisierung
- Erfahrung im Aufbau und Betrieb von skalierbaren Data Streaming Pipelines (Near Real-Time), idealerweise mit Technologien wie Apache Kafka/Debezium oder vergleichbaren Lösungen
Benefits
- Tolles Projektumfeld