Werden Sie Teil eines Teams, das sich darauf konzentriert, produktionsreife Systeme für maschinelles Lernen zu entwickeln, die datengestützte Entscheidungsprozesse für große, komplexe Datensätze ermöglichen. In dieser Rolle sind Sie verantwortlich für ML-Modelle und -Dienste - von der Erforschung und Prototypentwicklung bis hin zur Bereitstellung, Überwachung und kontinuierlichen Verbesserung - und arbeiten dabei eng mit den Teams für Data Science, Produkt, Technik und Betrieb zusammen.
Entwickeln, implementieren und pflegen Sie Modelle für maschinelles Lernen, einschließlich Gradient-Boosting-Bäumen, neuronalen Netzen, Prognosemodellen und Transformatoren.
Verwenden Sie Python und das moderne Data-Science-Ökosystem (NumPy, Pandas, Polars, Scikit-learn, PyTorch, XGBoost, Jupyter, Visualisierungstools).
Untersuchen und analysieren Sie große strukturierte Datensätze, insbesondere multivariate Zeitreihen und Abrechnungs-/Betriebsdaten.
Entwickeln Sie hochwertige Funktionen, bewerten Sie Datenannahmen und verbessern Sie die Leistung des Modells durch Iteration.
Entwickeln Sie sauberen, skalierbaren Code und interne APIs (z.B. FastAPI) für Online- und Batch-Inferenz.
Integrieren Sie ML-Dienste in bestehende Systeme und Arbeitsabläufe.
Wenden Sie bewährte Verfahren für Versionskontrolle, Dokumentation, Code-Reviews und testgetriebene Entwicklung an.
Sorgen Sie für Zuverlässigkeit, Klarheit und langfristige Wartbarkeit von ML-Codebasen.
Entwerfen und verwalten Sie CI/CD-Pipelines für ML-Workloads (z. B. GitHub Actions).
Erstellen und pflegen Sie containerisierte Implementierungen mit Docker und Kubernetes (oder ähnlichen Tools).
Implementieren Sie Überwachung, Protokollierung und Experimentverfolgung mit Plattformen wie MLflow, TensorBoard, Datadog, Neptune oder Weights & Biases.
Arbeiten Sie mit relationalen und analytischen Datenspeichern (Postgres, Parquet, DuckDB).
Arbeiten Sie gemeinsam mit den Data Engineering-Teams an SQL/DB-basierten Pipelines für Training, Validierung und Produktionsscoring.
Nutzen Sie LLM-APIs und -Tools (z.B. OpenAI, Cursor), um große Sprachmodelle in Produkte, Arbeitsabläufe und Pipelines zu integrieren, wo sie einen messbaren Wert liefern.
Beherrschen Sie den gesamten ML-Lebenszyklus: Problemstellung, Exploration, Modellierung, Bewertung, Einsatz, Überwachung, Umschulung und Stilllegung.
Identifizieren Sie technische Schulden und sorgen Sie für kontinuierliche Verbesserungen bei Leistung und Zuverlässigkeit.
Vermitteln Sie komplexe ML-Konzepte sowohl einem technischen als auch einem nichttechnischen Publikum.
Dokumentieren Sie Ergebnisse und architektonische Entscheidungen.
Mentor für jüngere Datenwissenschaftler und Ingenieure, um die Fähigkeiten des Teams zu verbessern.
Starke analytische und problemlösende Fähigkeiten, die auf den Prinzipien des maschinellen Lernens basieren.
Fortgeschrittene Python-Kenntnisse und fundierte Kenntnisse des Data Science-Ökosystems (NumPy, pandas, polars, Scikit-learn, PyTorch, XGBoost, Jupyter).
Erfahrung im Einsatz von baumbasierten Modellen und Deep Learning-Modellen in der Produktion.
Praktische Erfahrung mit strukturierten multivariaten Zeitreihendaten.
Kenntnisse in Linux, Git, Bash und Cloud- oder High-Performance-Computing-Umgebungen.
Erfahrung mit CI/CD-Pipelines, Docker und Kubernetes für ML-Workloads.
Vertrautheit mit Tools zur Verfolgung, Überwachung und Protokollierung von Experimenten für ML-Systeme.
Sicherer Umgang mit SQL, relationalen Datenbanken (z.B. Postgres) und analytischen Formaten/Engines (Parquet, DuckDB).
Erfahrung mit der Integration und Eingabeaufforderung von LLM-APIs für die Automatisierung von Daten und Arbeitsabläufen.
Ausgeprägte schriftliche und mündliche Kommunikationsfähigkeiten und eine Erfolgsbilanz der effektiven funktionsübergreifenden Zusammenarbeit.
Interesse an der Betreuung anderer und der Verbesserung der technischen/ML-Praktiken im gesamten Team.
Bachelor, Master oder Ph.D. in einer quantitativen Disziplin - oder gleichwertige Erfahrung, die ML-Engineering-Fähigkeiten auf Senior-Level demonstriert.
5+ Jahre professionelle Python-Entwicklung mit Schwerpunkt auf Data Science und ML.
Mindestens 3 Jahre Erfahrung in der Entwicklung und Bereitstellung von End-to-End ML-Lösungen in der Produktion.
3+ Jahre Arbeit mit Deep Learning oder Entscheidungsbaum-basierten Methoden.
Mindestens 2 Jahre Arbeit mit strukturierten, multivariaten Zeitreihendatensätzen.
Nachgewiesene Erfahrung mit:
CI/CD für ML-Workloads
Docker und Kubernetes (oder ähnliche Orchestrierung)
Linux-basierte Cloud- oder Hochleistungs-Trainingsumgebungen
Doktortitel oder gleichwertige Forschungserfahrung im Bereich Advanced ML.
Erfahrung mit Logistik-, Lieferketten- oder Betriebsdatensätzen.
Tiefgreifende Erfahrung mit Transformatoren, fortgeschrittenen Prognosemethoden oder unüberwachtem Lernen für strukturierte Daten.
Veröffentlichungen, Konferenzbeiträge oder bemerkenswerte Open-Source-Beiträge, die ML-Innovationen demonstrieren.
Erfahrung im Aufbau von LLM-gestützten Tools oder Anwendungen unter Verwendung von APIs und modernen LLM-Frameworks.