AI Research Engineer

Berlin, DEOn-sitedata Today

Worum es geht

Wir bauen die Infrastruktur, die KI in der Rechtsbranche tatsächlich belastbar macht, nicht als Demo, sondern in Produktion, mit messbarer juristischer Qualität. Dafür suchen wir Menschen, die tief in die Mathematik und Architektur moderner LLM-Systeme eintauchen wollen, nicht nur APIs verketten.

Wenn du dich in den letzten zwölf Monaten gefragt hast, ob es irgendwo einen Job gibt, in dem du die ganze Tiefe moderner KI gleichzeitig brauchst: hier ist er.

Aufgaben

Dein Beitrag

Eine Multi-Provider-LLM-Council-Architektur, in der mehrere Modelle parallel arbeiten und über strittige juristische Fragen abstimmen, mit deterministischem Replay für reproduzierbare Evaluations.
Ein Eval-Framework von Grund auf: stratifizierte Gold-Standard-Datensätze, Inter-Rater-Reliability gegen menschliche Anwälte, Backtesting-Pipelines, Confidence-Kalibrierung.
Eine mathematisch belastbare Antwort auf die zentrale Forschungsfrage: Wie quantifiziert man "juristische Belastbarkeit"?
Eigene Forschungsbeiträge, Konferenzpaper und Open-Source-Releases sind explizites Projektziel.
Eine produktionsreife Orchestrierungs-Infrastruktur, die täglich zehntausende Inferenz-Calls über mehrere Modellfamilien koordiniert, mit voller Observability und Fehlertoleranz.

Warum das spannend ist

Forschungstiefe wie in einer akademischen Gruppe, mit Produktions-Hebel wie in einem Top-Startup. Die meisten AI-Rollen sind API-Wrapper. Hier baust du die Schicht darunter.
Recht ist eine der größten noch unautomatisierten Branchen. Wer KI in einer traditionellen, hochregulierten Branche zum Laufen bringt, hat ein deutlich schwierigeres Problem als Web-Demos, und einen entsprechend größeren Hebel.
Klare Deadlines, klare Deliverables. Ein 24-Monats-Plan mit hartem Meilenstein nach 12 Monaten und konkreten Forschungsoutputs.
Du wirst in 24 Monaten mehr über produktionsreife LLM-Systeme gelernt haben als in fünf Jahren bei einem Konzern. Das versprechen wir dir.

Qualifikation

Was du mitbringen solltest

Pflicht

Master oder Promotion in Informatik, Mathematik, Physik, Statistik oder einem verwandten quantitativen Fach.
Mehrjährige Erfahrung in der Entwicklung produktionsreifer Software, kein reiner Forscher, aber auch kein reiner MLE.
Tiefes Verständnis von Wahrscheinlichkeitsrechnung, Statistik und Kalibrierung. Mathematische Beweisführung schreckt dich nicht ab.
Tiefe Erfahrung in einem technisch anspruchsvollen Feld, in dem Mathematik, Skalierung und Reliability gleichzeitig zählen.
Sicherer Umgang mit modernen LLMs und Agent-Frameworks.
Hohes Tempo und Teamorientierung. Du willst mit anderen ambitionierten Menschen in einem schlanken Team an einem großen Ziel arbeiten, nicht im Konzern-Rhythmus.

Apply now

Opens the company's application page