
AI Research Engineer
Nulegal GmbHWorum es geht
Wir bauen die Infrastruktur, die KI in der Rechtsbranche tatsächlich belastbar macht, nicht als Demo, sondern in Produktion, mit messbarer juristischer Qualität. Dafür suchen wir Menschen, die tief in die Mathematik und Architektur moderner LLM-Systeme eintauchen wollen, nicht nur APIs verketten.
Wenn du dich in den letzten zwölf Monaten gefragt hast, ob es irgendwo einen Job gibt, in dem du die ganze Tiefe moderner KI gleichzeitig brauchst: hier ist er.
Aufgaben
Dein Beitrag
- Eine Multi-Provider-LLM-Council-Architektur, in der mehrere Modelle parallel arbeiten und über strittige juristische Fragen abstimmen, mit deterministischem Replay für reproduzierbare Evaluations.
- Ein Eval-Framework von Grund auf: stratifizierte Gold-Standard-Datensätze, Inter-Rater-Reliability gegen menschliche Anwälte, Backtesting-Pipelines, Confidence-Kalibrierung.
- Eine mathematisch belastbare Antwort auf die zentrale Forschungsfrage: Wie quantifiziert man "juristische Belastbarkeit"?
- Eigene Forschungsbeiträge, Konferenzpaper und Open-Source-Releases sind explizites Projektziel.
- Eine produktionsreife Orchestrierungs-Infrastruktur, die täglich zehntausende Inferenz-Calls über mehrere Modellfamilien koordiniert, mit voller Observability und Fehlertoleranz.
Warum das spannend ist
- Forschungstiefe wie in einer akademischen Gruppe, mit Produktions-Hebel wie in einem Top-Startup. Die meisten AI-Rollen sind API-Wrapper. Hier baust du die Schicht darunter.
- Recht ist eine der größten noch unautomatisierten Branchen. Wer KI in einer traditionellen, hochregulierten Branche zum Laufen bringt, hat ein deutlich schwierigeres Problem als Web-Demos, und einen entsprechend größeren Hebel.
- Klare Deadlines, klare Deliverables. Ein 24-Monats-Plan mit hartem Meilenstein nach 12 Monaten und konkreten Forschungsoutputs.
- Du wirst in 24 Monaten mehr über produktionsreife LLM-Systeme gelernt haben als in fünf Jahren bei einem Konzern. Das versprechen wir dir.
Qualifikation
Was du mitbringen solltest
Pflicht
- Master oder Promotion in Informatik, Mathematik, Physik, Statistik oder einem verwandten quantitativen Fach.
- Mehrjährige Erfahrung in der Entwicklung produktionsreifer Software, kein reiner Forscher, aber auch kein reiner MLE.
- Tiefes Verständnis von Wahrscheinlichkeitsrechnung, Statistik und Kalibrierung. Mathematische Beweisführung schreckt dich nicht ab.
- Tiefe Erfahrung in einem technisch anspruchsvollen Feld, in dem Mathematik, Skalierung und Reliability gleichzeitig zählen.
- Sicherer Umgang mit modernen LLMs und Agent-Frameworks.
- Hohes Tempo und Teamorientierung. Du willst mit anderen ambitionierten Menschen in einem schlanken Team an einem großen Ziel arbeiten, nicht im Konzern-Rhythmus.
Similar roles
Design & Tech
Related reads from TCHNX

Algorithmic Bias in Design Systems: Why Your AI-Generated UI Might Exclude Users
As AI tools increasingly generate interface components, they're embedding biases that systematically exclude users. Understanding how machine learning models inherit prejudice is essential for creating truly inclusive design systems.

The Synthetic Design Problem: Can AI-Generated Assets Ever Replace Human Creativity?
As AI design tools flood creative workflows, a fundamental question emerges: are we automating creativity or merely industrialising pastiche? The answer reshapes how we understand design innovation itself.

