KI-Modelle ordnen Zutaten chemisch oder rezeptbasiert – und liefern unterschiedliche Pairings.
In Kürze
- 3 Modelle: Cooc (Rezepte), Chem (Chemie), Core (Hybrid)
- Trainiert auf 4,14 Mio. Rezepten in 7 Sprachen
- Chem-Modell zeigt sensorische und Nährwert‑Muster
Zwei Arten von Paarungen: Wie eine KI entscheidet, was zu deiner Zutat passt
Stell dir vor, du fragst eine KI: „Was passt zu Basilikum?“ Je nachdem, wie das Modell trainiert wurde, kommen ganz unterschiedliche Antworten — Pasta‑Begleiter wie Parmesan und Olivenöl oder eher Kräuterverwandte wie Oregano und Rosmarin. Das Londoner Startup Kaikaku.AI trennt diese beiden Perspektiven bewusst und hat mit Epicure drei fast identische KI‑Modelle gebaut, die jeweils eine andere Sicht auf Zutaten lernen.
Drei Modelle, drei Datenquellen
- Cooc: Lernt aus Co‑Vorkommen in Rezepten — also Zutaten, die oft zusammen gekocht werden.
- Chem: Lernt aus gemeinsamen Aromamolekülen (Datenbasis: FlavorDB) — Zutaten werden über ähnliche chemische Profile verbunden.
- Core: Kombiniert beide Ansätze.
Interessant ist: Obwohl die Modelle nie Küchenlabels bekommen, gruppieren sie Zutaten automatisch in erkennbare Länderküchen. Die Ausgaben unterscheiden sich je nach Modell. Beispiel: Bei „Hühnchen“ listet Cooc typische Rezeptpartner wie Knoblauch, Zwiebel und Pfeffer; Chem schlägt eher fleischverwandte Zutaten wie Rind oder Schwein vor. Bei „Basilikum“ liefert Cooc Zutaten aus Pasta‑Kontext (Petersilie, Olivenöl, Parmesan), Chem eher krautartige Verwandte.
Unerwartete Einsichten aus Chemie‑Daten
Das chemiebasierte Modell ordnet Zutaten überraschend gut nach sensorischen Eigenschaften wie „süß“, „sauer“ oder „bitter“ — und sogar nach Nährwertindikatoren wie Proteingehalt. Diese Eigenschaften waren nicht explizit im Training kodiert; es scheint, dass die chemische Verwandtschaft als nützlicher Proxy wirkt.
Datenbasis, Mehrsprachigkeit und Bereinigung
Epicure wurde mit 4,14 Millionen Rezepten aus 11 Quellen in sieben Sprachen trainiert, darunter Chinesisch, Russisch, Vietnamesisch, Türkisch, Indonesisch und Deutsch. Aus etwa 200.000 Rohbegriffen — Schreibvarianten, Markennamen, Zubereitungsnotizen — entstand mithilfe einer Pipeline mit Claude‑ und Gemini‑Embeddings ein bereinigter Satz von 1.790 Zutaten. (Embeddings sind Zahlenvektoren, die Bedeutungen so darstellen, dass das Modell Ähnlichkeiten messen kann.)
Einschränkungen und Verzerrungen
Der Korpus ist unausgewogen: Rund die Hälfte der Daten stammt aus ostasiatischen Quellen, andere Regionen sind deutlich schwächer vertreten. Nur etwa ein Drittel der Zutaten hat direkte Einträge in der Chemie‑Datenbank; der Rest erhält chemische Signale indirekt über Verwandtschaften. Zudem hängt die Vokabularbereinigung von anderen Sprachmodellen ab, die selbst kulturelle Verzerrungen tragen. Das macht Antworten für weniger vertretene Küchen weniger verlässlich.
Bedienkonzept und Beispiele
Das fertige Modell bietet zwei Modi:
- Nachbarsuche: Welche Zutaten liegen einer gegebenen Zutat am nächsten.
- „Drehknopf“: Du verschiebst eine Ausgangszutat in Richtung einer Zielrichtung (Winkelsteuerung). Bei 0° bleibt alles, bei 60° dominiert die Ziel‑Nachbarschaft.
Beispiele aus der Arbeit: Schiebst du „Reis“ leicht Richtung Südasien, erscheinen Curryblatt, Urad Dal und Chana Dal. Bei „Hähnchen“ in Richtung westatlantischer verarbeiteter Küche kommen Cream of Chicken Soup, Crescent Roll und Ranch Dressing. Bei „Schokolade“ liefern Cooc/Core westliche Backzutaten, Chem hingegen ostasiatische Dessertzutaten wie rote Bohnenpaste, Matcha oder violette Süßkartoffel — die Modellwahl beeinflusst also auch die kulturelle Einordnung.
Validierung, Verfügbarkeit und Demo
Die in der Arbeit gezeigten Treffer sind handverlesen; Modelle und Datensatz sind auf Hugging Face verfügbar, sodass unabhängige Prüfungen möglich sind. Eine frühe Demoversion ist online zugänglich.
Wer steht dahinter
Kaikaku.AI wurde 2023 in London gegründet. Das Unternehmen betreibt ein robotergestütztes Restaurant namens Common Room und entwickelt ML‑gestützte Systeme für Portionierung, Bestandsverwaltung und Teilefertigung. Die Maschine „Fusion“ soll theoretisch bis zu 360 Schüsseln pro Stunde ausgeben. Die Pre‑Seed‑Finanzierung betrug rund 1,8 Millionen US‑Dollar (2024). Mitautor Josef Chen nennt Epicure „das größte mehrsprachige Food‑Modell, das je gebaut wurde“ und vergleicht die Kompression der Kochwelt mit „zwei Megabyte“.
Quellen
- Quelle: Kaikaku.AI
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




