Google präsentiert LMEval: Einfache Bewertung von KI-Modellen

27.05.2025 | Allgemein, KI

Google hat mit LMEval ein Open-Source-Tool vorgestellt, das den Vergleich von KI-Modellen revolutioniert.

In Kürze

  • Standardisierte Bewertung für Sprach- und multimodale Modelle
  • Erkennung von Punting-Strategien zur objektiven Analyse
  • Visualisierungstool LMEvalboard für detaillierte Ergebnisse

GOOGLES NEUES OPEN-SOURCE-TOOL: LMEVAL

Google hat ein neues Open-Source-Tool namens LMEval veröffentlicht, das den Vergleich großer KI-Modelle verschiedener Anbieter deutlich vereinfacht. Mit LMEval ist eine standardisierte Bewertung von Sprachmodellen sowie multimodalen Modellen möglich, die mit Text, Bildern und Code arbeiten. Das Tool richtet sich an Forschende und Entwickler, die ihre Modelle objektiv testen möchten, ohne sich durch unterschiedliche technische Schnittstellen und Formate kämpfen zu müssen.

FLEXIBILITÄT IN DER BEWERTUNG

Ein Highlight von LMEval ist seine Flexibilität bei der Bewertung. Es erkennt sogenannte „Punting“-Strategien – also Situationen, in denen Modelle bewusst ausweichend antworten, um sensible Aussagen zu vermeiden. Diese Funktion basiert auf dem LiteLLM-Framework, das die Schnittstellen mehrerer Anbieter wie Google, OpenAI und Anthropic abstrahiert. Dadurch wird der Modellvergleich nicht nur einfacher, sondern auch aussagekräftiger.

Visualisierung mit dem LMEvalboard

Für die Ergebnisanalyse hat Google außerdem ein Visualisierungstool namens LMEvalboard entwickelt. Damit lassen sich detaillierte Auswertungen und die Leistung von Modellen in verschiedenen Kategorien übersichtlich darstellen. Quellcode und Beispiele sind auf GitHub verfügbar, sodass Interessierte das Framework selbst ausprobieren können.

Mit LMEval ist der Weg frei für eine objektive und umfassende Bewertung von KI-Modellen – ganz ohne technischen Overhead.

Quellen

  • Quelle: Google
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…

The OpenAI Files: Transparenz in der KI-Entwicklung gefordert

The OpenAI Files: Transparenz in der KI-Entwicklung gefordert

Eine neue Plattform beleuchtet die KI-Entwicklung bei OpenAI und fordert mehr Transparenz.In KürzeÖffentliche Sammlung von Berichten ehemaliger MitarbeitenderFokus auf CEO Sam Altman und seine RolleDebatte über ethische Implikationen und Renditen für Investoren The...

MITs SEAL: KI lernt selbstständig und effizient

MITs SEAL: KI lernt selbstständig und effizient

Ein innovatives System am MIT verändert die Lernweise von KI-Modellen grundlegend.In KürzeSEAL generiert und bewertet eigenes TrainingsmaterialPräzisere Informationen und bessere ProblemlösungsfähigkeitenHerausforderungen wie „Catastrophic Forgetting“ bleiben bestehen...

Google bringt sprachgesteuerten KI-Chatbot in Live-Suche

Google bringt sprachgesteuerten KI-Chatbot in Live-Suche

Google hat seine Live-Suche mit einem neuen KI-Chatbot aufgewertet, der gesprochene Antworten liefert.In KürzeSprachgesteuerter Chatbot liefert Antworten in gesprochener FormTestphase in den USA, Teilnahme über Google LabsGeplante Erweiterung um Bildinformationen für...