Gemma 4: Google bringt offene KI komplett aufs Smartphone

12.04.2026 | Allgemein, KI

Gemma 4: Offene KI läuft lokal auf Smartphones.

In Kürze

  • AI Edge Gallery für Android/iOS
  • E2B/E4B: 1,3–2,5 GB, 6–8 GB RAM
  • 26B/31B-Modelle, bis 256k Token Kontext

Google bringt KI komplett aufs Handy — und macht sie offen: Gemma 4 ist da.

Das neue Open‑Source‑Modell verarbeitet Text, Bilder und Audio vollständig lokal auf dem Smartphone und kann über sogenannte „Agent Skills“ eigenständig Werkzeuge wie Wikipedia, interaktive Karten oder einen QR‑Code‑Generator ansprechen.

Die App heißt „Google AI Edge Gallery“, ist kostenlos für Android und iOS erhältlich und schoss direkt nach dem Release auf Platz 4 der meistgeladenen kostenlosen Produktivitäts‑Apps im iOS App Store. Alle Gemma‑Modelle stehen unter der Apache‑2.0‑Lizenz, dürfen kommerziell genutzt werden, und Entwickler können eigene Skills über GitHub bauen und teilen.

Vier Varianten, zwei fürs Handy

Für Mobilgeräte hat Google zwei kleinere Varianten vorgesehen: E2B und E4B.

  • E2B belegt in komprimierter Form rund 1,3 GB und läuft auf Geräten mit mindestens 6 GB RAM.
  • E4B braucht etwa 2,5 GB Speicher und mindestens 8 GB RAM.

Das „E“ steht für „effective parameters“ — also die Anzahl der Parameter, die bei Berechnungen tatsächlich aktiv sind.

Größere Modelle für Server

Für Server und leistungsstarke Rechner gibt es die größeren Varianten 26B und 31B.

  • 26B‑Version nutzt eine Mixture‑of‑Experts‑Architektur mit 128 „Experten“; effektiv sind dabei nur etwa 3,8 Milliarden Parameter aktiv, was Rechenaufwand spart.
  • 31B das dichte Modell bietet ein sehr großes Kontextfenster von bis zu 256.000 Token und kann damit sehr viel Text gleichzeitig im Kontext behalten.

Schneller und sparsamer durch Optimierungen

Google hat die Smartphone‑Modelle zusammen mit Arm und Qualcomm für aktuelle Mobilprozessoren optimiert. Auf Android soll Gemma 4 bis zu viermal schneller arbeiten und bis zu 60 % weniger Akku verbrauchen als die Vorgängergeneration. Arm‑Tests zeigen im Schnitt eine 5,5‑fache Beschleunigung auf neueren Arm‑Chips mit dem SME2‑Befehlssatz — eine Chip‑Erweiterung, die Matrixberechnungen für KI direkt beschleunigt.

Was die App kann

Die AI Edge Gallery bietet verschiedene Funktionen:

  • Chat
  • Bilderkennung
  • Audiotranskription
  • Agent‑Skills, etwa Wikipedia‑Suche, interaktive Karten, automatisch erstellte Zusammenfassungen, Lernkarten oder einen QR‑Code‑Generator

Gemma 4 kann Fotos beschreiben, gesprochene Eingaben in Diagramme oder Visualisierungen umwandeln und mit anderen lokalen Modellen zusammenarbeiten — etwa für Text‑to‑Speech oder Bildgenerierung. Für manche eingebauten Werkzeuge ist eine Internetverbindung nötig; das Kernmodell selbst läuft lokal. Google nennt außerdem verbesserte OCR‑Ergebnisse und ein feineres Verständnis von Zeitangaben. Chats werden nicht gespeichert.

Kompatibilität mit Gemini Nano 4

Die Smartphone‑Varianten E2B und E4B sollen die Grundlage für Gemini Nano 4 bilden, Googles nächstes systemweites On‑Device‑Modell für Android. Code, der für Gemma 4 geschrieben wird, soll später automatisch mit Gemini Nano 4 kompatibel sein. Gemini Nano läuft bereits auf über 140 Millionen Android‑Geräten, etwa für Smart Replies und Audio‑Zusammenfassungen.

Kleine Modelle für Systemfunktionen

Google zeigte außerdem FunctionGemma, ein sehr kleines lokales Modell mit rund 270 Millionen Parametern, das natürliche Sprache in strukturierte Funktionsaufrufe übersetzt — etwa die Taschenlampe an‑/ausmachen, Kontakte anlegen oder Kalender‑Einträge erstellen.

Verbreitung und Partnerschaften

Die Gemma‑Familie wurde laut Google seit ihrem Start über 400 Millionen Mal heruntergeladen und unterstützt mehr als 140 Sprachen. Interessant für die Plattformlandschaft: Apples nächste Generation von Foundation Models soll auf Googles Gemini‑Technologie basieren und im Laufe des Jahres ein größeres Siri‑Upgrade antreiben.

Quellen

  • Quelle: Google
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…