Apple präsentiert FastVLM: KI-Modell revolutioniert Bildverarbeitung

14.05.2025 | Allgemein, KI

Apple hat mit FastVLM ein KI-Modell vorgestellt, das Bild-zu-Text-Informationen schneller und datenschutzfreundlicher verarbeitet.

In Kürze

  • FastVLM arbeitet bis zu 85 Mal schneller als Vorgängermodelle.
  • Lokale Verarbeitung schützt deine Daten auf Geräten wie dem iPhone.
  • Vielfältige Einsatzmöglichkeiten von Texterkennung bis Barrierefreiheit.

Apple stellt FastVLM vor

Apple hat mit FastVLM ein neues KI-Modell vorgestellt, das die Art und Weise, wie wir Bild-zu-Text-Informationen verarbeiten, auf ein ganz neues Level hebt. Mit einer Geschwindigkeit, die bis zu 85 Mal schneller ist als die Vorgängermodelle wie LLaVA-OneVision, setzt FastVLM neue Maßstäbe in der Bildverarbeitung. Das Besondere daran? Es arbeitet lokal auf Geräten wie dem iPhone, was bedeutet, dass deine Daten nicht über das Internet gesendet werden müssen. Ein echter Pluspunkt für den Datenschutz!

Der innovative Encoder FastViTHD

Im Kern dieser Technologie steckt ein innovativer Encoder namens FastViTHD. Dieser ist in der Lage, hochauflösende Bilder effizient zu verarbeiten, ohne sie vorher verkleinern zu müssen. Das Ergebnis? Texte aus Bildern werden schneller und mit deutlich weniger Rechenleistung extrahiert. Die Einsatzmöglichkeiten sind vielfältig:

  • Texterkennung in Dokumenten
  • Unterstützung von Barrierefreiheit
  • Durchsuchen von Fotoarchiven

Spannende Einsatzmöglichkeiten

Drei spannende Beispiele verdeutlichen, wie FastVLM funktioniert:

  1. Das Modell kann die Anzahl der Finger auf einem Bild zählen.
  2. Handschriftliche Notizen in Echtzeit erkennen.
  3. Sogar Emojis beschreiben.

Diese Funktionen könnten bald in Apps wie der Fotos-App oder einer zukünftigen Mail-App zum Einsatz kommen. Ob FastVLM bereits in der nächsten iOS-Version integriert sein wird, könnte auf der kommenden Entwicklerkonferenz im Juni bekanntgegeben werden. Halte also die Augen offen!

Quellen

  • Quelle: Apple
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…

The OpenAI Files: Transparenz in der KI-Entwicklung gefordert

The OpenAI Files: Transparenz in der KI-Entwicklung gefordert

Eine neue Plattform beleuchtet die KI-Entwicklung bei OpenAI und fordert mehr Transparenz.In KürzeÖffentliche Sammlung von Berichten ehemaliger MitarbeitenderFokus auf CEO Sam Altman und seine RolleDebatte über ethische Implikationen und Renditen für Investoren The...

MITs SEAL: KI lernt selbstständig und effizient

MITs SEAL: KI lernt selbstständig und effizient

Ein innovatives System am MIT verändert die Lernweise von KI-Modellen grundlegend.In KürzeSEAL generiert und bewertet eigenes TrainingsmaterialPräzisere Informationen und bessere ProblemlösungsfähigkeitenHerausforderungen wie „Catastrophic Forgetting“ bleiben bestehen...

Google bringt sprachgesteuerten KI-Chatbot in Live-Suche

Google bringt sprachgesteuerten KI-Chatbot in Live-Suche

Google hat seine Live-Suche mit einem neuen KI-Chatbot aufgewertet, der gesprochene Antworten liefert.In KürzeSprachgesteuerter Chatbot liefert Antworten in gesprochener FormTestphase in den USA, Teilnahme über Google LabsGeplante Erweiterung um Bildinformationen für...