Ein neues Verfahren namens DeepSeek-OCR könnte die Effizienz von Chatbots revolutionieren.
In Kürze
- Optische Kontextkompression reduziert Rechenleistung um 90 %.
- Unterstützt fast 100 Sprachen und verarbeitet PDFs effizient.
- Öffentlicher Code auf GitHub verfügbar für Experimente.
Chinesische Forscher entwickeln DeepSeek-OCR
Chinesische Forscher haben ein spannendes neues Verfahren namens DeepSeek-OCR entwickelt, das die Art und Weise, wie Chatbots lange Gespräche führen, erheblich verbessern könnte. Die Technik, die dabei zum Einsatz kommt, nennt sich „optische Kontextkompression“. Hierbei wird der gesamte Gesprächsverlauf als Bild gespeichert, was die benötigte Rechenleistung auf ein Zehntel der bisherigen Werte reduziert. Das bedeutet, dass Chatbots nicht nur schneller antworten können, sondern auch weniger Kosten verursachen.
Vorteile der Technologie
Ein weiterer Vorteil dieser Technologie ist ihre Fähigkeit, lange PDF-Dokumente effizient zu verarbeiten. DeepSeek-OCR kann nicht nur Text, sondern auch Diagramme und chemische Formeln in maschinenlesbare Formate umwandeln. Dabei unterstützt das System fast 100 Sprachen, was es zu einem vielseitigen Werkzeug für internationale Anwendungen macht.
Inspiration und Funktionsweise
Die Forscher haben sich bei der Entwicklung von DeepSeek-OCR am menschlichen Gedächtnis orientiert. So werden wichtige und kürzlich geführte Gespräche in höherer Auflösung gespeichert, während ältere Kontexte nach und nach verblassen. Diese Herangehensweise sorgt dafür, dass Chatbots immer den relevantesten Kontext zur Hand haben, um präzise und schnelle Antworten zu liefern.
Testergebnisse und Verfügbarkeit
In ersten Tests hat das System bereits eine beeindruckende Genauigkeit von 97 % erreicht und kann mit einem einzigen Nvidia A100 Grafikprozessor über 200.000 Seiten pro Tag verarbeiten. Für alle Technikbegeisterten gibt es zudem eine gute Nachricht: Der Code des Projekts ist öffentlich auf GitHub verfügbar, sodass jeder, der interessiert ist, die Möglichkeit hat, DeepSeek-OCR auszuprobieren und zu experimentieren.
Quellen
- Quelle: DeepSeek
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.