Lokale RAG: Deine PDFs durchsuchbar machen und Antworten ziehen

Wie die Technik funktioniert

Im Kern läuft das Setup über Retrieval Augmented Generation (RAG): Zuerst sucht die KI relevante Passagen in deinen Dokumenten, danach formuliert ein Sprachmodell (LLM) daraus eine Antwort. Weil die Suche auf deinen Dateien statt auf einem riesigen externen Wissensspeicher erfolgt, bleiben die Daten lokal und die Wahrscheinlichkeit für frei erfundene Antworten sinkt. Entscheidend sind dabei Embeddings — Vektoren, die Text in Zahlen übersetzen, damit die KI schnell ähnliche oder relevante Textstellen findet. PDFs werden vorher in ein einfaches Textformat (Markdown) umgewandelt, damit die Verarbeitung sauber läuft.

Für Rechenaufwand empfiehlt sich eine GPU, die KI-Berechnungen deutlich beschleunigt.

Was konkret gezeigt wird

Der Artikel liefert eine Schritt-für-Schritt-Anleitung, wie du RAG lokal unter Windows aufsetzt — kostenlos mit Open WebUI. Ein Extraktions-Tool wandelt PDFs in Markdown um, danach erstellt ein Embedding-Modell Vektoren aus dem Text und speichert sie in einer Datenbank. Anschließend beantwortet das LLM Fragen, indem es zuerst relevante Textstellen abruft und dann die Antwort formuliert.

PDFs in Markdown umwandeln (Extraktions-Tool)

Embedding-Modell erzeugt Vektoren aus dem Text

Vektoren in einer Datenbank speichern (Retrieval)

LLM ruft relevante Textstellen ab und formuliert die Antwort

Im Praxistest wurden drei Bedienungsanleitungen als PDFs hochgeladen. Zu jedem Dokument stellte das System je eine Frage — und das Modell lieferte jeweils passende Antworten, die sich auf die gefundenen Textstellen stützten. Außerdem enthält der Bericht praktische Konfigurationstipps, mit denen sich die Trefferquote der Suche verbessern lässt, sowie Hinweise, wie du deutsche Texte besser verarbeitest und welche typischen Anfangsfehler häufig auftreten.

Technische Voraussetzungen

Getestet wurde das Setup auf Windows 11 mit Docker, Open WebUI Version 0.7.2 und Ollama als Lokalsystem. Empfohlen wird eine Grafikkarte mit mindestens 16 GByte RAM — idealerweise von Nvidia, da viele Modelle dort besonders performant laufen. Auch eine kräftige CPU hilft, insbesondere beim Vorverarbeiten großer Dokumentenmengen.

Getestete Umgebung: Windows 11 mit Docker, Open WebUI 0.7.2, Ollama

Empfohlene GPU: mindestens 16 GByte RAM (ideal: Nvidia)

Starke CPU empfohlen für Vorverarbeitung großer Dokumentenmengen

Als Testmaschine: privater PC mit AMD Ryzen 7 9800X3D und einer Nvidia 3090 mit 24 GByte Speicher

Kurz und praktisch

PDF → Markdown

Markdown → Embeddings/Vektoren

Retrieval (relevante Textstellen abrufen)

LLM-Antwort (Antwort aus den abgerufenen Stellen formulieren)

Wer die beschriebenen Komponenten installiert und die empfohlenen Einstellungen nutzt, kann seine eigenen Dokumente lokal durchsuchbar machen und Antworten direkt aus den eigenen Dateien erhalten.

Quellen

Quelle: Open WebUI / Ollama

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Microsoft startet ‚Publisher Content Marketplace‘ für Verlagslizenzen

Feb. 4, 2026 | Allgemein, KI

Microsoft startet einen Marktplatz, auf dem Verlage Lizenzregeln für KI hinterlegen.In KürzeVerlage hinterlegen LizenzregelnKI-Firmen sollen Lizenzen suchen und abschließenTechnik, Abrechnung und Zeitplan unklar Microsoft startet einen Marktplatz für...

Lotus Health AI startet kostenlosen 24/7‑Hausarzt mit Ärzt:innen‑Check

Feb. 4, 2026 | Allgemein, KI

Lotus bietet einen kostenlosen 24/7‑Hausarzt in 50 Sprachen: KI schlägt Befunde vor, Ärzt:innen prüfen.In KürzeRund‑um‑die‑Uhr, gratis, mehrsprachigKI erstellt Diagnosen, Ärzte validieren35 Mio. Series‑A, Fokus auf Wachstum KJ Dhaliwal, der 2019 die Dating‑App Dil Mil...

Google leitet Fi‑Anrufe über KI‑Server – standardmäßig aktiv, Opt-out möglich

Feb. 4, 2026 | Allgemein, KI

Google leitet Fi-Anrufe seit 22.12.2025 über KI-Server — standardmäßig an.In KürzeAktiv für iPhone & Android R+Opt-out in Fi-AppZugriff/Speicherung offen Google leitet Anrufe von Fi Wireless jetzt über eigene KI-Server — Standardmäßig an, Opt-out möglich Google hat...

Lokale RAG: Deine PDFs durchsuchbar machen und Antworten ziehen

In Kürze

Wie die Technik funktioniert

Was konkret gezeigt wird

Technische Voraussetzungen

Kurz und praktisch

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Microsoft startet ‚Publisher Content Marketplace‘ für Verlagslizenzen

Lotus Health AI startet kostenlosen 24/7‑Hausarzt mit Ärzt:innen‑Check

Google leitet Fi‑Anrufe über KI‑Server – standardmäßig aktiv, Opt-out möglich

Über uns

Dein Thema?

Pickert GmbH