Windows AI erweitert: Lokale Spracherkennung und breitere Hardware‑Unterstützung

05.06.2026 | Allgemein, KI

Microsoft erweitert die Windows AI APIs: lokale Spracherkennung, mehr CPU/GPU‑Support und weniger Cloud‑Abhängigkeit.

In Kürze

  • Neue Speech Recognition API transkribiert lokal in Echtzeit und als Batch
  • Erweiterte Hardware‑Unterstützung: CPUs und GPUs ergänzen NPUs
  • Modelle werden nur bei Bedarf geladen; erstes Preview nur auf Englisch

Microsoft hat auf der Entwicklerkonferenz Build 2026 die Windows AI APIs deutlich erweitert — mit einer neuen lokalen Spracherkennungs‑Schnittstelle und breiterer Hardware‑Unterstützung.

Das Ziel: KI-Funktionen direkt auf Windows‑Geräten verfügbar machen und die Abhängigkeit von Cloud‑Diensten verringern.

Was die Windows AI APIs sind, kurz erklärt:

Das sind vorgefertigte KI‑Funktionen, die lokal auf dem Gerät laufen. Entwickler:innen müssen kein eigenes Modell besorgen, betreiben oder feinjustieren. Als Grundlage dienen Windows ML und von Microsoft bereitgestellte Modelle. Bisherige Funktionen umfassen:

  • Texterkennung (OCR)
  • Bildbeschreibungen
  • Bild‑Hochskalierung (Super Resolution)
  • Objekterkennung
  • das Entfernen von Bildinhalten

Neu ist die Speech Recognition API:

Sie wandelt Sprache lokal in Text um, sowohl in Echtzeit als auch als Batch‑Transkription. Eingaben können über Mikrofon, als Audio‑Stream oder aus Audiodateien erfolgen — und das ganz ohne Internetverbindung.

Typische Anwendungsfälle sind:

  • Diktate
  • automatische Untertitel
  • Transkriptionswerkzeuge
  • Barrierefreiheitsfunktionen

Öffentlich in der Vorschau ist die API vorerst nur für Englisch; Microsoft kündigt an, nach und nach weitere Sprachen und Länder zu ergänzen.

Wichtig ist auch die erweiterte Hardware‑Unterstützung.

Viele KI‑Funktionen liefen bisher vor allem auf Copilot+-PCs mit NPUs (Neural Processing Units). Künftig sollen die APIs stärker CPUs und GPUs unterstützen. Konkret:

  • Die neue Speech‑API läuft auf NPUs und CPUs
  • Das für Text genutzte Windows‑Sprachmodell kann zusätzlich geeignete GPUs nutzen
  • Video Super Resolution wird künftig auch auf CPUs funktionieren

Das öffnet die Optionen für klassische Desktop‑PCs und Workstations mit leistungsfähigen Grafikkarten.

Modell‑Ladeverhalten

Microsoft betont außerdem, dass Modelle nicht automatisch auf jedes Gerät geladen werden. Windows lädt ein Modell erst, wenn eine Anwendung es tatsächlich anfordert — ein Mechanismus, der Speicherplatz und Download‑Volumen schonen soll.

Für Entwickler:innen heißt das:

Mehr lokale KI‑Funktionen sind auf mehr Windows‑11‑Geräten einsetzbar, ohne auf spezielle KI‑Hardware oder permanente Cloud‑Verbindung angewiesen zu sein. Microsoft will die Sprachunterstützung und Gerätekompatibilität schrittweise ausbauen; konkrete Zeitpläne nannte das Unternehmen auf der Build‑Bühne nicht detailliert.

Wenn du also künftig Untertitel, Diktate oder Transkripte direkt auf deinem Rechner laufen lassen willst, ohne Audio in die Cloud zu schicken, bietet die neue API dafür die technische Grundlage — zunächst auf Englisch und mit wachsender Hardware‑Abdeckung.

Quellen

  • Quelle: Microsoft
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…

Studie: KI ermöglicht selbstanpassende Computerwürmer

Studie: KI ermöglicht selbstanpassende Computerwürmer

Proof-of-Concept zeigt: Lokale LLMs auf gehackten Geräten planen und verbreiten adaptive Malware.In KürzeLLMs erzeugen Exploits lokal und umgehen Cloud-LimitsLabortests: Rechteerweiterung und Ausbreitung auf bis zu 20 % der GeräteKI generierte Angriffe trafen auch...