Alibaba hat sein Text-zu-Bild-Modell Qwen-Image-2512 aktualisiert und bietet realistischere Bilder mit lebendigeren Details.
In Kürze
- Verbesserte Darstellung von Gesichtern und natürlichen Elementen
- Qwen-Image-2512 belegt vierten Platz in Blindtests
- Starker Wettbewerb mit anderen Open-Source-Modellen
Alibaba aktualisiert Text-zu-Bild-Modell Qwen-Image-2512
Alibaba hat sein Text-zu-Bild-Modell Qwen-Image-2512 aktualisiert und dabei einige spannende Neuerungen präsentiert. Das Ziel? Realistischere Bilder von Menschen zu erzeugen, die weniger künstlich wirken. Ein großes Augenmerk liegt auf den Details in den Gesichtern, die nun lebendiger und authentischer erscheinen. Auch der unliebsame „Plastik“-Look, der das Vorgängermodell geprägt hat, gehört der Vergangenheit an.
Verbesserungen und neue Features
Doch das ist noch nicht alles: Das Qwen-Image-2512 bringt auch Verbesserungen in der Darstellung von Text, Landschaften, Tierfell und anderen natürlichen Elementen mit sich. Das Ergebnis sind Bilder, die nicht nur ansprechender, sondern auch glaubwürdiger wirken.
Leistung und Konkurrenz
In über 10.000 Blindtests hat das Modell den vierten Platz belegt und gilt damit als das stärkste Open-Source-Modell seiner Art. Es tritt in Konkurrenz zu anderen offenen Bildmodellen wie HunyuanImage-3.0, Z-image und Flux.2. Ein spannendes Rennen, das die Möglichkeiten der KI-gestützten Bildgenerierung weiter vorantreibt.
Ausprobieren und weitere Informationen
Wer neugierig geworden ist, kann das Modell auf den Plattformen Hugging Face und ModelScope ausprobieren. Auch über Qwen Chat lässt sich das neue Modell testen. Für tiefere Einblicke gibt es einen technischen Bericht sowie einen begleitenden Blog, die weitere Informationen bereitstellen.
Quellen
- Quelle: Alibaba
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




