Atlantic veröffentlicht Datenbank mit Millionen Songs – Rechte oft unklar

21.06.2026 | Allgemein, KI

Eine durchsuchbare Liste zeigt Songs, die offenbar für KI‑Training genutzt wurden – häufig ohne Rücksicht auf Lizenzen.

In Kürze

  • Vier Datensätze identifiziert, zwei mit rund 12 Mio. und 9 Mio. Titeln
  • Automatisierte Downloads umgehen Plattform‑Mechanismen und Einnahmen
  • Lizenzbedingungen werden meist nicht berücksichtigt; Urheber oft unklar

The Atlantic hat eine durchsuchbare Datenbank veröffentlicht, die Musikstücke auflistet, die offenbar zum Training von KI-Modellen verwendet wurden.

Reporter Alex Reisner stieß auf vier solche Datensätze:

  • zwei riesige mit etwa 12 Millionen bzw. 9 Millionen Titeln
  • zwei weitere mit jeweils mehr als 100.000 Songs

Viele der aufgeführten Tracks sind frei im Netz zugänglich – oft allerdings ohne dass die Rechteinhaber das so vorgesehen hätten.

Die Sammlungen selbst bestehen häufig nur aus Listen mit Links zu YouTube‑ oder Spotify‑Seiten. Die eigentlichen Audiodateien werden von Entwickler:innen meist mit automatisierten Tools heruntergeladen. Solche Tools umgehen teilweise Logins, Werbung und andere Einnahme‑Mechanismen, die normalerweise Geld an Künstlerinnen und Künstler bringen. Damit verstoßen sie gegen die Nutzungsbedingungen der Plattformen.

Die Datensätze wurden bereits tausende Male heruntergeladen. Wer genau damit trainiert hat, lässt sich nicht eindeutig feststellen. In Forschungsarbeiten bestätigen jedoch Firmen wie Google und Stability, dass sie auf ähnliche frei zugängliche Quellen zurückgegriffen haben. Das heißt: Direkte Belege für einzelne Downloads fehlen zwar, doch große KI‑Forschungsprojekte greifen nachweislich auf Netz‑Material zurück.

Bei einigen Ursprüngen der Sammlungen besteht ein rechtlicher Unterschied: Das Free Music Archive etwa erlaubt kostenloses Streaming für privaten Gebrauch, verlangt aber Lizenzen für kommerzielle Nutzung. Solche Lizenzbedingungen werden in den Datensätzen nicht automatisch berücksichtigt – die Listen sagen nichts darüber aus, ob eine kommerzielle Verarbeitung erlaubt wäre.

Unter den aufgeführten Namen finden sich bekannte Künstlerinnen und Künstler wie:

  • Lady Gaga
  • Fred Again..
  • Radiohead
  • Aphex Twin
  • Wu‑Tang Clan
  • Bruce Springsteen
  • Hainbach

Die Bandbreite zeigt, dass sowohl Mainstream‑Hits als auch Nischenwerke in den Sammlungen auftauchen.

Auf der AI Watchdog‑Seite des Atlantic kannst du die zusammengestellten Songs, Bücher und weitere Medien durchsuchen, die laut der Recherche beim Training weltweiter KI‑Modelle verwendet wurden. Alex Reisners Fundstücke geben einen seltenen Einblick in das Material, das hinter vielen KI‑Stimmen und -Kreationen stehen könnte.

Quellen

  • Quelle: The Atlantic
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…