Nvidia soll bei Anna’s Archive Zugriff auf 500 TB Datensätze angefragt haben

21.01.2026 | Allgemein, KI

Gerichtsdokumente zeigen erstmals E‑Mail‑Kontakt zwischen Nvidia‑Mitarbeiter und Anna’s Archive wegen beschleunigtem Zugriff auf große Datensätze.

In Kürze

  • E‑Mails belegen direkten Kontakt zwischen Nvidia und Anna’s Archive
  • Gesuch um Schnellzugang zu rund 500 TB, Anna’s Archive nannte illegale Herkunft
  • Unklar bleibt, ob Zahlungen erfolgten; Klägerinnen sehen Urheberrechtsverletzungen

Neue Gerichtsdokumente werfen ein neues Licht auf die Klage gegen Nvidia: E‑Mails zeigen Kontakt zu Anna’s Archive

Hintergrund

Im Januar 2024 hatten drei US‑Autorinnen Nvidia verklagt. Sie werfen dem Grafikchip‑ und KI‑Konzern vor, ihre urheberrechtlich geschützten Bücher ohne Erlaubnis zum Training von KI‑Modellen verwendet zu haben — als Beispiel wird Nvidias Framework NeMo genannt. Die Klägerinnen fordern Schadenersatz; seitdem haben sich weitere Autorinnen der Klage angeschlossen.

Neue Unterlagen

Was jetzt neu aufgetaucht ist: In Unterlagen, die kürzlich beim Bundesbezirksgericht für den nördlichen Bezirk Kalifornien eingereicht wurden und die zuerst der Blog TorrentFreak veröffentlicht hat, finden sich E‑Mail‑Verläufe zwischen einem Mitglied von Nvidias Datenstrategie‑Team und der Schattenbibliothek Anna’s Archive. Es ist das erste Mal, dass direkte E‑Mail‑Korrespondenz zwischen einem großen US‑Tech‑Konzern und Anna’s Archive öffentlich wird.

Details der E‑Mails

Die E‑Mails legen nahe, dass Nvidia gezielt Zugang zu Inhalten aus der Schattenbibliothek angefragt haben soll, um diese in Trainingsdaten für große Sprachmodelle (LLM) einzubinden. Konkret ging es demnach um einen beschleunigten Zugriff auf rund 500 Terabyte an Daten. Anna’s Archive habe offenbar einen Schnellzugang mit einer Gebühr von mehr als 10.000 US‑Dollar verlangt und in der Korrespondenz darauf hingewiesen, dass die Datensätze illegal beschafft wurden.

Interessant: Anna’s Archive bat Nvidia um eine interne Freigabe für den Zugriff; den Unterlagen zufolge soll Nvidia diese Zustimmung innerhalb einer Woche erteilt haben. Ob Nvidia am Ende tatsächlich bezahlt hat, lässt sich aus den Dokumenten nicht ablesen — die Klage spricht hier von Behauptungen und legt die E‑Mail‑Auszüge als Belege vor.

Weitere Vorwürfe

Die Vorwürfe in der Klage reichen weiter. Die Klägerinnen behaupten, Nvidia habe nicht nur Inhalte aus dem Datensatz Books3 genutzt — einem Korpus mit mehr als 196.000 Büchern, das aus der Schattenbibliothek Bibliotik stammt —, sondern auch Material aus anderen Quellen wie LibGen, Sci‑Hub und Z‑Library. Zudem wird Nvidia vorgeworfen, Tools verbreitet zu haben, mit denen Firmenkunden den Datensatz The Pile herunterladen konnten. The Pile ist ein mehr als 886‑Gigabyte großer Open‑Source‑Datensatz, der sowohl gemeinfreie Texte als auch den raubkopierten Books3-Datensatz enthalten soll und von Entwicklerteams häufig zum Training von LLMs verwendet wird.

  • Books3 — einem Korpus mit mehr als 196.000 Büchern, das aus der Schattenbibliothek Bibliotik stammt
  • LibGen
  • Sci‑Hub
  • Z‑Library
  • The Pile — ein mehr als 886‑Gigabyte großer Open‑Source‑Datensatz, der gemeinfreie Texte und den raubkopierten Books3-Datensatz enthalten soll

Kontext

Der Fall reiht sich ein in eine Reihe ähnlicher Rechtsstreitigkeiten gegen Technologie‑ und KI‑Firmen. Die New York Times klagt gegen OpenAI wegen wortwörtlich wiedergegebener Texte und hat zudem eine Klage gegen die KI‑Suchmaschine Perplexity eingereicht. In Deutschland hatte die Verwertungsgesellschaft GEMA in erster Instanz einen Sieg gegen OpenAI errungen.

Aktueller Stand

Aktueller Stand: Die neuen Unterlagen bieten erstmals Einblicke in direkte Verhandlungen zwischen Nvidia-Mitarbeitern und Anna’s Archive, werfen aber keine abschließenden juristischen Fragen auf. Ob und in welchem Umfang Zahlungen geleistet wurden und welche rechtlichen Konsequenzen sich daraus ergeben, wird derzeit in den laufenden Verfahren geklärt.

Quellen

  • Quelle: Nvidia / Anna’s Archive
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…