AWS: S3 Annotations – bis zu 1 GB strukturierte Metadaten direkt am Objekt

Mehr Kontext pro Datei: AWS bringt S3 Annotations für große, strukturierte Metadaten

AWS hat für seinen Objektspeicher S3 eine neue Funktion vorgestellt: S3 Annotations. Damit kannst du umfangreiche, strukturierte Kontextinformationen direkt an einzelne S3‑Objekte anhängen — und zwar ohne die eigentlichen Dateien neu hochladen zu müssen.

Was S3 Annotations bieten

Bislang waren Metadaten in S3 auf wenige Tags oder kleine Header‑Felder beschränkt. Wer umfangreichere Informationen wie Transkripte, Modellmetadaten oder Audit‑Trails verwalten wollte, musste separate Metadatendatenbanken oder Sidecar‑Dateien pflegen und komplexe Synchronisationsprozesse bauen. S3 Annotations ändert das grundlegend: Pro Objekt lassen sich bis zu 1.000 einzelne Annotations anlegen, jede bis zu 1 MByte groß, insgesamt also bis zu 1 GByte pro Objekt. Unterstützte Formate sind etwa:

JSON

XML

YAML

einfacher Text

Die Annotations kannst du jederzeit ändern oder löschen, ohne das zugrunde liegende Objekt erneut hochladen zu müssen. Beim Kopieren, Replizieren oder Verschieben in eine andere Region bleiben die Annotations erhalten — sie sind also Teil des Objektspeichers, nicht nur externe Begleitdaten.

Suche, Analyse und Iceberg‑Indexierung

Optional kannst du für einen Bucket die S3 Metadata Annotation Tables aktivieren. Dann werden die Annotations automatisch in eine verwaltete Apache‑Iceberg-Tabelle indexiert. Das erlaubt es, Metadaten mit Analysewerkzeugen wie Amazon Athena zu durchsuchen, ohne dass du manuell Schemata anpassen musst: Das System passt sich dynamisch an unterschiedliche Strukturen an. Auch Objekte, die in Archiv‑Speicherklassen wie S3 Glacier liegen, bleiben durchsuchbar — ohne vorheriges Wiederherstellen oder zusätzliche Retrieval‑Gebühren.

Integration mit KI und natürlichen Sprachabfragen

Über den S3 Tables MCP Server können KI‑Modelle per natürlicher Sprache auf diese Metadaten zugreifen. Das macht es möglich, etwa Analyseergebnisse oder Notizen direkt an einem Forschungsdokument via KI‑Agenten abzufragen, ohne separate Metadatenbanken heranzuziehen.

Typische Einsatzfelder

In der Medienbranche lassen sich Transkripte, Untertitel oder technische Spezifikationen direkt am Videofile ablegen.

Finanzdienste können Investitionsanalysen und Notizen an Forschungsunterlagen koppeln.

In Life‑Sciences‑ oder Compliance‑Szenarien bieten sich regulatorische Statusinformationen oder Audit‑Trails direkt am Datensatz an.

Generell bringt die Funktion Vorteile überall dort, wo datenreiche Workflows enge Verknüpfung zwischen Inhalte und Metadaten brauchen.

Verfügbarkeit und Abrechnung

S3 Annotations ist ab sofort in allen AWS‑Regionen verfügbar. Abgerechnet wird zu den üblichen S3‑Preisen, unabhängig davon, in welcher Storage‑Klasse das zugrundeliegende Objekt liegt. Eine Schritt‑für‑Schritt‑Praxisanleitung hat AWS im Blog veröffentlicht.

Quellen

Quelle: Amazon Web Services

Der ursprüngliche Artikel wurde hier veröffentlicht

Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

Münchner Gericht: Google haftbar für KI‑Kurzantworten

Juni 20, 2026 | Allgemein, KI

Münchner Gericht stuft KI‑generierte Kurzantworten in der Google‑Suche als eigenständige Inhalte ein und macht Google dafür direkt haftbar.In KürzeGericht: KI‑Übersichten sind redaktionelle InhalteAuslöser: Zwei Verlage fälschlich mit Betrug in Verbindung...

Norwegen schränkt generative KI in Schulen massiv ein

Juni 20, 2026 | Allgemein, KI

Norwegen schränkt generative KI im Unterricht stark ein.In Kürze1–7: generative KI verbotenSek I: nur mit LehraufsichtGesetz & mehr Bücher geplant Norwegen macht in den Klassenräumen einen klaren Schnitt: Generative KI‑Tools sind in der Grundschule künftig weitgehend...

Google Cloud bringt „souveräne“ Cloud nach Deutschland – Thales betreibt, Start bis 2026

Juni 20, 2026 | Allgemein, KI

Google Cloud plant eine „souveräne“ Cloud in Deutschland: Betrieb durch Thales, Preview läuft, Verfügbarkeit Ende 2026.In KürzeThales verwahrt kryptografische Schlüssel und betreibt die Plattform.Drei Stufen: Data Boundary, Dedicated (Deutschland),...

AWS: S3 Annotations – bis zu 1 GB strukturierte Metadaten direkt am Objekt

In Kürze

Mehr Kontext pro Datei: AWS bringt S3 Annotations für große, strukturierte Metadaten

Was S3 Annotations bieten

Suche, Analyse und Iceberg‑Indexierung

Integration mit KI und natürlichen Sprachabfragen

Typische Einsatzfelder

Verfügbarkeit und Abrechnung

💡Über das Projekt KI News Daily

Das könnte dich auch interessieren…

Münchner Gericht: Google haftbar für KI‑Kurzantworten

Norwegen schränkt generative KI in Schulen massiv ein

Google Cloud bringt „souveräne“ Cloud nach Deutschland – Thales betreibt, Start bis 2026

Über uns

Dein Thema?

Pickert GmbH