S3 Annotations: editierbare Metadaten am Objekt, kein Neu‑Upload.
In Kürze
- 1.000 Annotations, 1 GB
- Indexierbar für Athena/Iceberg
- Weltweit, Abrechnung über S3
Mehr Kontext pro Datei: AWS bringt S3 Annotations für große, strukturierte Metadaten
AWS hat für seinen Objektspeicher S3 eine neue Funktion vorgestellt: S3 Annotations. Damit kannst du umfangreiche, strukturierte Kontextinformationen direkt an einzelne S3‑Objekte anhängen — und zwar ohne die eigentlichen Dateien neu hochladen zu müssen.
Was S3 Annotations bieten
Bislang waren Metadaten in S3 auf wenige Tags oder kleine Header‑Felder beschränkt. Wer umfangreichere Informationen wie Transkripte, Modellmetadaten oder Audit‑Trails verwalten wollte, musste separate Metadatendatenbanken oder Sidecar‑Dateien pflegen und komplexe Synchronisationsprozesse bauen. S3 Annotations ändert das grundlegend: Pro Objekt lassen sich bis zu 1.000 einzelne Annotations anlegen, jede bis zu 1 MByte groß, insgesamt also bis zu 1 GByte pro Objekt. Unterstützte Formate sind etwa:
- JSON
- XML
- YAML
- einfacher Text
Die Annotations kannst du jederzeit ändern oder löschen, ohne das zugrunde liegende Objekt erneut hochladen zu müssen. Beim Kopieren, Replizieren oder Verschieben in eine andere Region bleiben die Annotations erhalten — sie sind also Teil des Objektspeichers, nicht nur externe Begleitdaten.
Suche, Analyse und Iceberg‑Indexierung
Optional kannst du für einen Bucket die S3 Metadata Annotation Tables aktivieren. Dann werden die Annotations automatisch in eine verwaltete Apache‑Iceberg-Tabelle indexiert. Das erlaubt es, Metadaten mit Analysewerkzeugen wie Amazon Athena zu durchsuchen, ohne dass du manuell Schemata anpassen musst: Das System passt sich dynamisch an unterschiedliche Strukturen an. Auch Objekte, die in Archiv‑Speicherklassen wie S3 Glacier liegen, bleiben durchsuchbar — ohne vorheriges Wiederherstellen oder zusätzliche Retrieval‑Gebühren.
Integration mit KI und natürlichen Sprachabfragen
Über den S3 Tables MCP Server können KI‑Modelle per natürlicher Sprache auf diese Metadaten zugreifen. Das macht es möglich, etwa Analyseergebnisse oder Notizen direkt an einem Forschungsdokument via KI‑Agenten abzufragen, ohne separate Metadatenbanken heranzuziehen.
Typische Einsatzfelder
- In der Medienbranche lassen sich Transkripte, Untertitel oder technische Spezifikationen direkt am Videofile ablegen.
- Finanzdienste können Investitionsanalysen und Notizen an Forschungsunterlagen koppeln.
- In Life‑Sciences‑ oder Compliance‑Szenarien bieten sich regulatorische Statusinformationen oder Audit‑Trails direkt am Datensatz an.
- Generell bringt die Funktion Vorteile überall dort, wo datenreiche Workflows enge Verknüpfung zwischen Inhalte und Metadaten brauchen.
Verfügbarkeit und Abrechnung
S3 Annotations ist ab sofort in allen AWS‑Regionen verfügbar. Abgerechnet wird zu den üblichen S3‑Preisen, unabhängig davon, in welcher Storage‑Klasse das zugrundeliegende Objekt liegt. Eine Schritt‑für‑Schritt‑Praxisanleitung hat AWS im Blog veröffentlicht.
Quellen
- Quelle: Amazon Web Services
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




