Seit rund einem Jahr arbeitet Adobe Systems in Kooperation mit der New York Times und Twitter im Rahmen der Content Authenticity Initiative (CAI) an einem Konzept, das die Provenienz und Authentizität digitaler Bilder besser nachvollziehbar machen soll.
Fake News sind nicht zuletzt in Zeiten von Social Media zum Problem geworden. Um Vertrauen in die Authentizität von Bildern wieder zu ermöglichen, will die Content Authenticity Initiative (CAI) Transparenz über deren Entstehungsgeschichte schaffen.
Das Problem
„Da soziale Plattformen die Reichweite und den Einfluss bestimmter Inhalte durch immer komplexere und undurchsichtigere Algorithmen verstärken, verbreiten sich falsch attributierte und fehlerhaft kontextualisierte Inhalte schnell“, so die CAI Initiative. „Ob versehentliche Fehlinformationen oder absichtliche Täuschung durch Desinformation, nicht authentische Inhalte sind kollektiv auf dem Vormarsch.“
Das Problem: Gegenwärtig können Urheber, die Metadaten über ihre Arbeit (wie etwa ihre Urheberschaft) einfügen möchten, dies nicht auf sichere, nicht manipulierbare und plattformübergreifende Weise tun. Ohne diese Informationen kann die Authentizität von Bildern nicht sicher beurteilt werden, erst recht nicht angesichts der zunehmenden Verbreitung von Künstlicher Intelligenz (KI), mit deren Hilfe realistisch wirkende Bilder vollständig synthetisch erzeugt werden können.
Die Lösung
Durch eine Kombination aus Algorithmus-basierter Identifizierung und menschenzentrierter Überprüfung absichtlich irreführender Inhalte soll CAI die Menge nicht authentischer Fotos reduzieren. Da die Techniken zur Erstellung irreführender Inhalte immer ausgefeilter und zugänglicher werden, sehen die Initiatoren ein eskalierendes Wettrüsten voraus, das den Fortschritt an dieser Front behindern wird. Da Anbieter von gefakten Bildern immer schneller und besser werden, werden die Techniken zu ihrer Identifizierung nur schwer Schritt halten können. Im Mittelpunkt des CAI Konzepts steht daher die Provenienz der Bilder, um Informationen darüber offenzulegen, wer wann was an einer Datei geändert hat.
„Wir bemühen uns, die Frage der Authentizität von Inhalten in großem Maßstab anzugehen. Um dies zu erreichen, schlagen wir einen offenen, erweiterbaren Ansatz für die Zuweisung von Inhalten vor und haben begonnen, in breiter, branchenübergreifender Zusammenarbeit auf die Festlegung von Standards hinzuarbeiten“, so Adobe Systems.
Ziel der CAI ist, einen Industriestandard für die Inhaltszuschreibung zu entwickeln. Durch die Kombination subjektiver Informationen über die Authentizität mit objektiven Fakten darüber, wie ein Inhalt entstanden ist, will die CAI dabei helfen, fundiertere Entscheidungen darüber zu treffen, ob man einem Bild vertrauen kann, oder nicht.
Aktuell werden die meisten Bildinformationen über seit langem etablierte Standards wie EXIF und XMP in die Metadaten eingebettet. Viele Bilder erscheinen jedoch im Web, ohne dass diese Informationen noch vollständig vorhanden sind. Redaktionen und Betrachter müssen den Kontext mit unvollkommenen und ineffizienten Methoden verifizieren. Die Adobe Initiative will stattdessen fälschungssichere Attribut- und Verlaufsdaten bereitstellen, die auf XMP, Schema.org und anderen Metadaten-Standards aufbauen und weit über die heute üblichen Möglichkeiten hinausgehen.
Was kompliziert klingt, soll einfach in der Anwendung, sicher vor Manipulation sowie klar in der Aussage sein und optional die Anonymität des Bildautors sicherstellen, falls gewünscht oder erforderlich. CAI schreibt dafür keine einheitliche Plattform vor, sondern umfasst stattdessen eine Reihe von Standards, die zur Erstellung und Offenlegung von Attributen und der Geschichte von Bildern verwendet werden können.
Das System
Das gesamte CAI-System basiert auf einer einfachen Struktur für die Speicherung von und den Zugriff auf kryptographisch überprüfbare Metadaten. Diese können sowohl von einem Anwender wie auch von einer Hard- oder Software erstellt werden, sofern diese Teil des CAI-Ökosystems sind.
Diese Metadaten umfassen Informationen zur Erstellung der Bilddaten, zur Urheberschaft, zu Bearbeitungsaktionen, zu Details des Aufnahmegeräts, zur verwendeten Software und zu vielen anderen Themen und bilden die Provenienz einer Bilddatei. Dabei schließt die CAI bestehende Standards ein. Eine Kernphilosophie besteht darin, eine rasche, breite Einführung zu ermöglichen, indem sowenig neue Technologie wie möglich auf bereits vorhandenen und etablierten Techniken aufbaut. Dazu gehören Standards für Kodierung, Hashing, Signaturen, Kompression und Metadaten.
Jede CAI-Information zu einer Bilddatei ist typischerweise eine JSON-basierte Datenstruktur, die Informationen zum Urheber, zur verwendeten Hard- und Software, zum Aufnahmezeitpunkt umfassen. Jede dieser Informationen ist entweder in der CAI-Spezifikation oder durch andere Metadaten-Standards wie XMP oder schema.org definiert, es können aber auch benutzerdefinierte Daten für einen bestimmten Fotografen oder Workflow sein. All diese Informationen werden kryptografisch zu einem Claim zusammengefasst. Ein Claim ist eine digital signierte Datenstruktur, die einen Satz von Informationen zusammen mit einem oder mehreren kryptografischen Hashes auf den Daten eines Assets darstellt. Die Signatur gewährleistet die Integrität der Informationen und macht das System fälschungssicher. Eine Information kann entweder direkt oder indirekt in eine Datei eingebettet sein.
Jedes Mal, wenn die Datei genutzt oder verändert wird – also von der Erstellung, über diverse Bearbeitungsschritte bis zur Veröffentlichung in verschiedenen Medien – wird ein neuer CAI-Eintrag erstellt. Jede neue Dateiinformation bezieht sich auf die vorherigen Einträge, wodurch eine Provenienzkette entsteht. Diese können sowohl in der Datei, als auch (oder optional ausschließlich) in einer CAI-Cloud gespeichert werden.
Da CAI-Daten sehr viele Details enthalten können, die nicht immer für alle Bildnutzer relevant sind, sieht die Planung vor, dass den Nutzern zunächst nur eine kleine Menge relevanter Daten angezeigt wird, die sie dann durch Interaktion mit der Benutzerschnittstelle in die Lage versetzen, mehr Details offenzulegen. Welche Informationen für die Nutzer am relevantesten sind, muss für jede Situation sorgfältig evaluiert werden, aber im Allgemeinen wird empfohlen, dass der Benutzer als Top-Level-Informationen sieht, wann, wie und von wem ein Asset geändert wurde. Über dieses Modell lassen sich verschiedene Ebenen digitaler Zugriffsrechte vergeben.
Fazit
Die totale Sicherheit vor Irreführungen kann auch CAI nicht garantieren, aber wer das System zum Beispiel dadurch umgehen will, dass er eine Reproduktion eines gedruckten Bildes anfertigt, um der so neu entstehenden Datei andere CAI Daten beizusteuern, wird scheitern, denn entsprechend CAI-fähige Kameras können erkennen, ob ein Bild von einem drei- oder zweidimensionalen Motiv erstellt wird, um auch diese Information zu speichern.
Um Referenz-Dateien einer Aufnahme zu deren Verifizierung ausfindig zu machen, kann eine einfache Online-Bildersuche genutzt werden. Obwohl solche Lösungen nicht Teil der CAI-Kerninfrastruktur sind, lassen sie sich leicht in das System integrieren.
Damit CAI sich etablieren kann, müssen Hard- und Softwareanbieter auf breiter Front gemeinsam daran arbeiten, CAI-konforme Lösungen zu entwickeln. Denn auch ein optimal gestaltetes System kann letztlich nicht im luftleeren Raum erfolgreich sein. „Mit diesem ersten Schritt hin zu einem Industriestandard für die Authentifizierung digitaler Inhalte blicken wir optimistisch in eine Zukunft mit mehr Vertrauen und Transparenz in den Medien“, so Adobe Systems.
CAI-Workflow
Im Fotojournalismus sieht ein CAI-basierter Workflow beispielsweise so aus: Ein Fotojournalist verwendet eine CAI-fähige Kamera und verknüpft so Informationen wie die zu seiner Urheberschaft, Geolokalisierung, Zeit und dem Dateiformat. Anschließend lädt er die Daten in ein Bildbearbeitungsprogramm (z. B. Lightroom, Photo Mechanic, Capture One usw.), fügt manuell Metadaten zum Thema und zum Kontext hinzu und führt einige Bearbeitungen durch.
Dann sendet er seine Bilddaten inklusive der Bildunterschriften an den Bildredakteur seiner Publikation. Der öffnet die Daten (z.B. in Photoshop), überprüft die enthaltenen CAI-Provenienzdaten und stellt sicher, dass diese den redaktionellen Standards entsprechen.
Für die weitere Fotobearbeitung zum Zwecke der Veröffentlichung stellt der Redakteur sicher, dass er während seiner Arbeit ebenfalls CAI-fähige Programme mit den entsprechenden Einstellungen verwendet, damit auch seine Bearbeitungsschritte erfasst und dokumentiert werden. Das Asset wird anschließend in das Content-Management-System der Redaktionen verschoben, das ebenfalls über eine CAI-Implementierung verfügt, so dass der journalistische Kontext angezeigt und zum Beispiel auf einer Website veröffentlicht werden kann.
Der Social-Media-Manager stellt dann Links zu dem Artikel auf verschiedenen Plattformen ein. Während diese die Datei etwa durch Komprimieren und Beschneiden verändern können, überleben die CAI-Metadaten diese Veränderungen, die ebenfalls hinzugefügt werden. Betrachter erhalten die Möglichkeit, mehr Details über das Bild zu erfahren, etwa darüber, wer es aufgenommen hat, für welche Publikation und wann.
Wenn andere Nutzer der Social Media Plattform das Bild weiter teilen (und es somit von der ursprünglichen Veröffentlichung trennen), werden die CAI-Daten mit dem Asset mitgeführt, und jeder folgende Nutzer, der das Bild sieht, kann die Quelle und den ursprünglichen Kontext ermitteln. Eine Cloud mit allen gespeicherten CAI-Daten macht den Kontext der Bildentstehung überprüfbar, was das Vertrauen in die Authentizität des Bildes weiter stärkt.
Ganz andere Probleme löst CAI für kreative Fotografen, die zunehmend unter der unlizensierten Nutzung ihrer Bilder und fehlenden Urhebervermerken zu leiden haben.
Darüber hinaus kombinieren Kreativprofis häufig mehrere Bildquellen zu einem neuen Werk. Nicht selten müssen die Urheber der Ursprungsbilder im Urhebervermerk des finalen Bildes genannt werden. CAI bettet diese Informationen automatisch ein. Das System lässt sich aber so konfigurieren, dass wahlweise keine detaillierte Bearbeitungshistorie erfasst wird, denn Bildbearbeiter sind in der Regel wenig geneigt, die einzelnen Bearbeitungsschritte detailliert transparent zu machen.
Wenn ein Bildnutzer sich durchklickt, um weitere Informationen zu einem bestimmten Bild zu sehen, wird er auf eine CAI-aktivierte Website weitergeleitet. Diese Website bietet Zugriff auf den vollständigen Satz der CAI-Daten der Datei, die entsprechend den Präferenzen des kreativen Profis veröffentlicht wurden.
Schließlich gibt es auch Fälle, in denen der Urheber eines Fotos anonym bleiben muss, zum Beispiel, wenn es um Aufnahmen von Aktivisten als Beweis für Menschenrechtsverletzungen geht. Auf einen Urhebervermerk kann man daher optional verzichten.
Viele dieser Aktivisten sind keine professionellen Bildjournalisten, leben oftmals in Ländern mit einem hohen Maß an Überwachung und/oder mangelnder Konnektivität und verfügen nur über eine geringere digitale Medienkompetenz. In der Regel entstehen solche Bilder mit Smartphones. Das CAI-System lässt dabei die Wahl, ob man die entsprechenden CAI-Daten nur über die Cloud mit dem Bild verknüpfen möchte, oder ob sie direkt in die Datei selbst geschrieben werden sollen.