Machine Learning Imagery ist die Erstellung von Bildern mit Künstlicher Intelligenz auf Basis von Bild-Uploads oder Texteingaben. Der Fotomedia-Künstler Boris Eldagsen – unter anderem Mitglied der Deutschen Fotografischen Akademie, DFA, und dort zuständig für alles Digitale – im Gespräch mit ProfiFoto über seine Erfahrungen mit Artificial Intelligence (AI) zur Erzeugung fotorealistischer Bilder.
ProfiFoto: Boris, Du bist als Betatester bei DALL E2 hinausgeworfen worden, dem aktuell fortschrittlichsten AI-System, das aus einer Beschreibung in natürlicher Sprache fotorealistische Bilder und Kunstwerke erstellen kann. Was ist schiefgelaufen?
Boris Eldagsen: Nichts, ich wollte die Grenzen des Systems erproben, und das war erfolgreich. DALL E2 ist ähnlich restriktiv wie Facebook. Nacktheit, Sex, Gewalt, Krieg sind unerwünscht, User sollen Bilder erzeugen wie „Ein Otter mit Perlohrring, gemalt von Vermeer“ oder „American Footballspieler im Stile Van Goghs“. Ich wollte herausfinden, ob ich die KI benutzen kann, um zusätzliches Bildmaterial für ein aktuelles Projekt zu generieren („Trauma Porn“, in dem ich und mein Künstlerfreund Tanvir Taolad aus deutschen Nachlässen erstandene Privatfotos aus dem 2. Weltkrieg verwenden). Schnell wurde mir klar, dass ich mit Eingaben wie Wehrmachtssoldat oder 2.Weltkrieg kein Ergebnis erziele und verwarnt werde. Aber es gibt Workarounds. Und es hat mich gereizt, diese herauszufinden. Ein Tipp: Handlungen nicht mit Verben bezeichnen, sondern umschreiben wie Körper zueinander stehen – oder anstelle der Handlung das emotionale Ergebnis beschreiben.
ProfiFoto: Wie funktioniert das System für Dich als User?
Boris Eldagsen: Es gibt zwei Möglichkeiten Bilder zu erzeugen. Erstens über einen Bildupload. Dies dürfen aber keine Porträts sein, da DALL E2 es zur Zeit nicht zulässt, die Gesichter existierender Menschen weiterzuverarbeiten. Zweitens über Spracheingabe, sogenannte „Prompt“. Für mich die spannendere Option, denn man muss das Bild vorher visualisieren und dann in Sprache beschreiben können. Das kann ganz einfach sein, siehe das Otter-Beispiel oben, oder sehr detailliert, wie zum Beispiel „Ein Schwarzweiß-Foto eines dicken Otters mit drei Pfoten der sich in die Nase des von Vermeer gemalten Mädchens mit
Perlohrring verbeißt, dahinter Vermeer der weinend auf die Knie fällt, Foto im Stile von Cartier-Bresson“. Ich bevorzuge letzteres. Benutzt man dabei geblockte Wörter bekommt man eine Verwarnung.
Beide Workflows erzeugen jeweils vier Versionen. Von hier aus gibt es wiederum zwei Möglichkeiten weiterzumachen:
Über „Edit“ kann ich Teile des Bildes, mit dem ich unzufrieden bin, löschen, und mit einem abgeänderten Prompt wieder in vier Varianten ausrechnen lassen. Oder ich nehme ein erzeugtes Bild, das mir gefällt und lasse die KI ohne Prompt über das ganze Bild improvisieren und vier weitere Varianten ausrechnen. Das Ziel meines Tests war es, mit der KI über Spracheingabe Bilder zu erzeugen, die dermaßen die Regeln des Systems brechen, dass sich die KI weigert den „Edit“ oder weitere „Varianten“ auszuführen. Dann bekommt man eine Verwarnung. Ich hatte ca. 50 Verwarnungen, bevor ich gelöscht wurde.
Was ich wollte ist, dass die Bilderzeugung weg geht vom „Decisive Moment“, hin zur Malerei. Mittlerweile weiß ich, dass das Arbeiten mit Prompts eher wie Bildhauerei ist, mit jeder Schleife „meißelt“ man das Bild feiner aus der KI.
ProfiFoto: Welche anderen AI-Systeme zur Bilderzeugung gibt es aktuell? Wie sind die im Vergleich?
Boris Eldagsen: Es kommen mehr und mehr Anbieter auf den Markt. Die bekannteste Alternative ist Midjourney, das über den Discord Server läuft, oder Disco Diffusion von Google. DALL E2 ist eindeutig benutzerfreundlicher, aber ich musste sechs Wochen ab der Registrierung warten, um zugelassen zu werden. Neu ist dreamstudio, das sich vorgenommen hat, so gut wie DALL E2 zu werden, aber ohne Zensur.
Ich teste es seit kurzem und kann sagen, dass es nur wenig blockierte Wörter in den Prompts gibt, die Ergebnisse weitaus explizierter sind und dreamstudio auch keine Verwarnungen ausspricht. Dafür ist es eindeutig
teurer. Aber mit dreamstudio ist die Büchse der Pandora offen und es dauert nicht mehr lange bis die Erzeugung von KI Porn in der breiten Masse ankommt. Spätestens 2023/24.
ProfiFoto: Du als Kreativer – siehst Du AI Systeme eher positiv oder negativ?
Boris Eldagsen: Da ich weder mit Illustration noch mit Stock-Photography, Werbefotografie oder Pornografie mein Geld verdiene, sehe ich es positiv. Es ist ein weiteres Werkzeug, und wie bei Photoshop hängt es davon ab, wie man es benutzt. Es wird aber sehr sicher die bereits erwähnten Berufszweige zerstören. Das ist für diese besonders hart, da die KI ja auf das im Internet vorhandene Bildmaterial zurückgreift, das von diesen Berufsgruppen in der Vergangenheit erzeugt wurde.
ProfiFoto: Welche Verbesserungen wünscht Du Dir an solchen Systemen?
Boris Eldagsen: Im KI-Fotobereich ist DALL E2 sehr schlecht mit Gesichtern und realistischer Darstellung von Szenen, die keine Close-Ups oder Porträts sind. Die höchste Auflösung ist momentan HD. Das war vor einem Jahr aber noch undenkbar. Sobald diese „Kinderkrankheiten“ überwunden sind, wird sich unsere Bildproduktion radikal verändern.
ProfiFoto: Wie werden die Möglichkeiten solcher AI Systeme die Fotografie verändern?
Boris Eldagsen: Die Unterscheidung zwischen „fake“ und „real“ wird noch schwerer. Jeder kann ein Foto mit dem Papst in einer Striptease-Bar generieren und in Umlauf bringen. Dies wird zu massiven politischen und wirtschaftlichen Schäden führen, da man es natürlich auch als Waffe einsetzen wird. Irgendwann wird niemand mehr einem Foto einen „Realitätsgehalt“ zuweisen. Fotografie wird eine andere Form von Malerei. In der Pornografie braucht es keine echten Körper mehr und die Bildproduktion überlässt sich vollends dem Kopfkino.
ProfiFoto: Also überwiegen für die Wahrnehmung von Fotografie in der Gesellschaft eindeutig die negativen Aspekte, mehr noch, als vor rund 30 Jahren bei der Einführung von Photoshop?
Boris Eldagsen: Die Auswirkungen werden gesamtgesellschaftlich massiver sein. Momentan sehe ich gesellschaftlich mehr Nachteile als Vorteile, kreativ mehr Vorteile als Nachteile.
ProfiFoto: Als Fotograf hat man ja angeblich das Bild im Kopf, bevor man es aufnimmt. Gibt es also am Ende gar keinen Unterschied zwischen „echten“ und AI-basierten Bildern?
Boris Eldagsen: Doch, denn die meisten Fotografen reagieren ja auf eine Welt, die sich VOR der Linse befindet. Mit KI müssen sie die Inhalte aus SICH SELBST ziehen. Dies ist eine radikale Umstellung, eine fundamentale andere Herangehensweise. Da ich künstlerisch schon lange diese Umstellung vollzogen habe, ist KI für mich eine Bereicherung. Wer sich für das Thema interessiert: Der Verein Berliner Künstler (VBK)
startet im September eine 7-teilige Vortrags- und Diskussionsreihe zum Thema Kunst und Künstliche Intelligenz, die einen guten Einstieg in die Materie vermittelt. Ich freue mich, für den VBK den kostenlosen Facebook-Livestream zu betreuen.
Mehr Infos unter: https://vbk-art.de/ki/