Sie heißen DALL-E 2, Dreamstudio, Midjourney, Disco Diffusion oder NightCafe und versprechen nichts Geringeres als die Revolution des Bildermarktes: Dank Machine Learning Imagery erstellen diese Künstlichen Intelligenzen auf Basis von Bild-Uploads oder Texteingaben fotorealistische Bilder. Doch mit welchen Vor- und Nachteilen für Fotografen, Kreative und unsere Gesellschaft?
1. Welche Erfahrungen haben Sie selbst bereits mit KI-generierten Fotografien gemacht?
2. Wo werden solche Bilder in Zukunft eingesetzt werden können?
3. Welche Vor- und Nachteile wird dies für Fotografen und Kreative haben?
4. Und welchen Einfluss wird es gesamtgesellschaftlich haben?
Robert Kneschke, Fotoproduzent und Autor, alltageinesfotoproduzenten.de
1. Ich experimentiere zusammen mit meinem Team seit einigen Monaten intensiv mit den verschiedensten KI-Anbietern und lokalen KI-Programmen wie Stable Diffusion u.ä. Die größte Hürde dabei ist für unsere Anwendungszwecke, die Stockfotografie, aktuell noch die eher geringe Auflösung der finalen Bilder. Während diese jedoch vor einigen Monaten noch kaum überwindbar war, gab es in den letzten Wochen und Monaten etliche Updates der KI-Algorithmen, welche mittlerweile sehenswerte bis hochgradig beeindruckende Ergebnisse zustande bringen. Eine weitere Hürde ist bislang noch das „Uncanny Valley“-Problem, welches vereinfacht besagt, dass künstlich generierte Porträts bis zu einem bestimmten Punkt um so unheimlicher wirken, je realitätsgetreuer sie werden. Aktuell haben wir diesen Punkt noch nicht ganz überwunden, was vor allem meist an Details wie Augen oder Händen liegt. Trotz dieser Herausforderungen haben wir schon mehrere Tausend KI-Bilder generiert, von denen wir einige Hundert ausgewählt haben zur Bearbeitung und welche nun zum Verkauf bei Bildagenturen stehen und von den Kunden auch überraschend gut angenommen werden. Angesichts dessen, dass sich fast alle der genannten KI-Systeme offiziell noch im Beta-Stadium befinden, werden wir in nächster Zeit noch etliche Leistungs- und Qualitätssteigerungen erwarten können.
2. Im Grunde könnte die KI in einer Zeit fast den kompletten „Creative Stock“-Bereich (im Gegensatz zum redaktionellen Bilder-Bereich) ersetzen. Ob der Kunde nun einige Begriffe in das Suchfenster einer Bildagentur eingibt und Ergebnisse vorgeschlagen bekommt oder die gleichen Begriffe in das Suchfenster einer KI-Software eintippt, um fast identische Motive zu erhalten, spielt aus Kundensicht dann kaum noch eine Rolle. Bei Letzterem hätte der Kunde das Bild aber zusätzlich exklusiv sowie sogar kostenlos, wenn er eine eigene KI-Software betreibt. Es gibt auch schon erste Comics und Animationen, welche komplett mit KI-Hilfe erstellt wurden und in einiger Zeit könnte ich mir auch die prozedurale Generierung von kompletten Computerspielen mit Hilfe der KI vorstellen, welche sich an den Wünschen des einzelnen Spielers orientiert. Es gibt auch schon längst Experimente, einfach bestehende Spiele mit Hilfe dieser KI-Systeme auf Knopfdruck realistischer aussehen zu lassen.
3. Generische Fotografie, welche keine konkreten Personen oder Situationen abbilden muss, wird es in Zukunft noch schwieriger haben, weil diese Motive immer besser von der KI reproduziert werden können. Andere Kreative könnten die KI-Ergebnisse jedoch als eine Art mächtiges Inspirationswerkzeug nutzen, mit dem sie wortwörtlich auf Knopfdruck frische Ideen generieren können, denen sie dann den Feinschliff verpassen oder die Motive in ein anderes Medium übertragen. Oder andersrum formuliert: Auftragsfotografen werden es in Zukunft wieder leichter haben als Stockfotografen, aber auch nur, wenn sie etwas anbieten, was sich (noch) nicht durch KI ersetzen lässt, zum Beispiel das Fotografieren von Hochzeiten, Bewerbungsfotos, Mitarbeiterporträts und so weiter. Reise- und Landschaftsfotografen hingegen werden es vermutlich deutlich schwieriger haben. Ein weiterer Aspekt ist die zunehmende Hilfe der KI bei der Bildretusche. Hier hat Adobe mit ihrer Adobe Sensei KI ja schon etliche nützliche Tools veröffentlicht wie das „inhaltsbasierte Füllen“, „Himmel austauschen“, „Motiv selektieren“ und andere Sachen.
4. Die Diskussion um Echtheit und Glaubwürdigkeit von Bildern wird noch mal einen Aufwind erfahren mit den zusätzlichen Manipulationsmöglichkeiten, welche die KI-Anbieter mit sich bringen. Auch die Rechtefrage ist ein großes bislang ungeklärtes Feld, welches intensiv diskutiert als auch rechtlich ausgefochten werden wird. Wem gehört das Copyright an den KI-Ergebnissen? Wie müssen die Künstler entlohnt werden, mit deren Werken die KI trainiert wurden? Sind die Prompts (Texteingaben, aus denen die KI Bilder generiert) urheberrechtlich geschützt? Steht der Energieverbrauch der KI-Anbieter in Relation zu deren Nutzen? Was passiert, wenn die KI Motive reproduziert, die selbst urheberrechtlich oder markenrechtlich geschützt sind? Brauchen wir strengere Gesetze gegen nun leichter erstellbare Deep Fakes? Diese Fragen werden beantwortet werden müssen. Auf größerer philosophischer Ebene steht vor allem die Frage im Raum, was es bedeuten könnte, wenn immer mehr visuelle Eindrücke nur Kopien vorhandener visueller Medien sind? Werden Schönheitsideale dadurch noch unerreichbarer? Wird sich durch pure Masse so etwas wie ein „Einheitsgeschmack“ durchsetzen?
Boris Eldagsen, Fotokünstler und „Head of Digital“ der DFA, eldagsen.com
1. Seit zehn Wochen arbeite ich täglich mit KI-Plattformen. Im August testete ich die Grenzen der Zensur auf DALL-E 2 und erzeugte vorsätzlich Bilder mit der KI, die gegen ihre eigenen Guidelines verstießen und für eine Weiterbearbeitung abgelehnt wurden. Nach 50 Verwarnungen wurde mein Account suspendiert. Ergebnisse dieser Arbeit findet man auf meiner Website.
Inzwischen bin ich mit einem anderen Account zurück auf DALL-E 2 und teste die neue „Outpainting“-Option, mit der sich ein erzeugtes Bild in jede Himmelsrichtung erweitern lässt. Sie ermöglicht größere künstlerische Freiheit in der Komposition und Bildgestaltung. Da ich die Arbeitsweise der Plattform inzwischen sehr gut kenne, macht es mir großen Spaß damit zu arbeiten.
Seit dem Start der Open-Source-KI „Stable Diffusion“ (SD) am 22. August teste ich auch dort die Grenzen der Möglichkeiten. Im Gegensatz zu DALL-E 2 ist die Texteingabe weitestgehend unzensiert, zu explizite Bilder werden aber nach dem Rendering nur unscharf ausgegeben. Das verbrennt zwar Geld, führt aber nicht zu einer Verwarnung oder Sperrung.
Außerdem gibt es mittlerweile viele private Anbieter, die SD ohne Sicherheitsfilter anbieten. KI-Pornografie ist damit keine Ausnahme mehr, sondern ein neuer Standard, über dessen Generierung man sich in einer eigenen Discord-Gruppe namens #UnstableDIffusion austauscht.
Ich habe mit SD in 3 Wochen über 2500 Bilder erzeugt, um einen Weg zu finden, Bilder zu erzeugen die gleichzeitig anziehen und abstoßen. Die Lösung: Weg von den mainstreamigen Stilvorgaben („ein Foto im Stile von Man Ray“), hin zu absurden Wortschöpfungen, die Bilder aus der KI holen, die man sich vorher so nicht hätte vorstellen können. Beispiele auf www.eldagsen.com/ki
2. Überall wo bisher auch 2D-Bilder eingesetzt wurden: Illustration, Print, Werbung, Kunst. Alles, was gedruckt oder über Screens angeschaut werden kann. Der nächste Schritt ist die Erweiterung zu „Text-zu-Bild“-Videos. „Runway“ hat bereits eine Kooperation mit „Stable Diffusion“ angekündigt.
3. Schon C. D. Friedrich sagte, dass der Maler aufhören sollte das zu malen, was er vor sich sieht, wenn er nicht in der Lage ist, das zu malen, was er in sich sieht. Wer schon immer aus einer inneren Vision schöpfte, dem ist KI eine Offenbarung, die aus der Beschränkung des zur Verfügung stehenden Budgets und Materials befreit. Aber dazu braucht es eine persönliche Handschrift, die sich bereits ausgebildet und erprobt hat. Denn es wird schwieriger, sich in einer explodierenden Bildermenge hervorzutun. Viele jammerten in den letzten Jahren über die „Bilderflut“. Zieht euch warm an! Jetzt kommt ein Tsunami.
Wer bisher lieber abbildete, was vor der Linse stand, für den ist KI ein Fluch – denn alles, was reine Abbildung betrifft, wird ersetzt werden können. In der gleichen Qualität, blitzschnell und für ein paar Cent. Das betrifft besonders die in Genres denkende Berufsfotografie (Aerial, Architecture, Beauty, Landscape, Stillife, Travel). Und alle, die Print oder Screen zuarbeiten. Vor zwei Jahren hatte ich den Auftrag, ein Cover für „Zeit Verbrechen“ zu fotografieren. Die Bildagentur schickte mir ein Foto als Vorgabe. Heute müsste sie dafür keine vierstellige Summe für Produktion, Bild- und Printrechte ausgeben. Sie kann die Vorgabe in KI hochladen und in HD „variieren“ lassen, für ein paar Cent.
4. In den nächsten Monaten werden Investoren den KI-Bereich mit Geld zuschütten, um die besten Geschäftsideen für diese neue Technologie zu entwickeln. Es wird von vielen Seiten versucht werden, die rechtlichen und ethischen Konsequenzen der Technik zu kontrollieren. Unabhängig davon wird sich die Technik durch das Open-Source-Modell von SD rasend schnell weiterentwickeln. Demokratien werden dadurch noch angreifbarer und manipulierbarer. Wir sind nicht darauf vorbereitet, dass ein 8- oder 88-jähriger ohne technische Fähigkeiten ein Foto eines Staatsoberhauptes in kompromittierender Situation herstellen und in Social Media verbreiten kann – mit einer Texteingabe und zwei Klicks. „Alternative Fakten“ sind in Sekunden herzustellen. Ein dokumentarisches Foto aus einem Kriegsgebiet kann mit zwei Klicks zu einer „Variante“ umgerendert werden. Das wird für viel Chaos sorgen. Am Ende müssen wir als Demokratien den letzten Glauben an das Foto als „Beweismittel“ aufgeben, ohne dafür einen adäquaten Ersatz zu haben. Das Leben der Kreativen wird noch prekärer, weil viele der Jobs, mit denen man sich über Wasser gehalten hat, wegfallen. Für Fotografen bleibt eigentlich nur noch die Dokumentation von Events.
Die Rolle der Kreativen wird unwichtiger. Mit Hilfe der KI wird Beuys‘ Vision wahr: Jeder ist ein Künstler. Ein Wissen über Technik, Komposition, Kunstgeschichte ist nicht mehr notwendig. Denn die KI übernimmt das. Denn sie hat 2000 Jahre menschlicher Bilderzeugung analysiert und ist in der Lage dieses Experten-Wissen auf jede noch so einfache Texteingabe anzuwenden. Doch zunächst beschränkt dich diese Ersetzbarkeit auf sogenannte „Flachware“, also Bildende Kunst, die mehr als ein flaches Bild ist, wird im Wert steigen – solange diese nicht auch durch KI ersetzt werden kann. Es wird einige Künstler geben, die in der Lage sind, KI so einzusetzen, dass es kunstgeschichtlich relevant ist. Und es wird neue Berufe geben. Einer davon: der KI-Flüsterer, der weiß, mit welchen Eingaben man das gewünschte Ergebnis aus einer Plattform herausholt.
Das diesem Interview beigefügte Porträtfoto ist eine mit SD-generierte Variation eines Selfies mit dem zusätzlichen Prompt, „freudig in die Zukunft schauender Mann mit Brille“.
Jan Schmolling, Experte für Medienbildung und Leiter des Deutschen Jugendfotopreises, kjf.de
1. „KI“ ist in der Fotografie nichts wirklich Neues. Machine Learning läuft in Smartphones ständig mit und verhilft zu guten Bildern, und auch in der Bildbearbeitung sind Korrekturen und Effekte, die über das „manuelle“ digitale Finetuning weit hinausgehen, längst Alltag. Die neuen Tools bringen das Thema jedoch auf ein neues Level. Ich habe einige von ihnen just for fun ausprobiert und mit Profis gesprochen, die die Tools für ihre Arbeit nutzen. So „unwahrscheinlich-seltsam“ meine eigenen Versuche aussahen: professionell und gezielt eingesetzt, steckt da ganz viel Potenzial für die Kommunikation mit Bildern und für visuelles Storytelling.
2. Im Designbereich werden sie schon jetzt für Entwürfe und Moodboards eingesetzt, künftig sind sie auch, je nach Zielgruppe und Produkt, in großen Teilen der visuellen Kommunikation zu erwarten. Ein anderes Feld sind der Bildungsbereich und die Medienpädagogik: „Mach deine Gedanken und Gefühle sichtbar, lass deiner Fantasie freien Lauf“ heißt es ja beim Deutschen Jugendfotopreis. Werden also künftig KI-generierte Bilder eingereicht, die ein Gedicht in ein Bild übersetzen und ein Lebensgefühl visualisieren? Hoffentlich auch! Dass technische Entwicklungen und Impulse aus der Kunst die Grenzen der Fotografie ständig erweitern und überschreiten, gehört zur Dynamik dieses Mediums.
3. Sie werden vieles neu denken und neu machen. Wie bisher auch. Und wenn ich mir den Umgang der jungen Kreativen beim Deutschen Jugendfotopreis ansehe, so erzeugen Trends und Arbeitsweisen, die dann zu Mainstream werden, auch entsprechende Gegentrends. Noch nie in der „digitalen Zeit“ dieses Fotowettbewerbs gab es so viele analoge Einreichungen wie aktuell. Manche extra „unperfekt“ und sympathisch subversiv, vielleicht als eine Art Antithese zu der kalten Glattheit des digitalen Bildes, manche umso ausgefeilter, analoge und digitale Arbeitsweisen verbindend.
4. Pixar war gestern, Metaverse ist morgen. Wir leben in einer mediatisierten Gesellschaft, schon Kinder lernen von klein auf, sich in dieser Bilder-Welt zu bewegen. Durch den spielerischen Umgang mit den Tools erkunden Kinder und Jugendliche auch die neuen Möglichkeiten der Gestaltung. Aber es gibt eben Fragen, auf die die Pädagogik gute Antworten geben muss. Wer programmiert die Tools mit welchem Interesse? Welche ideologischen und kulturellen Implikationen sind in den Tools „eingebrannt“? Was passiert mit den Daten? Und wer hat die Nutzungsrechte an den Ergebnissen? In welcher künstlerischen Tradition steht das KI-generierte Bild? Viel zu tun für alle, die im Bereich der Medienkompetenz-Vermittlung unterwegs sind.
Und: ein Bild ist schnell erzeugt und publiziert. Aufgrund der neuen Manipulationsmöglichkeiten muss ein noch größeres Verantwortungsbewusstsein vermittelt werden, ohne Kindern und Jugendlichen die Lust an visuellen Fantasiereisen zu nehmen. Denn digitale Gewürzmischungen können ja auch Spaß machen, nur das eigentliche Rezept mit all den Zutaten sollte man auch kennen. Gute Informationen sowohl für Eltern als auch für Lehrerinnen und Lehrer sind also enorm wichtig. Was ist echt, was ist fake? Hier kommt auch den Bild-Vermarktern, Redaktionen und eben auch der kulturellen Medienbildung eine große Verantwortung zu. Und mit Blick auf die professionelle Praxis ist der kompetente Umgang mit KI für viele Studiengänge und natürlich auch das Fotografiestudium ein extrem wichtiges Thema.
Julia Albrecht, Künstlerin, albrechtjulia.de
1. Da ich neben meiner fotografischen Praxis viel mit Texten und Poesie arbeite, hat sich das Konzept “Text to Image” als eine Möglichkeit herauskristallisiert, Bilder zu komponieren, die ich bislang nicht fotografisch verwirklichen konnte. Innerhalb von ein paar Sekunden kann man ein Ergebnis erzielen, für welches man mehrere Wochen Planung gebraucht hätte. Natürlich gibt es auch viele Fehlschläge und die Künstliche Intelligenzen (KI) haben bei bestimmten Objekten nach wie vor Probleme, bzw. kann es passieren, dass sie Sprache unterschiedlich interpretiert. Diese kleinen Unfälle können wesentlich interessanter sein als das eigentlich geplante Bild. Wenn ich mit KI generierten Fotografien arbeite, suche ich vor allem nach dem Zwischenwert von Fotografie und Technologie. Ein Bild, das auf den ersten Blick wie eine Fotografie aussieht, aber durch einen kleinen Glitch den eigentlichen Ursprung verrät. Interessant ist auch, dass jedes Bild einzigartig ist und so nicht noch mal kreiert wird. Deswegen gebe ich auch immer wieder gerne dieselben Sätze ein, um zu sehen, wie sich das Sprachverständnis der KI geändert hat. Mittlerweile arbeite ich damit fast jeden Tag, manchmal, um explizit etwas herauszufinden oder einfach nur um mir Zeit zu vertreiben.
2. Privatpersonen werden anfangen, damit herumzuspielen und für ihre persönlichen Gebräuche generierte Bilder einsetzen. Sehr wahrscheinlich werden diese Programme ebenfalls die Stockfotografie revolutionieren. Wenn jeder Zugriff auf generierte Bilder hat, stellt sich natürlich die Frage: ‚Für was möchte ich zahlen?‘. Kann man noch etwas kreieren, was die laufenden Rechnungen bezahlt? Doch dies bedeutet nur eine Umstrukturierung des Marktes. Jede Änderung bringt neue Möglichkeiten und wie eine neue Kamera sind diese Programme nur Instrumente, welche gespielt werden möchten. Wenn jeder diese nutzen kann, geht es mehr um die Noten, als das eigentliche Instrument. “Show me something I have never seen before“ und die Ideen dafür muss man erst einmal haben.
3. Ein großer Nachteil, den ich bis jetzt noch in diesen KIs sehe, ist die Stereotypisierung von manchen Wörtern, auf die man immer wieder stößt und mit denen es scher fällt frei zu arbeiten. Vielfalt geht dadurch leider schnell verloren. Womit wir auch schon zu den Fragen der Ethik kommen müssen, wenn beispielsweise Menschen wie Satzbaukästen zusammengebaut werden können. Wann fängt ein Missbrauch dieser Programme an? Wer besitzt die Bildrechte und kann man sich selbst noch Künstler, Fotograf oder Kreativer nennen, wenn man mit solchen Programmen arbeitet? Es öffnet eine neue Philosophie der Bildgeschichte und aus der Sicht der künstlerischen Forschung finde ich dies spannend und freue mich darauf, den Prozess weiter zu verfolgen.
4. Es wird eine neue Ära der Bildgestaltung einleiten. Was damals die Fotografie für die Malerei war, sind nun diese künstlichen Intelligenzen für den Bildmarkt. Anstatt dieses Werkzeug zu bekämpfen, sollten wir anfangen zu lernen, wie wir es einsetzen können und uns diese Technologie für unsere kreativen Schaffensprozesse anzueignen. Es ist sozusagen ein neuer Spieler gekommen und mischt nun das Feld auf, was die anderen noch lange nicht obsolet macht. Ich selbst habe schon lange nicht so viele Ideen gehabt wie durch das Arbeiten mit generativen Bildprogrammen. Es beschleunigt den Arbeitsprozess wesentlich, was eine Kettenreaktion im Schaffensprozess auslösen kann. Ich selbst arbeite sehr gerne damit, werde deswegen aber nicht aufhören zu fotografieren, da es bestimmte Aspekte gibt, die diese Programme nicht nehmen können.
Lars Bauernschmitt, Professor für Visual Journalism, larsbauernschmitt.de
Wünscht ausdrücklich das Gendern so zu belassen!
1. Seit jetzt ziemlich genau 30 Jahren sind meine Themen in der täglichen beruflichen Praxis sowie in Forschung und Lehre die Entwicklungen auf dem Bildermarkt, das meint die Publikation von Bildern, insbesondere Fotos in Journalismus, Public Relations und Werbung, im Allgemeinen und den Entwicklungen im Bildjournalismus im Speziellen. Schon seit vielen Jahren erleben wir, dass immer mehr Bilder digital verändert werden. Nun können sie vollständig am Computer generiert werden. Der Einzug von Techniken zur Bildbearbeitung und Bilderzeugung hat schon vor vielen Jahren begonnen. In der Autowerbung werden schon sehr lange Fotos von Autos in Fotos von Landschaften montiert. Die Bilder von Autos in Landschaften nun vollständig am Computer zu erzeugen, ist da doch nur konsequent. Auf dem letzten Picta-Day im April 2022 in Hamburg präsentierte die Bildagentur Panthermedia eine Kollektion KI-generierter Porträts. Das Unternehmen bietet damit Bilder von Gesichtern an, die publiziert werden können, ohne Rechte von Abgebildeten zu verletzen – erstmal ist das doch ein Fortschritt.
2. KI-generierte Bilder werden aus meiner Sicht überall dort zum Einsatz kommen, wo sie billiger sind als Fotografien und ihr Einsatz gleichzeitig inhaltlich-moralisch zu rechtfertigen ist. Überall dort, wo Bilder die Funktion haben, die dargestellten Sachverhalte zu beweisen, also die Richtigkeit des Geschriebenen belegen sollen, haben KI-generierte Bilder nichts zu suchen. Es gibt aber viele Einsatzgebiete von Bildern, wo kein Mensch glaubt, dass eine Abbildung eine Situation zeigt, die sich so tatsächlich ereignet hat, oder einen Gegenstand, der tatsächlich so aussieht. Viele Bilder in der Werbung sind so offensichtlich überzeichnet, dass niemand sie als Dokumente der Wirklichkeit akzeptiert – eine Funktion haben sie dort trotzdem. Die meisten Stockfotos sind unglaubwürdige Inszenierungen, erdacht von Kreativen die zur Bilderstellung eine Kamera benutzen mussten, weil andere Instrumente dazu bisher nicht in der Lage waren. Männer, die in Anzügen und mit Aktenkoffer über Hürden springen, sieht man eher selten im Alltag, dafür umso öfter in irgendwelchen Anzeigen von Beratungsunternehmen, die die Bilder aus Stockagenturen bezogen haben. Dass das Familienleben besonders glücklich ist, bloß weil eine bestimmte Margarine auf der Stulle ist oder Mutti einen besonderen Weichspüler benutzt, glaubt doch ernsthaft niemand – obwohl die Bilder mit einem Fotoapparat hergestellt wurden. Kurz gesagt: Im Journalismus haben künstlich generierte Bilder nichts zu suchen, in der Werbung kann ich mir viele Felder vorstellen, wo die KI die Arbeit erleichtert und beschleunigt.
3. Für Fotografinnen und Fotografen sowie und andere Kreative ist die Möglichkeit mittels KI Bilder zu generieren, zunächst einmal nur eine neue Technik, deren Möglichkeiten und Grenzen es zu erproben gilt. Fotografinnen und Fotografen, die ihre Tätigkeit auf das Bedienen der Kamera reduzieren, werden es absehbar noch schwerer haben, während diejenigen, die sich als Erfinderinnen und Erfinder von Visualisierungen verstehen, ein neues spannendes Werkzeug an die Hand bekommen.
4. Zwar dreht sich die Diskussion um KI-generierte Bilder im Moment vor allem um künstlerische Arbeiten, es bedarf aber nur wenig Phantasie, um sich vorzustellen, welche Themen auf den Bildjournalismus und die Werbefotografie zukommen. Die neue Technik wird dem Nachdenken über notwendige Veränderungen des Urheberrechts weitere Dynamik verleihen. Schon jetzt wird die Frage nach den Rechten der Kreativen infolge der Digitalisierung und der Verbreitung des Internets diskutiert, die Möglichkeiten der KI erweitern das Problemfeld nun noch weiter. Selbstverständlich wird die Frage nach der Glaubwürdigkeit von Bildern nun auch in Bezug auf KI-generierte Bilder diskutiert werden, aber die Diskussion ist ja nun wirklich nicht neu. Sie wird seit über 150 Jahren geführt – und nicht nur beim Aufkommen einer neuen Technik.
Alexandra Lechner, Fotografin und Vorstandsprecherin des BFF, bff.de
1. Bisher habe ich außer den in der Presse diskutierten und in Social Media geposteten Bildern keine eigene Erfahrung mit KI-generierten Bildern gemacht. Aber ich beobachte seit einigen Jahren die Entwicklungen dazu – sei es aus technischer Sicht oder in der künstlerischen Auseinandersetzung mit diesem Thema. Dabei fiel mir der Künstler Trevor Paglen besonders auf. Er setzt sich seit Jahren intensiv damit auseinander und bezieht auch wissenschaftliche Untersuchungen mit ein. Er hinterfragt in seinen Arbeiten u.a. die Herkunft des Bildmaterials, die Programmierung und Verschlagwortung, usw. Denn letztendlich führt KI oder Machine Learning zurück auf diejenigen, die die Codes eingeben und starten. Das bildet die Basis dessen, worauf die KI aufbaut. Was wir in unserem Alltag als Fotografinnen und Fotografen auch immer ein wenig vergessen: Viele der von uns täglich genutzten Tools setzen KI ein. Sei es beim Archivieren, Bildbearbeiten und auch Bild erstellen. Vieles davon hat uns den Workflow doch erheblich erleichtert. Jetzt kommt mit diesen neuen Tools scheinbar die nächste Dimension aufs Parkett.
2. Schwer zu sagen. Noch ist die Technik nicht voll ausgereift und fand bis vor Kurzem zunächst in Forschungszentren ihren Einsatz. Jetzt kann man diese als Opensource nutzen und es gibt gerade jede Menge Experimente dazu. Vom Künstler bis hin zum Amateur probieren sich viele an diesen Apps aus. Wie sich der Einsatz der Technologie im professionellen Bereich entwickelt, bleibt abzuwarten. Möglicherweise werden einfache Bildaufgaben so erledigt werden können, wenn man die Texteingaben entsprechend präzisieren kann bzw. die KI das Sprachverständnis hat, so dass das gewünschte Bildergebnis erzeugt wird. Die KI hat Zugriff auf Millionen Bilder, die sich ein einzelner Mensch nicht ansehen könnte. Das wird sicher bald zu noch besseren Ergebnissen führen, die dann wohl auch professionell eingesetzt werden können.
3. KI-basierte Software ändert nicht nur den Entstehungsprozess, sondern wird auch das Berufsbild verändern. Wenn KI bestimmte Arbeiten übernimmt, werden Fotografinnen und Fotografen und Kreative andere Qualitäten entwickeln müssen. Der Prozess der Digitalisierung wird weitergehen und wir werden uns den veränderten Bedingungen anpassen müssen – so wie es schon seit Mitte der 1990er passiert. Der Druck, sich immer wieder neu erfinden zu müssen, sein Geschäftsmodell zu überdenken wird nicht weniger. Aber wenn wir offen gegenüber der Technik bleiben, uns mit den Vor- und Nachteilen auseinandersetzen, können sich vielleicht auch neue Businessmodelle auftun.
Und es bleibt zu hoffen, dass die menschliche Kreativität und das „um die Ecke denken“ des Gehirns der KI noch ein Stück weit voraus bleibt und für professionelles Gestalten weiterhin wertvoll ist.
4. Es wird noch wichtiger, sich mit Bildern und deren Inhalt auseinanderzusetzen. Bilder lesen und einordnen zu können, wird noch wichtiger werden. Fake News, die heute oft schon mit Fotos bebildert werden, die aus dem Zusammenhang gerissen sind, könnten schon bald mit KI-generierten Bildern illustriert werden, um die Nachricht noch glaubwürdiger machen. Ebenso sollte man die Zusammensetzung der „Bildkataloge“, auf die die KI zurück greift, hinterfragen. Es besteht die Gefahr von Stereotypisierung, da die KI auf die Tags der Bilder zugreift und damit bestehende Muster verstärkt werden könnten. Wenn z.B. die meisten Menschen zu einem bestimmten Begriff westlich weiß in den Datensätzen sind, wird auch das Ergebnis eher weiße Menschen zeigen. Und nicht zu vergessen: die Frage von Urheberschaft wird rechtlich neu definiert werden müssen – hier ist auch die Politik gefragt.