Welche Rolle spielen selbstlernende Systeme im Bilder- und Kamerabusiness? Führt KI zu besseren Bildern?
Die Potenziale Künstlicher Intelligenz (KI) sorgen weltweit für eine große ökonomische, soziologische und wissenschaftliche Dynamik. Zu den wichtigsten Voraussetzungen und Treibern von KI gehört Imaging. Welche Rolle spielen selbstlernende Systeme im Bilder- und Kamerabusiness heute und morgen? Was leistet Software bei modernem Bild-Management? Diese und viele weitere Fragen diskutierten Branchenexperten auf dem PIV Expertentalk im April in Frankfurt am Main.
KI strukturiert Daten und beschleunigt Entscheidungsfindung
Die Expertenrunde aus Dr. Reiner Fageth (CEWE), Lars Trieloff (Adobe) und Alexander Müller (Canon), die auf Einladung des Photoindustrie-Verband (PIV) nach Frankfurt am Main gekommen waren, ist sich grundsätzlich über die Bedeutung von KI für die Imaging-Branche einig: Diese Technologie wird einerseits für den gesamten Imagingworkflow von der Aufnahme über die Bearbeitung sowie Archivierung bis hin zur Ausgabe an Relevanz gewinnen, auf der anderen Seite im B-to-B-Bereich die Wirtschaft, Gesellschaft und Wissenschaft revolutionieren. Warum? Reiner Fageth bringt den Kern von KI auf den Punkt: „KI wandelt unstrukturierte zu strukturierten Daten, filtert die relevanten Informationen und verarbeitet sie dann weiter. Mit dem Ziel, als Mensch bessere Entscheidungen treffen zu können oder dass KI automatisch im Sinne des Menschen handelt.“
Für das Software-Unternehmen Adobe, so Lars Trieloff, steht KI bereits seit vielen Jahren im Fokus, speziell bei dem Programm Adobe Sensei: Dahinter verbirgt sich ein zentrales Framework für KI und Machine-Learning, das auf eine immense Sammlung an Dateien und Daten von hochauflösenden Bildern bis hin zu Informationen über Klicks zugreift und Bilder über große Bestände hinweg abgleichen kann. Alexander Müller sieht die Vorteile Künstlicher Intelligenz bezogen auf Imaging-Produkte wie Kameras auf der einen Seite in der Verbesserung der Produktleistung wie bessere Bildqualität, auf der anderen Seite bei der durch KI immer leistungsstärkeren Produktion.
Informationen aus dem Bild herausholen
Was verstehen die Imaging-Experten genau unter KI? Ist es das, was ein Ergebnis liefert, so wie es ein Mensch machen würde? Oder ist es einfach nur ständiges Lernen und Verbessern eines Prozesses? Reiner Fageth: „Die EXIF-Daten eines Bildes liefern schon sehr viele Informationen. Klassische Algorithmen liefern aber nicht alle Informationen, beispielsweise darüber, welche Personen auf dem Foto zu sehen sind. Wenn ich also aus der riesen Bilderflut etwas erkennen will, dann brauche ich weitere Informationen, die ich aus dem Bild heraushole. Und das tun wir Menschen: So erkenne ich mich mit einem Freund beim Kaffeetrinken und weiß auch noch wo und wann genau das war. Das steht aber alles nicht in den heutigen Bildinformationen. Was ist also KI? Ist es Bilder finden, ist es wichtige Bilder finden, ist es Content oder Captions zuordnen, sodass Text oder Beschreibungen gesucht werden können?“
Das Bild als gute Basis für KI
Lars Trieloff fasst den Begriff der Künstlichen Intelligenz weiter: „Mit Deep-Learnig ist eine neue Technologie entstanden: Künstliche Dinge, die als intelligent wahrgenommen werden. Und Intelligenz liegt im Auge des Betrachters.“ Aus seiner Sicht sind Bilder nicht ideal für KI. Die Frage ist: Wie definiert man das Bild – über den Inhalt oder über die Daten? Das Problem ist, so Lars Trieloff, das allein aus Nullen und Einsen wenig Information herausgezogen wird. Deshalb werden Bits zu Bytes, daraus dann Datenstrukturen, die sowohl in der Sprachverarbeitung als auch in der Bildverarbeitung eingesetzt werden. Alexander Müller ergänzt: „Die Reise geht dahin, dass Algorithmen dem menschlichen Verhalten so ähnlich wie möglich und Sinnesorgane durch Sensorik und andere technische Hilfsmittel ersetzt werden.“
Welche Bedeutung hat Imaging als Teil von KI?
Imaging und Sprache, so Lars Trieloff, sind elementare Dinge, die KI ausmachen. Konkurrierende Netzwerke befruchten sich gegenseitig. Alexander Müller fügt hinzu: KI kann in allen Bereichen unterstützen, bei der Aufnahme, bei der Analyse und auch bei der Ausgabe eines Bildes. Aber es macht vor allem vieles einfacher, schneller und komfortabler.
Die Kombination von Sprache und Imaging ist ein wichtiger Bestandteil der KI. Reiner Fageth hält Schwarmintelligenz, also das Lernen aus vielen guten und schlechten Beispielen, für elementar, um bessere Entscheidungen zu treffen: „Es geht darum, die Intelligenz von vielen auf einen Entscheidungsbaum hinzuführen. Wir wissen nicht, wie gut ein Netz außerhalb von gelentern Mustern reagiert. Aber da wird sich in den nächsten fünf Jahren unglaublich viel tun. In Zukunft werden ungelernte Entscheidungen besser und schneller getroffen werden können.“
KI aktuell in Imaging-Unternehmen
Alle durch die PIV Experten vertretenen Unternehmen setzen KI bereits in zahlreichen Bereichen ein. Bei Canon sind es beispielsweise Digital Services: Plattformen wie Irista oder Lifecake, auf denen man seine Bilder und Daten archivieren kann, arbeiten mit KI. Alexander Müller: „In Zukunft könnte anhand des Motiv-Inhalts entschieden werden, ob ein Bild emotional eine wichtige Erinnerung für den Menschen darstellt, sodass das Bild automatisch zu den Favoriten sortiert wird. Diese Intelligenz wird partiell in den Digital Services schon angewendet.
Lars Trieloff nennt als Beispiel für KI in seinem Unternehmen Adobe Stock. Dort werden sogenannte Asthetic Filters bei der Bildsuche aktiv. Man kann dort zum Beispiel eingeben, welche Schärfentiefe das gesuchte Bild haben soll. „Das Interessante dabei ist, dass das Ganze nicht auf Basis der EXIF-Werte und Metadaten bestimmt wird, sondern dass es tatsächlich durch Bilderkennung passiert. Die Anwendung wurde darauf trainiert, Bilder mit großer und geringer Schärfentiefe zu erkennen. Und damit kann man genau das für sich passende Bild bekommen, basierend auf einem tiefen ästhetischen Verständnis der Fotos im Adobe Stock.“
CEWE setzt KI beispielsweise in der Kommunikation mit Kunden im Servicecenter ein, so Reiner Fageth: „Wir wollen unseren Kundendienst entlasten, speziell in extremen Zeiten wie vor Weihnachten. Der FAQ-Einsatz ist KI-basiert. Wenn man eingibt: Wo ist mein Auftrag, was muss ich tun, wo kann ich nachfragen, so erhält der Kunde viel bessere schriftliche Antworten.“ Zukünftig will CEWE aber auch die Sprachanalyse für die Beantwortung von Kundenanfragen nutzen. Wenn Kunden anrufen und fragen „Wo ist mein Auftrag“ dann werden sie, so Reiner Fageth, direkt an einen Bot, sonst an einen Agenten weitergeleitet.
Sind durch KI bessere Bilder zu erwarten?
Reiner Fageth weiß genau: „Wir können in Zukunft als Unternehmen nur überleben, wenn wir dem Kunden helfen, seine für ihn relevanten Bilder zu finden. Neben der klassischen Algorithmik, der Gesichtserkennung und dem Tagging kommt noch viel mehr, beispielsweise die verbale Beschreibung, welche Bilder in einem CEWE Fotobuch eingebaut werden sollen. KI wird aber genauso wichtig für die Produktion und die Produktionssteuerung. Das heißt, zu lernen, wann kommen die Peaks, wann muss ich mehr Personalplanung machen und so weiter. Damit bekommt der Kunde im Übrigen auch ein besseres Produkt, ein besseres Storytelling. Heute ist unsere Bildverbesserung noch rein algorithmisch, also ohne KI. Wir prüfen derzeit gemeinsam mit Hochschulen, ob wir eine leistungsstärkere Bildverbesserung bekommen, wenn diese rein auf KI basiert oder zumindest hybrid arbeitet.“
KI führt zu besseren Bildern, da ist sich Lars Trieloff sicher. Denn von jedem Foto, was aufgenommen wird, wird nur ein Bruchteil in ein Album einsortiert, nur ein Bruchteil wird richtig nachbearbeitet, nur ein Bruchteil in irgendeiner Form weiterverwendet. „Bei jedem dieser Schritte haben wir die Gelegenheit, durch KI mit Filtern einzugreifen, was zu einer Qualitätsverbesserung der Ausgabe führt. Je länger die Strecke ist, in der wir in den Imaging Workflow der Konsumenten eingreifen können, desto größer ist der Hebel für Verbesserungen.“ Wird diese Entwicklung dazu führen, dass die Menschen mehr Fotos machen? Auf jeden Fall, so der Adobe Experte. Wieviel Zeit werden die User für jedes einzelne Produkt im Durchschnitt aufwenden? Weniger als heute. Wird das die Endqualität beeinflussen? Ja – zum Positiven. Das sieht auch Alexander Müller so: „Die Intention, sich über jedes einzelne Bild Gedanken zu machen, wird definitiv geringer. In jedem Teil der Imaging-Kette hilft KI zu besseren Bildern. Aber auch zu Freiräumen für mehr Kreativität.“
Aber führt das nicht dazu, dass alle Bilder immer ähnlicher aussehen? Lars Trieloff zieht einen Vergleich aus der Musikwelt: „Popmusik heißt so, weil sie populär ist und den Massengeschmack bedient. Deswegen sehe ich an einem gut bedienten Bilder-Massengeschmack nichts Problematisches. Schwierig wird es erst, wenn das der einzige Geschmack ist. Es wird im übertragenen Sinne asphaltierte Autobahnen geben von der Kamera bis zum fertigen Fotobuch und anderen Bildprodukten, die sehr einfach, sehr schnell und zu einem hohen Grad standardisiert sind. Aber es wird an jeder Stelle die Möglichkeit geben, als Autor einzugreifen und individuell zu gestalten.“ Reiner Fageth glaubt, dass zukünftige Bildsysteme nach den persönlichen, individuellen Vorlieben der Konsumenten entscheiden und in den Imaging-Prozess eingreifen, wodurch die Individualität des Einzelnen erhalten bleibt: „Das System lernt nur, was man ihm zur Verfügung stellt. Die Individualität geht nicht verloren.“ Für Alexander Müller provoziert gerade der Mainstream Individualität und damit Kreativität: „Der Massengeschmack fordert den Professional dazu heraus, noch besser und differenzierter werden zu müssen. Deshalb ist es intelligent, Künstliche Imaging-Intelligenz zu erschaffen.“
Wie sieht die Imaging KI Zukunft aus?
Was sind die nächsten Schritte von KI im Bereich Imaging? Inwieweit ist eine Motiverkennung möglich? Und wird es möglich sein, ein Wort in Bildern zu synthetisieren, das dem persönlichen Geschmack entspricht?
Die Teilnehmer der PIV Expertenrunde sind sich einig: Motiverkennung passiert heute schon, die größte Herausforderung ist es aber, den Nutzern nicht nur die Funktionsweisen und Möglichkeiten zu zeigen, sondern vor allem auch die Fragen nach persönlicher Datensicherheit zu beantworten. Ein Beispiel wie das „Gesichtsbewusste Verflüssigen“ ermöglicht es jetzt schon, mittels Software die Mimik eines Menschen in einem Bild oder einem Video zu verändern, ohne dass man diese Veränderung nachweisen kann.
In der Frage der Bildgenerierung „auf Zuruf“ wird derzeit noch geforscht. Es wird wohl noch ein paar Jahre dauern, bis fotorealistische Bilder komplett synthetisch generiert werden können. Für die Experten ist aber heute schon klar: Imaging ist auch in Zukunft eine tragende Säule Künstlicher Intelligenz und führt bei den Kunden zu immer besseren, individuelleren Bildergebnissen in Foto und Video.
Künstliche Intelligenz wird eines der Trendthemen der Imaging Weltleitmesse photokina im September 2018 in Köln.