Diese Arbeit betrachtet künstliche Intelligenz (KI) in der Bildbearbeitung. Nach einer Definition werden Geschichte und Funktionsweisen der KI von 1950 bis heute betrachtet. Im Anschluss geht die Arbeit auf die Bildbearbeitung ein und wirft dabei einen Blick auf Adobe Sensei und andere Bildbearbeitungssysteme. Auch KI in der Smartphone-Fotografie wird beleuchtet.
KÜNSTLICHE INTELLIGENZ IN DER BILDBEARBEITUNG
Der Begriff Künstliche Intelligenz (engl.: Artifictial Intelligence, kurz AI) findet seinen Ursprung 1955, als ein Team aus Wissenschaftlern und Informatiker John McCarthy ein Forschungsprojekt zu diesem Thema initiierten. Die Bedeutung ist bis heute weitgehend gleich geblieben: Künstliche Intelligenz soll menschliche Fähigkeiten maschinell simulieren, beispielsweise die Lernfähigkeit oder das Sprachverständnis eines Menschen. 1950 entwickelte Alan Turing den Imitation GameTest, auch bekannt als Turing-Test.
Er besteht aus einem menschlichen Fragesteller, der mittels Tastatur und Bildschirm mit zwei Gesprächspartnern kommuniziert, von denen einer ein Mensch, der andere eine Maschine ist. Kann der Fragesteller nicht feststellen, welcher der Gesprächspartner maschinell ist, besteht die Maschine den Test. Dr. Frank Rosenblatt stellte 1958 das Perzeptron vor, der erste Typus eines künstlichen Neurons. Das Design dient bis heute als Grundlage für die weiterentwickelten künstlichen neuronalen Netze. Ein weiterer Meilenstein in der Geschichte der KI ist die Demonstration der ersten automatischen Spracherkennung „IBM Shoebox" 1961 von William C. Dersch. „IBM Shoebox" kann 16 Wörter und die Ziffern 0 bis 9 erkennen.
Zwischen 1964 und 1966 entwickelte Joseph Weizenbaum den ersten Chatbot „ELIZA", welcher einen Psychotherapeuten simuliert.
Anfang der 1970er Jahren entwickelte T. Shortliffe das Expertensystem „MYCIN" an der Stanford University. Es diente der Unterstützung beim Diagnostizieren und der Entscheidung zwischen Behandlungsmöglichkeiten bei Blutinfektionskrankheiten. Mit diesem Programm und auch anderen Expertensystemen stieß man allerdings an einige Grenzen; die eingeschränkte Computerleistung, die vergleichbar hohen Kosten und der Aufwand, durch Menschenhand benötigte Informationen in formale Regeln zu bringen bremste die Entwicklung auf diesem Gebiet einige Jahre lang aus.
In den letzten Jahren stieg die Zahl der Erfolge stark an. 2011 zum Beispiel erlangte IBM mit ihrer KI-Lösung IBM Watson einige Aufmerksamkeit. Die KI wurde in der Live-Quiz-Show „Jeopardy!" gegen menschliche Teilnehmer eingesetzt und lieferte beeindruckende Ergebnisse. IBM Watson konnte gesprochene Sprache verstehen, sie zerlegen und klassifizieren, auswerten und durch Machine Learning immer besser werdende Ergebnisse liefern. Die gleiche Technologie kam daraufhin in der Medizin zum Einsatz; IBM Watson for Oncology war nach dem Aufbau einer Wissensbasis in der Lage, Informationen zu verarbeiten, mit Patientendaten abzugleichen und daraus geeignete Behandlungsmethoden für Krebspatienten abzuleiten. Die behandelnde ärztliche Person ermittelte mithilfe des eigenen Fachwissens die am besten geeignete Krebsbehandlung. 2012 wurden erstmals Deep-Learning Algorithmen für die Bilderkennung genutzt, mit hohem Erfolg. Die Datenbank Image Net verfügt mittlerweile über etwa 14 Millionen Bilder mit 20.000 verschiedenen Klassifizierungen. Eine Software von Microsoft erzielte eine Fehlerquote von 3,5%, 2014 kam „Deep Face" vom Facebook- Forschungsteam sogar auf 3%. Zum Vergleich: der Mensch lieferte im Durchschnitt eine Fehlerquote von 5%. Auch die Text- und Spracherkennung agieren mittlerweile auf einem sehr hohen Niveau. Man unterscheidet zwischen symbolischer KI und Konnektionismus. Die symbolische KI arbeitet auf der Basis der Daten, die in ihrem System verankert sind, darüber hinaus ist sie nicht in der Lage, Schlussfolgerungen zu ziehen oder dazuzulernen; maschinelles Lernen nennt sich das - anders als bei dem Modell des Konnektionismus. Hier wird die KI nicht von Beginn an programmiert, eher lernt sie auf ihre eigene Weise, eine Aufgabe zu lösen. Ihre Fähigkeiten entwickeln sich also innerhalb eines Lernprozesses. Künstliche Neuronen werden weitgehend zufällig und mit unterschiedlicher Gewichtung in verschiedenen Schichten miteinander verschaltet. Dann lässt man diese Input verarbeiten und beurteilt das Ergebnis während der Lernphase. Entspricht es dem gewünschten Ergebnis, werden die Verschaltungen verstärkt. Liefert das System ein abweichendes Ergebnis, werden die Verschaltungen abgeändert. Dieser ganze Prozess heißt Deep Learning.
Bei einer Gesichtserkennungssoftware in der Lernphase wird die KI mit Bildern „gefüttert“, die vorher alle von Menschen klassifiziert wurden. Anfangs wirkt das Ergebnis rein zufällig. Je mehr Bilder die KI auswertet, desto präziser kann sie geschult werden, Gesichter auf den Bildern zu erkennen, indem korrekte Ergebnisse durch Verstärken der neuronalen Verbindungen unterstützt werden und bei negativen ErgebnissenAnpassungen vorgenommen werden.
Und genau nach diesem Prinzip funktioniert KI in der Bildbearbeitung. Das Ziel hier ist es, zeitraubende Prozesse zu übernehmen, zu beschleunigen und sogar zu optimieren gegenüber der manuellen Bearbeitung. Die KI kommt in vielen Bereichen zum Einsatz, die bekanntesten Programme für Bildbearbeitung stützen sich mittlerweile auf diese Technik. Viele der Programme bieten Funktionen für die Gesichtserkennung, automatische Retusche, Auswahlwerkzeuge, die Motive eigenständig erkennen, automatische Korrektur der Helligkeit und Sättigung und anderer Parameter. Apple, Google, Adobe und viele mehr setzen bei der Bildersuche auf Machine Learning. Der Markt ist hier nicht nur für Experten ausgerichtet, die Anwendungen werden immer benutzerfreundlicher, sodass auch Einsteiger problemlos mit den Funktionen umgehen können. Zum Teil beginnt das schon bei der Aufnahmetechnik; Smartphone-Kameras werden immer leistungsstärker und sind ausgestattet mit hochauflösenden Kameras und komplexen Modi für bestimmte Aufnahme-Situationen.
„Sensei“ ist die Technologie von Adobe für Künstliche Intelligenz. Die Kernprogramme Photoshop, Illustrator und Indesign sind voller automatischer Werkzeuge. Als Beispiel habe ich Photoshop ausgesucht und stelle einige der intelligenten Tools vor. Bei einer Portrait-Aufnahme können mit der Option „Verflüssigen“ leicht Anpassungen vorgenommen werden. Dieses Werkzeug ist darauf trainiert, Gesichter zu erkennen und einzelne Elemente
Diese Abbildung wurde aus urheberrechtlichen Gründen von der Redaktion entfernt.
Abbildung in dieser Leseprobe nicht enthalten
Abb.6: Funktionen im Bereich „Verflüssigen“ darin zu verändern. Alleine an einem Auge lassen sich fünf Parameter verstellen, nämlich die Größe und Breite der Augen, die Höhe, Neigung und der Augenabstand. Bei dem in dem SchnellauswahlWerkzeug enthaltenen Option „Motiv auswählen" wird automatisch nach hohen Kontrasten und definierten Kanten gesucht. In der Praxis kommt es auf das Bild und die darin erhaltenen Objekte an, wie gut es funktioniert.
Der Rundzeichenstift kann sowohl gerade Pfade als auch Kurven erstellen, er orientiert sich dabei intuitiv an den im Bild enthaltenen Kanten und Kontrasten. Mit dem automatischen Ausbessern- Werkzeug können Bereiche ausgewählt und durch eine andere Stelle aus dem Bild ersetzt werden. Bei Skylum lässt sich durch künstliche Intelligenz ein Bild mit schlechter Auflösung hochskalieren für eine klarere Darstellung und ein besseres Druckergebnis. Auch hier lassen sich Bilder nach unterschiedlichen Faktoren klassifizieren. Eine intelligente Erkennung und Segmentierung von Bildbereichen ermöglichen automatische Korrekturen, unterbelichtete Fotos lassen sich ebenfalls automatisch korrigieren.
Auch bei vielen anderen Bildbearbeitungsprogrammen lassen sich solche Funktionen finden, die nach ähnlichen Prinzipien funktionieren. 411 Millionen Treffer zeigt Instagram unter dem Hashtag #selfie an.
Abbildung in dieser Leseprobe nicht enthalten
Laut Statista gab es 2019 weltweit etwa 3,2 Milliarden Smartphone-Nutzer - Tendenz steigend. Das iPhone 11 ist mit drei Kameras ausgestattet: einer Weitwinkelkamera (der Hauptkamera), einer Ultra-Weitwinkelkamera und einem Tele-Modul. Beeindruckend sind vor allem die Portrait-Funktion und der Nachtmodus. Unter anderem sind solche Optimierungen möglich, indem Apple ihre Algorithmen in die Hardware integriert - so besteht ein Chipsatz nicht mehr nur aus CPU und GPU, also Rechen- und Grafikeinheit, sondern zusätzlich auch aus einer neuronalen Recheneinheit (NPU). Einzelne Teile der Aufgabe können nun gleichzeitig und nicht mehr nacheinander bearbeitet werden, Bilder und Sprache werden schneller und besser analysiert und ausgewertet, das System lernt automatisch dazu und ergänzt sich selbst.
Ähnliche Funktionen bietet auch das Huawei P20 Pro, im Nachtmodus werden Kontraste und unerwünschte Extremwerte ausgeglichen, der Selfie-Modus ist mit einer 3D-Gesichtsmodellie- rungstechnologie ausgestattet, die vollautomatisch die Lichtverhältnisse für die Portrait-Fotografie anpasst, der Auto-Fokus ist extrem stabil, da er die Bewegungen im Bild „voraussagen“ kann. Die Bilder werden bei der Aufnahme nach bis zu 19 verschiedenen Faktoren klassifiziert und dabei optimiert. All das funktioniert auf Basis der Bilderkennung durch die Machine Learning-Technologie.
Künstliche Intelligenz ist ein fester Bestandteil vieler Bereiche, aus der Bildbearbeitung ist sie kaum noch wegzudenken. Und doch stehen wir erst am Anfang unserer Möglichkeiten, vieles muss noch verstanden und verbessert werden.
Die Vorteile, die künstliche Intelligenz mit sich bringt, sind vielfältig. Im Gesundheitswesen unterstützen Algorithmen schon beim Diagnostizieren von Krankheiten, schlagen passende Behandlungsmethoden vor und entlasten so das oft unterbesetzte Personal. Neuerdings arbeitet das Landeskriminalamt mit einer neuen, auf KI-Technologie basierende Software um das Internet nach Kinderpornografie zu durchsuchen. Im Alltag begegnet uns Künstliche Intelligenz als Email-Spamfilter, bei sprachgesteuerten Geräten, Netflix generiert auf unser Nutzerverhalten angepasste Empfehlungen. Uns wird personalisierte Werbung angezeigt, Google übersetzt unsere Sätze mittlerweile mit etwas mehr Sinn als noch vor wenigen Jahren.
Stark vereinfacht soll KI Aufgaben übernehmen, die wir nicht ausführen möchten, den privaten und beruflichen Alltag erleichtern und uns unterhalten. Die intelligenten Funktionen bei der Aufnahme und Bearbeitung von Fotos sparen ebenfalls viel Zeit und Know-How.
Vorteil und Nachteil liegen hier teilweise sehr nah beieinander. Bedenken, diese Entwicklung könnte zu Datenmissbrauch und einer Überwachungsgesellschaft führen, sind allgegenwärtig. Personalisierte Werbung kann das Konsumverhalten beeinflussen, Systeme können gehackt werden. Amazon arbeitete 2014 an einem Projekt, in dem eine KI passende Bewerber für eine freie Stelle finden sollten. In der Vergangenheit wurden Frauen (und werden es noch) bei der Suche nach Bewer- ber*innen benachteiligt oder gänzlich übergangen. Das steckte in den Trainingsdaten für den Lernprozess der KI und führte dazu, dass in diesem Projekt Männer bevorzugt wurden. Chinesische Wissenschaftler*innen entwickelten ein neuronales Netzwerk mit dem Zweck, potentielle Straftäter zu erkennen - vermeintlich. Denn die KI lernte nicht, physiognomische Parameter von einander zu unterscheiden, sondern erkannte lediglich die Sträflingskleidung, da zur Übung Bilddatenbanken von Gefängnissen verwendet wurden.
Es gibt einige Beispiele für das Versagen künstlicher Intelligenz, in vielen Fällen sind sich Experten aber einig, dass weitere Forschung und rege Kontrolle zu einer positiven Entwicklung führen werden. Darüber hinaus braucht es klarere Strukturen, was den Datenschutz im Netz angeht.
Was diese Entwicklung speziell für die Berufsfelder Fotografie und Grafik Design bedeuten, lässt sich auch nur vermuten. Was Menschen aber weiterhin von den Fähigkeiten der KI unterscheidet, sind kreative Ideen, abstraktes Denken und Talent. Durch die Digitalisierung, die sinkenden Kosten für technische Produkte und der durch das Internet kostenlose Zugang zu allen möglichen Informationen haben sich diese Berufe bereits maßgeblich verändert und es gibt immer neue, bis dato unbekannte Arbeitsfelder, die verloren gegangene ersetzen.
Die Forschung arbeitet mit Hochdruck an neuen Lösungen, die Entwicklung wird sich weiterhin dank sinkender Kosten für Rechenleistung und einem exponentiellen Wachstum der Daten beschleunigen. Die Rede ist von autonomen
Verkehrsmitteln im Alltag, Robotern als Haushaltshilfen, intelligenten Apps und Geräten, die den Gesundheitszustand überwachen und in der Medizin assistieren. Auch im Bildungssektor und bei Verwaltungsangelegenheiten wird die Künstliche Intelligenz Fuß fassen. Speziell in der Bildbearbeitung kann man davon ausgehen, dass immer mehr Prozesse automatisiert werden. Es wird daran gearbeitet, inhaltsbasiertes Füllen nicht nur aus einem Durchschnitt der umliegenden Pixel möglich zu machen, sondern Bilddatenbanken nach entsprechenden Werten zu durchsuchen und daraus Inhalte zu beziehen. Auch erwähnenswert sind Funktionen, die Bilder automatisch kolorieren können und Programme, die Gesichter immer realistischer generieren können.
Natürlich benutze ich lieber die automatischen Auswahlwerkzeuge, als viel Zeit darauf zu verwenden, ein Objekt manuell auszuwählen bevor ich mich den kreativen Aufgaben zuwenden kann. Generell bin ich der Ansicht, dass der Anwendung von KI zur Unterstützung von kontrollierten Prozessen nichts entgegenzusetzen ist. Gedanken mache ich mir über die Entwicklung der Berufe in den Bereichen Fotografie, Medientechnik und Grafik Design. In meinem Bekanntenkreis gibt es mehrere Personen, die sich ohne Ausbildung in diesen Feldern selbstständig machten und damit erfolgreich sind - da stelle ich mir die Frage, in wie weit es heute überhaupt noch fundiertes Wissen braucht, wenn Anwendungen immer benutzerfreundlicher werden und Laien ohne viel Aufwand hochwertige Fotografien erstellen können. Interessant finde ich auch die Debatten um Ethik und Recht im Bezug auf Künstliche Intelligenz. Wie weit dürfen wir die Kontrolle an selbstlernende Maschinen abgeben? Was ist tatsächlich möglich und wo fängt Science Fiction an? Ich denke, mit einem transparenten, bewussten Umgang, Kontrollen und Sachverständnis können wir den besten Nutzen aus diesen Technologien ziehen.
Quellen: „Künstliche Intelligenz“ von A. Cornelius, Haufe Verlag, 1. Auflage 2019 https://www.sciencedirect.com/science/article/abs/pii/ S002073737880O492 https://www.docma.info/blog/ki-in-der-bildbearbeitung-wirk- lich-intelligent https://www.youtube.com/watch?v=ya 6I9IVMzY https://www.youtube.com/watch?v=3RsmRMqX2IY https://www.docma.info/blog/ki-in-der-bildbearbeitung-wirk- lich-intelligenthttps://www.heise.de/hintergrund/Kuenstliche-Intelligenz-in- der-Bildbearbeitung-4631185.html https://www.adobe.com/de/sensei.htmlhttps://skylum.com/de/newsroom/skylum-creates-new-sky- lum-ai-lab-with-leading-aibased-image-editor-photolemur https://de.statista.com/statistik/daten/studie/309656/umfra- ge/prognose-zur-anzahl-der-smartphone-nutzer-weltweit/ https://www.instagram.com/explore/tags/selfie/https://www.giga.de/galerie/iphone11und 11 proimka- meratest-so-gut-sind-die-neuen-apple-smartphones-wirk- lich/#page=23 https://www.zeit.de/digital/mobil/2019-09/iphone-11-test- apple-kamera/seite-3 https://blog.1und1.de/2018/10/29/der-neue-a12-bionic-chip- von-apple-was-ist-die-neural-engine-und-was-bringt-sie/ https://mediamag.mediamarkt.at/detail/news/detail/News/ das-kann-der-ki-chip-beim-huawei-p20-pro.html https://consumer.huawei.com/de/phones/iYi/p20-pro/kame- ra/#buy https://www.ndr.de/nachrichten/niedersachsen/Kinderpornos- Kuenstliche-Intelligenz-hilft-Polizei,kinderpornografie182. html https://www.handelsblatt.com/technik/digitale-revolution/ handelsblatt-tagung-sieben-beispiele-fuer-kuenstliche-in- telligenz-im-alltag/24134058.html?ticket=ST-155273-9dUw- MXX6ysTK7ExhfLa4-ap3 https://www.zdf.de/nachrichten/heute/ki-convention-in- magdeburg-warum-kuenstliche-intelligenz-ein-gender-prob- lem-hat-100.htmlhttps://www.docma.info/blog/ki-in-der-bildbearbeitung-wirk- lich-intelligent https://www.heise.de/brandworlds/cloud-innovationen/allge- mein/2020-die-zukunft-der-kuenstlichen-intelligenz/ https://www.heise.de/hintergrund/Kuenstliche-Intelligenz-in- der-Bildbearbeitung-4631185.html
[...]
- Citation du texte
- Anonyme,, 2020, Künstliche Intelligenz (KI) in der Bildbearbeitung, Munich, GRIN Verlag, https://www.grin.com/document/1181162