DALL-E, Imagen und die Grenzen des guten Geschmacks
In der Popkultur ist das Prinzip von DALL-E und Imagen schon angekommen. Abseits der spaßigen Memes, können die neuen Grafik-AIs aber ordentlich Radau machen.
Wer eine Hand oder vielleicht sogar zwei besitzt, die dazu fähig sind, eine Idee in ein Bild umzuwandeln, dem stehen im Leben alle Tore offen. Arbeiten Daumen, Zeige- und Mittelfinger in Eintracht, bedarf es nicht vieler weiterer Hilfsmittel. Mit Pinsel, Farbe oder einer Kamera lässt sich all das kreieren, was denkbar ist. Und manchmal auch das, was darüber hinaus ragt. Nun heißen wir Grafik-AIs wie DALL-E oder Imagen in unseren Leben willkommen. Die schöne neue Welt ist da und die einst so weiten Tore für uns Menschen scheinen sich langsam zu schließen.
DALL-E: Die Berechnung des gewissen Etwas
Es ist ein wenig wie Magie, wenn man DALL-E mit dem ersten eigenen Wunsch füttert. Wie bei einem Golem wird ein unausgesprochener Befehl niedergeschrieben und dann in den Schlund der Grafik-AI geworfen. Die eigentliche Arbeit für uns Menschen ist damit bereits getan. Unser digitaler Diener arbeitet fortan unermüdlich daran, die geheime Anweisung auszuführen. Es wird abgeglichen, berechnet und interpretiert. Dann spuckt die AI ein Ergebnis aus. Für sie besteht es nur aus Einsen und Nullen, wir aber sehen ein Bild. Ein Igel auf einem Skateboard, ein Politiker mit einem lustigen Hut oder das Bildnis eines Starbucks, gemalt von einem Post-Impressionisten.
Auf den ersten Blick ist das waghalsig, irrwitzig und kaum zu fassen. Manche mögen schon immer von solch einem hilfreichen Werkzeug geträumt haben. DALL-E oder Googles Gegenstück Imagen basteln ihre Werke dabei nicht einmal mit Klebstoff und Schere aus einzelnen Versatzstücken zusammen. Sie blättern nicht durch den Quelle-Katalog und schneiden die ideale Hose, das angesagteste Oberteil und das trendigste Paar Schuhe aus – sie lernen gleich den ganzen Katalog auswendig. Wer bei DALL-E „Denim-Look 90er“ eingibt, bekommt keine Kopie von Justin Timberlake und Britney Speers präsentiert, sondern eine Interpretation dieser dunklen Zeit. Die Maschine ist auf der Suche nach dem gewissen Etwas, das diese Magie möglich macht.

In der Fototheorie nach Roland Barthes heißt dieses gewisse Etwas Punctum. Es ist das Ungeplante. Das kleinste Detail, das ein Bild interessant macht und doch unverzichtbar für eine starke Reaktion auf das Werk ist. Das Punctum kann uns belustigen, aufregen oder zum Dahinschmelzen bringen. Es ist das, was ein Bild reizvoll macht. Man mag davon ausgehen, dass DALL-E und Imagen dieses gewisse Etwas nicht berechnen können, aber das Gegenteil scheint der Fall zu sein. Wir sehen keinen bedeutungslosen Pixelbrei, der uns von DALL-E und Imagen auf den Bildschirm gespuckt wird. Wir sehen die Visualisierung unseres Textbefehls. Mal weniger überzeugend, mal erschreckend nah an dem Bild, das zuvor nur in unserem Hirn zu hausen schien.
DALL-E: Text to Film und weitere Dystopien
Illustratoren, Fotografen und Künstler fürchten wegen DALL-E und Imagen nicht ohne Grund um ihren Lebensunterhalt. Die Möglichkeiten, die Grafik-AIs in der Zukunft bieten werden, sind für uns heute schlicht noch nicht fassbar. Die Stockfoto-Branche dürfte wohl als Erstes in die Knie gehen. Niemand klickt sich durch unendliche Seiten voller Bildern, wenn das benötigte Foto einer lachenden Frau auch einfach generiert werden kann. Und die Vorteile hören hier noch nicht auf. Dank DALL-E und Imagen sind auch keine lästigen Bildrechte mehr zu beachten. Es handelt sich ja schließlich um ein generiertes Bild einer Frau und nicht um eine echte Person. Die Textzeile wird das Fotoshooting ersetzen.

Aber wie weit wird sich dieses Spiel noch treiben lassen? Wie einst die Bilder, werden sicherlich auch DALL-E und Imagen eines Tages laufen lernen und bewegtes Material samt Ton berechnen können. Brauchen die Filmemacher der Zukunft also keine Kamera mehr, um den Citizen Kane des 21. Jahrhunderts zu „drehen“? Ein ausführliches Drehbuch mit genausten Beschreibungen könnte DALL-E und Imagen dafür schon ausreichen. Aber seien wir ehrlich, vermutlich werden die mit Erzähltheorie und Heldenreise gefütterten AIs auch einfach eigene Drehbücher schreiben können.

Also alles düster, eine Zukunft in Vantablack? Nicht unbedingt. Vielleicht werden sich die Maschinen überlisten lassen. Wir sollten nicht vergessen, dass das Wissen, aus dem DALL-E und Imagen ihr Fundament gebaut haben, immer noch dem menschlichen Geist entspringt. Van Goghs Sternennacht ist nicht berechnet worden, sie wurde mit Handeskraft gemalt. Ersetzen Grafik-AIs also Freidenker und Künstler, zerbirst dadurch möglicherweise ihre eigene Lebensgrundlage. Sie bekommen schlicht kein frisches Futter mehr. Das Ende der Fahnenstange wäre erreicht und das Zeitalter des Remixes endgültig angebrochen. Ein Zustand, den wir Menschen sicher nicht auf uns sitzen lassen würden.
Egal wie schlau DALL-E und Imagen auch werden: Das menschliche Punctum wird es sein, das ihre Algorithmen am Leben erhält. Unsere fleißigen Hände setzen auch in Zukunft die Grenzen des guten Geschmacks – sorgen wir also dafür, dass sie das Arbeiten nicht verlernen.