du liest cool genug — einen newsletter über digitale popkultur.
die aktuelle ausgabe meiner brand eins-kolumne dreht sich darum ob es je wieder ein neues großes soziales netzwerk geben wird, und wenn ja, ob es bereal sein könnte.
Was tun wir mit KI?
Kein Technologiefeld ist aktuell so spannend wie KI-Content-Generatoren.
Wie weit werden Midjourney, DALL-E und Stable Diffusion noch gehen, welche Möglichkeiten bieten sie, auf welche Limits werden sie stoßen? Zu diesen Fragen werden gerade haufenweise nachdenkliche Texte geschrieben (Link Link), u.a. von mir (Link). Auch scheint es keine Woche zu geben, ohne dass eine absurde KI-Konstruktion viral geht.
Was bei all dem ein bisschen untergeht: Wozu man diese Programme überhaupt gebrauchen kann.
Deshalb heute ein etwas anderes cool genug. Es folgen: Vier aktuelle Use Cases für KI-Bildcontent — für Kreative und Abenteurer.
Use Case 1. Veröffentlichung
Stargazer ist der Titel einer Graphic Novel-Reihe, die Autor Adam Rodriguez mithilfe von Midjourney und Photoshop zusammengestellt hat. Ich bin ehrlich — ob das Buch gut ist, weiß ich nicht. Aber dass es sie überhaupt gibt… und dass sie so aussieht, das ist ziemlich beeindruckend.
Wir sind mittlerweile an einem Punkt, an dem KI-generierte Grafiken völlig problemlos an verschiedensten Orten eingesetzt werden können, ohne dass es jemand merkt. Platformer, einer der wichtigsten Tech-Newsletter der Welt, illustriert seine Texte seit Längerem mit DALL-E. Die News-and-Opinion-Seite The Bulwark nutzt dafür Midjourney. cool genug, der Newsletter, den du gerade liest, natürlich auch.
Langweilige Stock Photos durch KI ersetzen ist mittlerweile easy. Und die Technologie wird täglich besser…
Use Case 2. Kreative Arbeit
Ich habe über die letzten Monate einen Fiction-Podcast geschrieben (früher nannte man es Hörspiel). Es wird ein sehr cooles Projekt, über das ich bald mehr verraten darf.
Als ich kürzlich versuchte, einen berühmten Schauspieler für eine Rolle im Podcast zu gewinnen, stellte ich ein Pitch-Dokument zusammen. Das hier war die Titelseite (der Titel selbst ist noch ein Geheimnis und deswegen geblurred):
Zur Einordnung: Jede der Grafiken auf dem Cover bezieht sich auf Szenen aus der Geschichte, und wäre gleichzeitig ein mögliches Cover-Motiv (ich habe noch circa einhundert Grafiken mehr in der Schublade, die Mood und Stimmung des Projekts transportieren).
Ob das jetzt wirklich jemanden überzeugt hat, bei dem Projekt mitzumachen, der sonst skeptisch gewesen wäre? Keine Ahnung. Aber es ist direkt klar, wie viel aussagekräftiger ein solches Dokument im Vergleich zu einem mit Stock Photos oder reinem Text ist.
Ich arbeite viel kreativ mit Text, und in den letzten Monaten ist es für mich zu einem Habit geworden, Ideen immer wieder mit KI zu visualisieren, während ich sie verfolge. Das ist einerseits ein ziemlicher Time and Money Waster (diese Programme machen verdammt nochmal süchtig), aber es ist auch eine Möglichkeit, eine sehr solitäre Arbeit zu einer Art Zwiegespräch zu machen. KI-Programme werden für die meisten Kreativen in nur wenigen Jahren selbstverständlich zum Werkzeugkasten dazugehören (insbesondere, sobald die Text- und Video-Programme so gut werden wie die Bild-Programme es jetzt schon sind).
Use Case 3. Herausforderungen finden
Während ich diesen Text schreibe, geht gerade zum ersten Mal ein KI-Content-Tweet von mir mittelviral. Ich habe nämlich DALL-E mit dem Wort “Wahlplakat” und diversen deutschen Parteinamen gefüttert und die Ergebnisse getwittert.
Die Bilder sind wirklich ziemlich lustig.
DALL-E hat seine Instruktionen offensichtlich verstanden — man weiß sofort, zu welcher Partei welches Plakat gehört. Nur hat DALL-E zwar eine grobe Ahnung, wie die Plakate der jeweiligen Parteien normalerweise aussehen, versteht aber weder, warum sie das tun, noch was Buchstaben sind oder wozu sie gut sein sollen.
Das führt dazu, dass DALL-E die Struktur, den Aufbau und den Look der Plakate täuschend echt nachbaut, sie aber mit bedeutungslosem Kauderwelsch füllt. So schickt die SPD ihre Kandidaten “Dal”, “Padonvdand” und “Dalras” ins Rennen, die Grünen fordern “Ogirrern” und “Gaaliic heems sihet” und die FDP setzt das Konterfei ihres nicht-existierenden Kandidaten stolz neben den besten Parteislogan aller Zeiten: “Wink Wak”.
Das Tolle an den Plakaten ist, dass sie nicht einfach wie Imitationen der Realität wirken, sondern wie Parodien davon. Alles daran — von den Alliterationen in “Wink Wak” und dem Grünen-Äquivalent “Glezn greizen” bis zu den möglichst harmlosen Politikergesichtern darauf — erzeugt die Illusion von Inhalt, nur wird durch die Intentionslosigkeit klar, wie leicht es ist, Inhalt durch reine Ästhetik zu faken.
Die Plakate sind das visuelle Äquivalent zu Loriots Bundestagsrede, in der Loriot einen Bundestagsabgeordneten spielt, der über mehrere Minuten so tut, als würde er etwas sagen, aber eigentlich nur die Satzstruktur und den Duktus einer echten politischen Rede nachahmt, ohne dabei je auch nur einen einzigen klaren Gedanken auszusprechen.
Wir Menschen, die wir wissen, was Buchstaben sind, und wozu Wahlplakate existieren, sollten diese Bilder genauso hämisch verstehen, wie sie wirken. Und daran denken: Wenn wir selbst etwas schreiben, schaffen, erstellen wollen… Holen wir wirklich alles heraus, was möglich ist? Oder bauen wir einfach nur inhaltsleere Standardbausteine aufeinander? Machen wir etwas Gutes? Oder machen wir “Wink Wak”?
Use Case 4. Eine neue Welt erkunden
KI-Contentgeneratoren können nur das zurückspielen, was ihnen vorher gegeben wurde. Auch wenn es oft so scheint, sie können nichts Neues erfinden. So gelangen wir zu Experimenten wie dem “Wink Wak”-Plakat und der Reproduktion menschlicher Vorurteile in Bildform.
Das bedeutet aber nicht, dass DALL-E, Stable Diffusion und Midjourney vorhersehbar sind. Im Gegenteil. Jedes der Programme hat seine eigenen Schrullen und Eigenarten, deren Ursprünge oft nicht einmal die Entwickler selbst kennn. Diese zu erkunden ist oft ziemlich lustig.
Unter einem Post im Midjourney-Subreddit, der eine “viktorianische Hackerin” zeigt, ist beispielsweise der Top-Kommentar: “They use this same girl A LOT”. Und es stimmt. Je mehr Zeit man in Midjourney verbringt, desto mehr fallen einem Muster und Eigenarten auf, die in anderen Programmen oder bei anderen Einstellungen nicht erscheinen.
Vor ein paar Monaten reichte ein Scherzkeks bei einer kleinen amerikanischen Kunstmesse ein Midjourney-Bild ein und gewann damit einen Preis. Wäre ich in der Jury gesessen, hätte ich das Bild sofort als Midjourney-Kreation erkannt — nicht nur, weil man mit der Zeit ein ganz gutes Gefühl für den spezifischen Midjourney-Stil entwickelt, sondern auch, weil fett in der Mitte des Bildes eine Art Portal zu sehen ist, das genau so schon drei bis sechsmal in meinen eigenen Midjourney-Bildern erschien. Woher dieses Portal kommt und warum die KI es so gerne mag? Keiner weiß es.
Die spooky Version dieses Phänomens ist “Loab”.
Ich empfehle, den gesamten unheimlichen Twitter-Thread zu lesen, aber die Kurzfassung ist, dass ein KI-Illustrator beim Herumspielen in Midjourney eine eigenartige Entdeckung gemacht haben soll: Die unheimliche Gestalt einer alten Frau, die über verschiedene Prompts und Programme immer wieder erscheint — ein Geist in der Maschine.
Es gibt ein paar gute technologische Theorien dazu, warum Loab immer wieder erscheinen könnte. Das ist die eine Hälfte der Geschichte. Die andere ist das, was Loab repräsentiert — eine Gruselgeschichte für die KI-Ära. Unser personifiziertes Unwohlsein mit maschinenerstellter Kunst.
Natürlich weiß eine KI nicht, was sie da in uns auslöst. Sie hat kein Bewusstsein.
Wenn eine KI ein Bild malt, und niemand ist da, um es zu sehen, ist es dann Kunst? Nein. Kunst entsteht erst in der Wahrnehmung durch uns Menschen.
Aber genau in dieser Wahrnehmung liegt der Wert und die Chance von KI-Kunst. Wenn wir uns aufmachen in den Kaninchenbau, und die Geschichten, Gefühle und Ideen ausgraben, die dort auf uns warten… Dann kann ich mir kein Technologiefeld vorstellen, aus dem in den nächsten Jahren aufregendere Geschichten kommen werden.
Außerdem
Content
Das nächste große soziale Netzwerk. brandeins.de
"BeReal ist Social Media für Leute, die Social Media hassen". augsburger-allgemeine.de
How TikTok’s pushy watermark boosted its brand—and hurt Instagram. fastcompany.com
Just a few people crowned some of YouTube’s earliest hits. theatlantic.com
TikTok creators are condensing Hollywood movies into minutes and getting millions of views. restofworld.org
The Verge launches an ambitious new site. theverge.com
Gordon Ramsay and Martha Stewart are being outperformed by Doña Angela, a grandma from rural Mexico. twitter.com
What China, Marvel, and Avatar Tell Us About the Future of Blockbuster Franchises. matthewball.vc
Web3
They built a Minecraft crypto empire. Then it all came crashing down. restofworld.org
DAOs are not corporations. vitalik.eth.limo
Menschen und Maschinen
How viral TikTok trends changed personal style. refinery29.com
Booksmart. dirt.substack.com
Wikipedia Speedruns. wikispeedruns.com
Memes
Wie ein Plüschpenis die Gamescom 2022 rettete. wasted.de
Dick the Birthday Boy: The Legacy Continues. youtube.com
Giorgia Meloni weaves anime and fantasy fiction into real-life politics. thefocus.news
Dystopia
Der Fortschritt und seine Feinde. spiegel.de
Zensiert Instagram iranische Regierungskritiker? br.de
Onlyfans Agenturen - der Einstieg in die Erotik- Branche? youtube.com
The Follower. driesdepoorter.be
TikTok’s CEO navigates the limits of his power. nytimes.com
The Unlikely Cure for Burnout? A Second Job. wired.com
📸,