du liest den tech- und medien-newsletter von gregor schmalzried. find me on linkedin!
Simulierte Physis
1. EIN FOTO, WIE IN DEINER HAND
In etwa zwei Monaten und einer Woche jährt sich mein ganz persönlicher Holiday: Daunenjacken-Papst-Tag.
Das Bild hatte mich damals mehr beschäftigt als ich es für möglich gehalten hätte. Wenn der Bildgenerator Midjourney v5 zu so etwas imstande ist… Was wird dann erst Midjourney v6 leisten können?
Seit ein paar Wochen kennen wir die Antwort. Midjourney v6 ist in einer Beta-Version verfügbar — und hat bislang noch viele der gleichen Macken wie die Vorgängerversion (komische Finger und Verrenkungen, unklare Perspektiven und Proportionen). Seine größten Verbesserungen sind weniger offensichtlich, z.B. kann man Midjourney v6 sehr viel genauere Instruktionen geben als noch v5, und das Programm versteht die Beziehungen zwischen Gegenständen in komplexen Prompts dann besser.
Seinen großen Daunenjacken-Papst-Moment hatte Midjourney v6 bislang noch nicht.
Zumindest nicht öffentlich.
Aber wenn es darum geht, ob es ein Bild gibt, das mich genauso beschäftigt wie damals der Papst?
Dann schon.
Hier ist es.
Und hier ist noch eins.
Und noch eins.
Auf den ersten Blick ist vielleicht nicht ganz klar, was diese Bilder so außergewöhnlich macht. Wer lange genug hinschaut, findet auch hier Ungereimtheiten und Mini-Halluzinationen. Und die Qualität ist sogar schlechter als beim Daunenjacken-Papst.
Und doch fühlen sie sich realer an.
Ein User auf Reddit vergleicht das Betrachten der Bilder mit Klarträumen: “It seems so real that you don't question anything, until you become lucid (someone tells you its AI)...then you can see the little inaccuracies.”
Durch einen bestimmten Prompting-Prozess (“posted on Reddit in 2012, —s 0 —style raw —v 6.0”) verlieren die Bilder ihre KI-haftigkeit. Der glänzende, unnatürliche Look, der den Daunenjacken-Papst und so viele andere KI-Bilder auszeichnet, verschwindet, und ersetzt durch einen genauso spezifischen, aber viel vertrauter wirkenden Look: Den einer Smartphone-Kamera zwischen 2010 und 2020.
Was diesen Look so auszeichnet: Anders als so viele AI-generierte Bilder sehen diese nicht aus wie aus dem Nichts heraufbeschworen. Sie sehen aus wie aus wie versehentlich, daneben, beiläufig fotografiert, wie automatisch im Smartphone gefiltert und farbkorrigiert.
Die ganz spezielle Patina eines Smartphone-Fotos — das, was uns sagt “Dieses Foto war einmal auf einem Smartphone und dieses Smartphone hatte einmal jemand in der Hand” — wurde perfekt reproduziert.
Auch der Stil eines klassischen Analog-Fotos ist längst auf diese Weise imitiert worden.
AI-genierterten Inhalten fehlt oft das Gewicht, die Haptik. Synthetische Inhalte lassen sich nicht abtasten.
Diese auch nicht. Aber sie fühlen sich so an, als ob.
2. RABBIT
Nein, ich habe keinen “Rabbit r1” bestellt. Vermutlich hätte ich gar keinen gekriegt, selbst wenn ich einen gewollt hätte.
Aber es ist spannend, dass ausgerechnet dieses Gerät so viele Menschen fasziniert.
Für die, die nicht dabei waren: Ähnlich wie der Humane Pin soll der rabbit r1 ein physisches Gerät für das AI-Zeitalter sein, ein Tamagotchi für Arbeit im 21. Jahrhundert.
Die erste Charge von 10.000 Geräten ist bereits ausverkauft — und man muss nicht lange suchen, um Leute zu finden, die den Rabbit r1 zu einer Hyper-Giga-Revolution hochjazzen.
Jenseits der Hyper-Giga-Welt wird der Rabbit r1 wahrscheinlich eher ein nettes Spielzeug mit ein paar seltsamen Design-Ideen und fraglichem Nutzwert sein.
Warum trotzdem so viele deswegen durchdrehen?
Ich glaube: Weil er das Internet wieder haptisch machen soll.
Software is eating the world, und Software hat keine haptische Struktur. Sie ist immer gleich glatt, flach und kalt. Unsere Smartphones haben sich seit fünfzehn Jahren nicht verändert. Der einzige Unterschied zwischen meinen mobilen Setups 2011 und 2024 ist, dass meine Kopfhörer keine Kabel mehr haben (also sogar da ist Haptik verloren gegangen).
Aber ein physisches Gerät, verspricht Kontrolle.
Der Rabbit r1 ist deshalb so interessant, weil er die Nostalgie nach einer vergangenen Zeit verkörpert. Einer Zeit, in der das Internet einen Körper hatte. Und wir es noch kontrollieren konnten.
3. GRAS SIMULIEREN
Wir alle wollen in der physischen Welt existieren. Wir wollen da sein, wo andere auch sind. Gras berühren.
Es ist kein Zufall, dass unsere Tech-Boom-Zeit gleichzeitig eine Experience-Boom-Zeit ist. Es gibt immersive Theatershows wie The Burnt City, Alle-gehen-zusammen-hin-Popkultur-Events wie die The Eras-Tour und Barbenheimer, die TeamLab-Ausstellungen in Asien. Sportarten und Hobbys boomen so sehr, dass permanent neue erfunden werden müssen und eine neue Form von “Offline-Apps” (Breeze, Soon) ist explizit dafür konzipiert, Menschen in der physischen Welt zusammenzubringen.
Wir haben Sehnsucht nach der analogen Welt. Nach der dreidimensionalen, physischen, porösen, physischen Welt.
“You can read everything there is in the world about a place, but there is no substitute for smelling it.” Bill Wolfer.
AI-simulierte Realität und physische digitale Gadgets sind was passiert, wenn diese Sehnsucht im digitalen Raum verarbeitet wird.
Die Experience Economy wird bleiben, mit dem weiteren Aufbäumen der AI-Revolution werden physische Meetings, Konferenzen, Tischtennisspiele immer wichtiger werden.
Aber es wird auch mehr Versuche geben, Physis zu simulieren. Die Eigenheiten der analogen Welt digital nachzubauen: Das Gefühl, etwas Echtes zu sehen. Etwas, das es nur einmal gibt.
In einer digitalen Welt, in der synthetische Inhalte sich quasi unendlich skalieren lassen, werden nicht-skalierbare Dinge wertvoll, weil sie nur begrenzt existieren.
NFTs mögen als Investment und Kulturobjekt fürs Erste ein ziemlicher Flop gewesen sein. Aber der Gedanke dahinter ist es einfach, virtuelle Gegenstände unterscheidbar und einzigartig zu machen. Und dieser Gedanke ist groß genug, um sich festzusetzen.
Nächste Woche geht die Apple Vision Pro auf den Markt. Die scheinbare Killer-App bisher: Die eigenen Erinnerungen zu durchleben.
3.500 Dollar, für ein bisschen falsche Physis in einer virtuellen Welt.
Außerdem
My work
Ich war zu Gast in Gavin Karlmeiers Podcast Haken Dran. Gavin ist die smarteste Social Media-Person, die ich kenne und es war eine Ehre, mit ihm über MrBeast, Nicki Minaj und AI zu sprechen. Spotify, Apple Podcasts.
Der KI-Podcast, den ich für die ARD mit Marie Kilg und Fritz Espenlaub hoste, ist aus der Winterpause zurück – mit Prognosen für das neue Jahr und dem Monsterthema Urheberrecht. Spotify, Apple Podcasts, ARD Audiothek.
Wir sind außerdem mit dem KI-Podcast live beim SWR Podcastfestival in Mannheim am 3. Februar! Wer vorbeischauen möchte — Tickets gibt es auf swr.de.
Ich war dieses Jahr wieder sehr gerne auf der DLD-Konferenz in München — mein Lieblingsthema: Ein Projekt, jüdische Texte in LLM-Form zugänglicher zu machen. War eine große Freude, für BR24 mit den Projektleitern zu sprechen. br.de
AI und Text / Large Language Models
Es gab zuletzt eine Menge Storys über Kundendienst-Chatbots, die wilde, lustige und nicht brand-safe Dinge tun, z.B. den eigenen Arbeitgeber beleidigen. LLMs sind ohne rigoroses Aufsetzen meist ein bisschen unberechenbar, deshalb ist ihre beste Anwendung auch immer noch im Backoffice. the-decoder.de gizmodo.com
Was haben AI-Unternehmen mit Verlagen und Nachrichtenanbietern vor? Interessanter Read, und erneut keiner, der viel Confidence für die Medienbranche verspricht. nymag.com
Ist es legal, einen echten Menschen als Vorbild für einen Chatbot zu verwenden? politico.com
Die sechs Arten von LLM-Gesprächen. nngroup.com
AI Sleeper Agents. Deep Dive, worth it. astralcodexten.com
Microsoft glaubt so sehr an seinen KI-Assistenten Copilot, dass die Windows-Tastatur dafür umdesigned wird. Meine eigenen Erlebnisse mit Copilot waren bisher okay, aber auch holprig. GPT-4 via ChatGPT Plus fühlt sich im Moment immer noch wie das beste LLM an, das zur Verfügung steht. br.de
AI und Arbeit
Duolingo ersetzt menschliche Arbeitskräfte durch AI. washingtonpost.com
Eine preisgekrönte japanische Schriftstellerin “enthüllt”, dass sie ihren Roman teilweise mit ChatGPT geschrieben hat. Diese Nachricht sollte sich so normal anfühlen, wie dass sie eine Tastatur benutzt hat. thedailybeast.com
AI x Cybercrime x 2024. thenextweb.com
AI und Bild/Video/Audio
Der immer lesenswerte Bas Grasmeyer mit einem Rundumschlag zum Wesen von Musik und Musikern in der AI Age. musicx.substack.com
Linkin Park-AI covert Somebody That I Used to Know. youtube.com
Neue Google-Reverse-Bilder-Suche: Kreise was auf einem Screenshot ein, und finde mehr dazu heraus. Was treibt eigentlich Apple? google.com
AI und alles andere
Das französische LLM-Startup Mistral ist mehr Blicke wert — es gibt viel Buzz auch unter Entwicklern. Bin sehr gespannt, was da noch kommt. unite.ai
Über die Kosten und die physischen Ansprüche von AI-Datencentern. insider.com
Spotifys menschenkurierte Playlists verlieren Einfluss gegenüber AI-generierten Playlists. bloomberg.com
Ein AI-System namens AlphaGeometry ist im Lösen von Geometrie-Aufgaben beinahe so gut wie der beste Mensch. Ein big deal! understandingai.org
Media
Die New York Times und ihr erstaunlich erfolgreicher Fokus auf Spiele-Inhalte (keine Videospiele). vanityfair.com
Schöner Text über Spatial Interfaces (passt zum Thema der heutigen Kolumne :) ). darkblueheaven.com
Snapchat Streaks als Liebesbeweis. theguardian.com
Warum sich Twitch so schwertut (Kurzfassung: YouTube wurde zu Twitch, bevor Twitch zu YouTube werden konnte). fastcompany.com
Tech
Where have all the websites gone? fromjason.xyz
Casey Newton argumentiert, warum er Substack verlassen hat. Charles Arthur argumentiert, warum er noch da ist. platformer.news, socialwarming.substack.com (Author’s Note: Substack, die Plattform, auf der auch dieser Newsletter gehostet ist, ist zuletzt massiv in die Kritik geraten. Da weder Substack noch ich mit diesem Newsletter Geld verdienen und ich auch die Charles Arthur-Perspektive nicht uneinleuchtend finde, habe ich mich fürs Erste entschieden, mir nicht den Aufwand eines Umzugs aufzuhalsen. Das könnte sich aber noch ändern.)
Der stille Tod des großen Traums von Ello (Nostalgie kickt). waxy.org
2024 Tech Strategy Toolkit. platforms.substack.com
Dystopia
Themen, die in China zensiert werden, sind auch auf TikTok unterrepräsentiert. nytimes.com
“Geschichtsfälschung im Zeitraffar”. Ein Teil der Anti-Israel-Bewegung leugnet systematisch die Anschläge des 7. Oktober. 9/11-Verschwörungstheorien für eine neue Generation. tagesspiegel.de
🤚,