hier ist cool genug, der tech- und medien-newsletter von gregor schmalzried.
ich bin im oktober viel unterwegs — you can catch me vor und nach meinen talks am
6.10. — auf dem evangelischen medienkongress in frankfurt
12.10. — auf dem br podcastfestival in nürnberg
24. und 25.10. — auf der dkm in dortmund
26. und 27.10. — auf den medientagen in münchen
Der iPhone 4-Moment
1. HYPE
War es das jetzt bald mit dem AI-Hype?
Man sollte meinen, allmählich müssten wir wirklich den Peak erreicht haben. Gartner platziert “Generative AI” schon seit dem Sommer ganz oben auf seinem “Hype Cycle” — an dem Punkt also, an dem ein böses Erwachen unausweichlich ist.
Tatsächlich läuft die KI-Hype-Maschine gerade, nach einem kurzen Sommerloch, erneut heiß. Ob neue Milliarden-Investitionen von Amazon, ob eine 90 Milliarden-Bewertung von OpenAI, ob eine stetige Versorgung unserer Feeds mit neuen viralen KI-Tools wie HeyGen… Überall werden neue Aufmerksamkeitsrekorde aufgestellt.
Wie lang kann das noch so weitergehen?
In letzter Zeit habe ich ab und zu Sätze gehört, die mit “Wenn der Hype dann etwas abebbt…” o.ä. begonnen haben. Teilweise habe ich die sogar selbst gesagt. Oops. Es liegt in der Natur der Sache. What goes up, must come down.
Erste Anzeichen dafür gibt es ja schon.
ChatGPT hat zwar die 100 Millionen Nutzer schneller geknackt als jede andere Consumer-App — tut sich aber viel schwerer damit, diese Nutzer zu halten.
Ist das nicht das Zeichen dafür, dass die ganze KI-Nummer schon längst auf eine überfällige Korrektur zuläuft?
Nicht unbedingt.
Wenn ich versuche, die Lage nüchtern zu betrachten — jenseits von den üblichen Hype-Debatten — gibt es eigentlich kaum einen Grund anzunehmen, dass der KI-Zug in den nächsten 12 Monaten abbremsen wird. Eher im Gegenteil.
Denn ChatGPT hat einen wesentlichen Unterschied zu YouTube, Instagram und Co: ChatGPT ist eigentlich gar keine Consumer-App. ChatGPT ist eine Tech-Demo, die so großartig funktioniert, dass sie die Welt im Sturm erobert hat. Dass generative KI aktuell schon so ein großes Thema ist, gleicht einem Wunder. Denn wirkliche Produkte hat die Industrie noch kaum gebaut.
Und das ändert sich gerade.
2. DER IPHONE-MOMENT
Oft wird ChatGPT als der “iPhone-Moment” für KI beschrieben. Eine bahnbrechende neue Veröffentlichung, die alles verändert.
Was dabei gerne vergessen wird:
Ja, das iPhone hat alles verändert. Aber nicht sofort.
Tatsächlich war Apple noch bis ca. 2010, also drei Jahre nach dem ersten iPhone eher ein Underdog im Smartphone-Geschäft. Etablierte Player wie Nokia und LG bestimmten den Markt. Und das erste iPhone — dieses angeblich revolutionärste aller Geräte — wurde nur etwa 6 Millionen Mal weltweit verkauft.
Ein Wunder ist das nicht. Denn das erste iPhone war — auf seine Art — ein bisschen Murks.
Zum Beispiel hatte es
eine lausige Kamera, die nicht einmal Video aufnehmen konnte
kein Multitasking
keine Apps
keine Selfiekamera
sehr schlechte Performance im Vergleich zur Konkurrenz
Diese Probleme waren von Anfang an klar. Jeder wusste: Das iPhone ist noch nicht wirklich fertig.
Das änderte sich 2010 — mit dem iPhone 4. All die großen Probleme waren endlich behoben — und das iPhone 4 gilt heute als wegweisendes Gerät, möglicherweise als das beste iPhone aller Zeiten und auf jeden Fall dasjenige iPhone, das den Status von Apple als Smartphone-Übermacht ankündigte.
ChatGPT ist noch nicht so weit. Zumindest nicht das ChatGPT, das die Welt bisher kennengelernt hat. Das hat nämlich
ein lausiges Gedächtnis
kein Verständnis für Bild und Video
keine Verbindung zum Internet
keine Verbindung zu meinen privaten Datenbanken
keine Anschlussmöglichkeiten an andere Software
keine Bedienungsanleitung (eine Software, die ihre User mit nichts als einem einschüchternden leeren Textfeld begrüßt, für die man “Prompt Hacking” betreiben muss, um sie richtig zu bedienen… ist keine fertige Software)
ChatGPT ist ein bisschen Murks, so wie das erste iPhone Murks war.
Dass ChatGPT so erfolgreich ist, liegt vor allem an den Usern — nicht am Produkt. All die Wissensarbeiter, Schülerinnen, Studenten und Software-Entwicklerinnen mussten sich ChatGPT selbst aneignen.
Dass sie trotzdem Geld dafür zahlen — angeblich schon um die 80 Millionen Dollar im Monat, ist wirklich beeindruckend. Was passiert also erst, wenn ChatGPT eine richtige Software wird?
3. AUGEN UND OHREN
OpenAIs ChatGPT, Microsofts Copilot und Googles Bard bemühen sich gerade alle darum, die offensichtlichen Probleme mit Large Language Models zu beheben. Und die Ergebnisse sind jetzt schon verblüffend.
Google gibt Bard Verbindungen in die persönliche Cloud — in Zukunft soll der Chatbot private Cloud-Files und Emails auswerten können.
Das bedeutet: Bard kann multimodal arbeiten, und sich mit verschiedenen Google-Services wie Drive, YouTube, Flights, Maps oder auch einfach der Bilderkennung und Google-Suche vernetzen. Folgende zwei Bilder habe ich selbst im Island-Urlaub gemacht — und Bard ganz ohne Metadaten analysieren lassen.
Auch OpenAI hat endlich eine multimodale Variante von ChatGPT angekündigt — also ein Update, mit dem ChatGPT Bilder erkennen und auswerten kann. Es ist noch nicht frei verfügbar, aber die ersten Demos sind der schiere Wahnsinn: In diesem Video etwa codet ChatGPT eine funktionsfähige Website — nur auf Basis eines mit der Hand erstellten Tafelbilds. In einem anderen Beispiel liefert ChatGPT die Interpretation und Analyse eines komplexen Comics.
Bereits frei verfügbar ist das ChatGPT-Web-Browsing-Tool — das kann jetzt googlen, wer Gregor Schmalzried ist und ihn auf größtenteils schmeichelhafte Weise mit Einstein und Godzilla vergleichen.
Das Spannende an all diesen Beispielen: Keines von ihnen ist per se neu. Wir wussten schon vorher, dass KI Texte lesen und Formen erkennen kann, oder dass man ein gecropptes Urlaubsbild auf Google Lens hochladen kann und Google uns dann erzählt, welche Jacke darauf zu sehen ist.
Was neu ist: Wie seamless diese Technologien jetzt arbeiten. Wie simpel wir mit ihnen reden können. Wie selbstverständlich sie sich bald mit allen gängigen Enterprise-Software-Produkten zusammenschließen werden. Und alles was es dafür brauchte, war der Abbau der offensichtlichen Probleme der ersten ChatGPT-Generation.
Was folgt, ist die Zeit der Produkte:
Warum bietet eine News-Website keinen gepaywalleten Chatbot an, der mir von allen noch so obskuren News-Storys der deutschen Nachkriegsgeschichte erzählt?
Warum baut Payback keinen Scanner in seine App, mit dem ich den Lageplan eines Einkaufszentrums abfotografieren kann und dann erfahre, in welchen Läden es Punkte gibt?
Warum gibt es noch keine SEO-Beratung für KI-Chatbots?
4. DER IPHONE 4-MOMENT
Ende 2022 bis Anfang 2023 war der iPhone-Moment für generative KI.
Ende 2023 bis Anfang 2024 könnte der iPhone 4-Moment für generative KI werden.
Zu lange ging es nur darum, KI als Zaubershow zu inszenieren. Damit Gedichte und Tabellen herzuzaubern.
Jetzt geht es an die Anwendungen. An das, womit Menschen und Organisationen wirklich arbeiten werden. Customer-first statt Technology-first.
Hype hin oder her — das hier ist noch lange nicht vorbei. Es hat gerade erst begonnen.
Außerdem
Gregor-Promo
Zusammen mit Marie Kilg und Fritz Espenlaub hoste ich für die ARD den wöchentlichen KI-Podcast auf Spotify, Apple Podcasts und in der ARD Audiothek. Für Menschen mit wenig Zeit empfehle ich aktuell die Folge vom 6.9.: Kriminelle KI – True Crime oder Science-Fiction?
Ich war zu Gast im Startup Insider-Podcast.
Zum International Podcast Tag habe ich für Podstars zusammen mit vielen tollen Podcast-Leuten meine Gedanken zum Stand der Branche geteilt.
KI-Anwendungen
Ghostwriter, der Schöpfer des Drake KI-Hits Heart on my Sleeve hat seinen Song für die Grammys eingereicht — und plant weitere Releases. nytimes.com
Meanwhile zerstreitet sich das Harry Styles-Fandom in der Frage, ob angebliche Song-Leaks echt sind oder KI-generiert. 404media.co
In Spanien macht ein Skandal rund um KI-generierte Nacktbilder von Schülerinnen nationale Headlines. netzpolitik.org
Der “Kölner Express” hat für synthetisch erstellte Texte eine Midjourney-bebilderte Autorin erfunden — Name “Klare Indernach”, Initialen “KI”. heise.de
Spotify will Podcastern die Möglichkeit geben, ihre Podcasts automatisch in andere Sprachen zu übersetzen — inklusive Stimm-Klon. Interessanter Proof of Concept, Real-World-Nutzwert wohl eher gering. Niemand will eine deutschsprachige Joe Rogan-Maschine hören. theverge.com
Chinas ChatGPT-Konkurrenten nehmen Fahrt auf — und behaupten, dass Taiwan kein Land sei. bloomberg.com
Meta plant Chatbots mit Persönlichkeiten für die neue Zielgruppe — wohl eine Antwort auf Snapchats My AI (und damit auch auf Replika) theverge.com
KI-Hintergrund
Was OpenAI auf seinem Bewertungshöhenflug noch aufhalten könnte. neunetz.com
“Confessions of a Viral AI Writer” — mächtige und großartige Geschichte über die kurzlebige Ära von KI-unterstützter Fiction, und was passiert, wenn AI bessere Worte findet als ein Mensch. wired.com
KI-Unternehmen im Silicon Valley kaufen sich Arbeit von Dichterinnen und Autoren ein — auch fürs Sammeln nicht-englischer Trainingsdaten. restofworld.org
Eine Reihe von Unternehmen versucht, den besten Detektor für KI-generierte Inhalte zu erzeugen — ein großer Durchbruch fehlt bisher. wired.com
Die New York Times setzt in der AI-Economy auf das ewige Captcha und mehr performte Menschlichkeit — Reporter und Autoren sollen stärker in den Vordergrund gerückt werden. vanityfair.com
Business
Die VideoDays haben sich vom Fan-Event zur B2B-Konferenz gewandelt. spiegel.de
Ein Großteil der NFTs ist aktuell wertlos. Wenn NFT-Technologie (die ich leider nach wie vor gut finde) es je zurück in die öffentliche Akzeptanz schaffen sollte, dann vermutlich erst nach einem Rebrand. dappgambl.com
“The Tyranny of the Marginal User: why consumer software gets worse, not better, over time.” nothinghuman.substack.com
Filmkritik-Aggregator Rotten Tomatoes war von massiven Manipulationskampagnen betroffen. vulture.com
Longread über die stolze Vergangenheit und unklare Zukunft der Googlesuche. theverge.com
LinkedIn und der eigenartige Trend zum Posten über Persönliches. businessinsider.com
Fandom
Im Jahr 2023 sind Konzerte auch eine digitale Experience — auch wenn man selbst physisch da ist. vox.com
Immer mehr erfolgreiche Romance-Romane beginnen als Fanfiction. vulture.com
Dystopia
Die Europäische Kommission sieht wenig Erfolg bei Maßnahmen gegen russische Propaganda auf Social Media. bbc.com
Zu viel Fitness-Tracking könnte indirekt zu einem gegenteiligen Gesundheitseffekt führen - oops. businessinsider.com
Fun
“A literary history of fake texts in Apple’s marketing materials.” maxread.substack.com
“I made a fake AI.” youtube.com
📱,