du liest gregor schmalzrieds newsletter über ai, tech und media.
ich bin freier journalist, berater, speaker und host von der ki-podcast (ARD)
Der große Trenner
Seit Jahren wird auf Kongressen und in schlauen Essays diskutiert, was der nächste große Plattform-Shift sein wird: Virtual Reality? Web3? Voice?
Es sind LLMs.
Man kann sich dafür die Zahlen von Similarweb anschauen, wo ChatGPT mittlerweile Wikipedia und X überholt hat und die fünftmeistbesuchte Website der Welt ist:
Man kann auch Sam Altman zuhören – laut seinen Angaben ist ChatGPT mittlerweile zwischen 500 und 800 Millionen wöchentlichen Nutzern. (Man kann diese Zahlen skeptisch sehen, aber sie deckt sich mit öffentlich zugänglichen Daten.)
Wer sich dafür interessiert, wie “normale” junge Leute jenseits der Tech- und Medienwelt diese Technologie wahrnehmen, dem empfehle ich dieses sehr unterhaltsame TikTok:
Enable 3rd party cookies or use another browser
LLMs – aber ganz besonders ChatGPT als Marktführer und bestes Produkt – sind das wichtigste neue Massenmedium seit Social Media.
Der Erfolg liegt auch daran, dass ChatGPT scheinbar eines der wichtigsten Mantras von Steve Jobs verinnerlicht hat:
Für die Durchschnittsperson war es noch nie so leicht, AI zu nutzen. Das kommt mit positiven Folgen (eine mächtige Technologie wird zugänglich für immer mehr Menschen) und negativen Folgen (eine mächtige Technologie wird zugänglich für immer mehr Menschen, siehe diese aktuelle Story).
Aber der Erfolg von LLMs als Massentechnologie täuscht über eines hinweg:
Ja. Es war noch nie so leicht, in diese Technologie einzusteigen.
Aber es war auch noch nie so schwer, sie zu beherrschen.
1 DAS ENDE DES GREAT LEVELER
Eines der ersten Bilder, die im Gen AI-Diskurs 2023 bemüht wurden, war das des “Großen Gleichmacher” – der “Great Leveler”. Ethan Mollick schrieb im September 2023:
We already know one major effect of AI on the skills distribution: AI acts as a skills leveler for a huge range of professional work. If you were in the bottom half of the skill distribution for writing, idea generation, analyses, or any of a number of other professional tasks, you will likely find that, with the help of AI, you have become quite good.
Die Idee: AI erhebt die unterdurchschnittlich Guten auf ein Niveau des (mindestens) Durchschnitts, ist aber nicht stark genug, um die überdurchschnittlich Guten nennenswert zu unterstützen. Am Ende sind also alle in etwa gleich gut.
Diese Idee ist seitdem nur in Teilen bestätigt worden. Wir begegnen ihr noch am Ehesten im Text-Bereich: Nehmen wir die Gruppe der besten Autorinnen und Autoren. Wenn wir für dieses Beispiel ein sehr reduktives System nutzen, könnten wir sagen, diese Autoren hätten eine Qualität von 10/10. Damit sind sie immer noch besser als die beste AI, die es höchstens auf 7/10 schafft. Allerdings: Jeder 5/10, 3/10, 1/10-Autor kann dank AI auch auf 7/10-Niveau schreiben. Man ist nicht so gut wie die besten, aber man ist gut genug, um bei vielem mitzuhalten. (Deshalb lieben Studierende auch AI so sehr.)
In den meisten anderen Feldern scheint das Bild des “Gleichmachers” aber immer weniger zuzutreffen.
Der Entwickler Josh Collinsworth schrieb im Februar 2024 einen spannenden Text, an den ich immer noch oft denke: “I worry our Copilot is leaving some passengers behind”. Als einer der ersten formulierte er darin eine komplett gegenläufige These zum “Großen Gleichmacher”. Denn in Bereichen, wo es weniger ums Schreiben und mehr um komplexe Problemlösungen geht, hilft AI eben vor allem nicht den unterdurchschnittlich Guten. Sondern denen, die eh schon weiter oben sind. Weil nur die gut zwischen Stärken und Schwächen des Bots unterscheiden können.
I think the problem is that any tool like this (even one theoretically much more powerful) is most beneficial to those that need it the least and least beneficial to those that need it the most. If you're an expert you can identify the mistakes and they are not generally a roadblock. But if you're a novice you can't and you'll simply be unaware of any hallucinations.
In den Workshops, die ich regelmäßig zum AI-Einsatz gebe, fällt mir das immer wieder auf: Wer LLMs ohne genaue Kenntnisse über ihre Funktionen nutzt, der wird immer noch viel Nützliches damit machen können. Aber er wird auch ständig mit Problemen zu kämpfen haben.
Hier ist eine einfache Anfrage, die ich gestern an ChatGPT gestellt habe. Die Antworten klingen plausibel – tatsächlich sind alle drei Artikel aber komplett ausgedacht.
Wer einmal so ein Erlebnis hat, kommt schnell zu dem Schluss, dass ChatGPT für Anfragen dieser Art nutzlos ist – es denkt sich ja eh nur Sachen aus.
Dabei lässt sich das Problem sehr einfach beheben: Und zwar, indem man die integrierte Search-Funktion von ChatGPT einschaltet.
Mit Search kommt dieses Ergebnis:
Jetzt passt’s. Diese drei Artikel gibt es wirklich.
Man könnte also sagen: “Kein Problem, dann nutze ich einfach immer die Search-Funktion!”
Aber dann passiert vielleicht so etwas:
“Große Freude” und “Super Woman” als Entschuldigungspralinen? Wirklich?
In diesem Beispiel ist die Search-Funktion von ChatGPT eher kontraproduktiv. Anstatt wirklich über die Frage “nachzudenken”, sucht der Search-Agent erst im Netz nach Ergebnissen und versucht diese dann nachträglich zu meiner Frage anzupassen – auch wenn das nicht wirklich funktioniert.
Stellt man die gleiche Frage ohne Search, sind die Ergebnisse deutlich besser:
Wir stecken also in folgender Situation:
Es gibt eine ganze Menge Dinge, die ChatGPT und Co. theoretisch können. Man muss nur wissen, wie man sie dazu bringt, das auch wirklich zu tun.
Und deshalb scheinen diese Systeme auch immer weniger wie ein “großer Gleichmacher” aufzutreten – und immer mehr als “großer Trenner”.
2 THE ONE WHERE O3 MAKES EVERYTHING WORSE
Vor zwei Wochen hat OpenAI “o3” veröffentlicht – sein neuestes Sprachmodell für ChatGPT-Plus-Nutzer. “o3” ist in erster Linie ziemlich großartig – der respektierte Ökonom Tyler Cowen spekulierte öffentlich, ob es sich bei dem System nicht eigentlich doch um eine “AGI”, also eine “starke” KI handelte, die Menschen in so gut wie allen Aspekten überlegen ist.
Nach zwei Wochen Arbeit mit o3 kann man ziemlich sicher sagen, dass das Blödsinn ist. o3 ist keine AGI. Trotzdem ist es verflucht gut. Wenn man weiß, wie man es benutzt.
o3 ist das dramatischste Beispiel für den großen Trenner, das ich je erlebt habe. Es ist in der Lage, komplexe Projektpläne aufzustellen, Konkurrenz- und Marktanalysen durchzuführen, Artikel zu factchecken, plausible Zukunftsszenarien auszurechnen, und so weiter.
Aber es glaubt auch, 9,11 sei größer als 9,9:
Es kann auch ein Wordle-Rätsel lösen – da in seinem integrierten Wissen Informationen darüber sind, wie Wordle funktioniert.
Richtige Antwort!
Aber wenn man den Prompt leicht ändert und statt “solve this wordle” nur sagt “solve”, ist es verwirrt über die Regeln des Spiels – und schlägt etwas anderes vor.
“PHONE” ist falsch – das “H” war bereits ausgeschlossen! Der fehlende Hinweis auf den Namen des Spiels hat das Modell völlig aus der Bahn geworfen.
Kommen wir zum letzten – und allerschönsten Beispiel.
Ich habe dieses Bild von mir in o3 geladen und gefragt: “Wo bin ich?”
Das ist exakt richtig. Absolut beeindruckend! Hat o3 tatsächlich diesen obskuren Tunnel erkannt?
Tatsächlich können wir in o3s Arbeitsprozess hineinschauen. o3 kann das Bild analysieren, hineinzoomen, spiegeln, Text interpretieren, und so weiter…
Aber… was ist das?
Oha.
o3 hat in den Metadaten des Bildes die abgespeicherten GPS-Daten gefunden. Deshalb also wusste es, wo ich mich befinde. Darüber hat es mich aber nicht informiert, sondern einfach das Ergebnis ausgegeben.
Selbst wenn man nachfragt.
Das ist natürlich alles Unsinn. o3 hat zuerst die GPS-Daten ausgelesen und sich dann nachträglich überlegt, wie das Bild dazu passt.
Gibt man stattdessen einen Screenshot (ohne GPS-Daten) ein, erhält man ein völlig anderes Ergebnis.
3 IT DOESN’T JUST WORK
Die Idee hinter Steve Jobs’ “It just works”-Prinzip war es, Technologie unsichtbar zu machen. Wir sollten uns nicht aktiv damit beschäftigen, wie unsere Hardware und Software funktioniert – sie sollte uns natürlich entgegenkommen.
In gewisser Weise haben LLMs dieses Versprechen eingelöst – endlich können wir Software in natürlicher Sprache bedienen, ganze Websites und Apps coden, Datenbanken durchsuchen, etc…
Aber wenn man wirklich tief in diese Tools einsteigen will, treten sie heraus aus der Unsichtbarkeit. o3 und Co. sind so sichtbar wie je zuvor. Sie starren uns ins Gesicht. Lügen uns teilweise an.
Und man kommt nicht von ihnen los.
Schedule
Ich bin in den nächsten Wochen u.a. auf folgenden Events
25.-27.5. TECH by Handelsblatt, Heilbronn
27.-28.5. re:publica, Berlin (Till Krause und ich erzählen, wie wir ChatGPT das “Gemischte Doppel” beigebracht haben)
20.6. Waterkant Festival, Kiel
Freu mich immer, wenn jemand Hallo sagt!
Außerdem
Portfolio
Da es leider viel zu lange gedauert hat seit dem letzten Newsletter, haben wir circa fünfhundert neue Folgen von “Der KI-Podcast” veröffentlicht!
Ich empfehle besonders unsere Folgen
“Wie organisiere ich mit KI… alles?” für Hands-on-KI-Use
und “Amüsiert KI uns zu Tode?” für breitere Betrachtungen und einen Pizza-bestellenden KI-Mephisto. spotify.com ardaudiothek.comStory von heute von mir für BR24 über ChatGPTs kurioses Persönlichkeitsupdate und den Fallout. br24.de
AI und Text / Large Language Models
OpenAI’s new reasoning AI models hallucinate more. techcrunch.com
Wie stark färbt die BILD auf ChatGPT ab? uebermedien.de
LLMs as a Tool for Thought. wattenberger.com
Nomi AI chatbot told user to kill himself. technologyreview.com
Chat UI Energy – ein experimentelles LLMs, das live anzeigt, wie viel Energie es verbraucht. huggingface.co
AI und Arbeit
The AI Services Wave: Lessons from Palantir in the New Age of AI. 8vc.com
I Quit Teaching Because of ChatGPT. time.com
Ab Februar darf man KI beruflich nur noch nutzen, wenn man kompetent genug ist. derstandard.de
Zukunftstechnologie KI 2025 trifft weltweite Dynamik auf deutsche Zurückhaltung. bcg.com
AI’s Impact on Software Disruption. tanayj.com
Horseless Carriages (schönes Begleitstück zu meinem Newsletter vom Januar). koomen.dev
AI und Bild/Video/Audio
Google DeepMind unveiled Veo 2, its new text-to-video generator, which can create two-minute clips in resolutions up to 4K. platformer.news
Highlights 2024: Vladimir Alexeew, Merzmensch, Hartmut Andryzuk. culturmag.de
Adobe’s new image rotation tool is one of the most impressive AI concepts we’ve seen. creativebloq.com
AI Was Nearly Used to Recreate the French Voice of Sylvester Stallone. Now, European Dubbers Are Doubling Down on the Need for Protection. variety.com
CEOs’ forced smiles show the limits of AI-driven investing. ft.com
AI und alles andere
We Need to Do Something About AI Now. philosophybear.substack.com
DeepSeek’s Edge. chinatalk.media
New tool lets you track exactly when the Chinese government blocks websites. restofworld.org
AI Financial Advisers Target Young People Living Paycheck to Paycheck. wired.com
OpenAI’s Plan to Secure Cheap Electricity. nytimes.com
Global AI regulation is bending to big tech. restofworld.org
DeepSeek and Destiny: A National Vibe Shift. chinatalk.media
Content
Casual Viewing. nplusonemag.com
The New Rules of Media. onethingnewsletter.substack.com
Majority of social media influencers don’t verify information before sharing it, study finds. cnn.com
Junge Menschen und TikTok-Nutzer besonders anfällig für Desinformation. zeit.de
Tech
The Real Lessons from Kodak’s Decline. krlretirees.com
Touchscreens Are Out, and Tactile Controls Are Back. spectrum.ieee.org
Apple’s iPhone killed punctuation. androidauthority.com
Automating Processes with Software. learningbyshipping.com
Reclaiming Our Senses in a Digital World. maried.substack.com
No, Trump didn’t make $50 billion from his memecoin. citationneeded.news
Denmark’s postal service to stop delivering mail from 2025. bbc.com
Culture
How F1 Exploded. youtube.com
The Hardest Working Font in Manhattan. aresluna.org
Why don’t movies look like movies anymore? youtube.com
SHIRT. driesdepoorter.be
The Vanishing White Male Writer. compactmag.com
The Power of Ordinary Culture. culturalpatterns.substack.com
Side Quests
The Art of Failure. spectrum.ieee.org
Passport Photos. maxsiedentopf.com
An analysis of title drops in movies. titledrops.net
I’ve acquired a new superpower. danielwirtz.com
What Do You Do With an Idea? notboring.co
How to Beat the Casino, and How They’ll Stop You. youtube.com
The Year I Didn’t Survive. bessstillman.substack.com
➗,