das ist gregor schmalzrieds newsletter über künstliche intelligenz.
ich bin freiberuflicher journalist, berater, speaker und host von der ki-podcast (ARD)
Die Vermessung des Booms
Du sitzt in einem Zug.
Der Zug fährt durch weitläufige Wüste. Draußen nur flimmernde, unmarkierte Luft.
Woher weißt du, wie schnell der Zug fährt?
Vielleicht jagst du mit hunderten Stundenkilometern durch die Landschaft, vielleicht tuckerst du nur ein bisschen dahin. Während man sich im Zug selbst befindet, ist das schwer auszumachen.
GPT-5 Thinking weist mich darauf hin, dass dieses Gedankenexperiment an ein Sinnbild erinnert, mit dem Galileo das heliozentrische Weltbild untermauert hat: Stell dir vor, du befindest dich unter Deck eines Schiffes ohne Fenster. Das Schiff bewegt sich mit konstanter Geschwindigkeit über ruhiges Wasser. Kein mechanisches Experiment, so Galileo, könnte feststellen, ob das Schiff sich bewegt oder nicht.
Galileos Schiff bleibt auch heute noch ein mächtiges metaphorisches Werkzeug für folgenden Punkt: Wenn man sich auf einem beweglichen Körper befindet, ist es ohne externe Hilfe praktisch unmöglich, dessen Geschwindigkeit zu messen. Geschweige denn ihn intuitiv wahrzunehmen.
In diesem Newsletter geht es weder um einen Zug, noch um ein Schiff, sondern um AI (Überraschung!). Denn hier erleben wir gerade ein ganz ähnliches Problem. Es ist zwar klar, dass sich gerade etwas verändert. Der Boden unter unseren Füßen rumort.
Aber wie schnell fahren wir?
Gerade machen zwei Untersuchungen die Runde, die eine Messung versuchen. Und dabei scheinbar zu sehr unterschiedlichen Ergebnissen kommen.
UNTERSUCHUNG 1: STANFORD
Die erste Studie ist ein frisch veröffentlichtes Working Paper des Stanford Digital Economy Lab namens “Canaries in the Coal Mine”, unter Leitung von Ökonom Erik Brynjolfsson. Der Blockbuster-Satz in der Untersuchung ist dieser hier:
We find that since the widespread adoption of generative AI, early-career workers (ages 22-25) in the most AI-exposed occupations have experienced a 13 percent relative decline in employment even after controlling for firm-level shocks.
Will sagen: Wir erleben heute schon die ersten Auswirkungen von AI auf den breiten Arbeitsmarkt. Und negativ betroffen sind vor allem Einstiegsjobs.
Das könnte ein ziemlich großer Deal sein – denn seit einigen Monaten wird immer wieder über einen möglichen Zusammenhang dieser Art diskutiert.
Den ersten größeren Splash machte Derek Thompson Ende April im Atlantic, der darauf verwies, dass die Arbeitslosigkeit unter gut ausgebildeten Studienabgängern in den USA einen Rekordstand erreicht hat. Es folgten Berichte in Axios und eine sehr gute Folge meiner Host-Kollegen Marie und Fritz in “Der KI-Podcast”.
Vor zwei Wochen zeigte das Handelsblatt in Zusammenarbeit mit Stepstone auf, dass auch auf dem deutschen Arbeitsmarkt ähnliches los ist: die Zahl der ausgeschriebenen Einsteigerjobs ist seit Beginn des AI-Booms massiv abgefallen.
In der Theorie passt das zusammen: AI ist sehr gut im Zusammenfassen und Durchforsten langer Dokumente, im Abfassen von Protokollen und Briefings, sowie in Internet-Recherchen und dem Abgleichen von Datensätzen. Viel gemein haben diese Aufgaben nicht, außer dass es genau die sind, die in vielen Unternehmen von Werkstudenten und Juniors übernommen werden.
Selbst wenn die AI heute noch nicht perfekt ist… Die rasanten Fortschritte über die letzten Jahre könnten Grund genug sein, dass so mancher Geschäftsführer lieber zweimal überlegt, bevor er eine neue Stelle schafft. Wer weiß, wo die Technologie morgen ist?
Das war aber bisher vor allem Spekulation. In der Realität ist es verdammt schwer, zu bestimmen, ob die realen Entwicklungen am Arbeitsmarkt wirklich mit AI zusammenhängen oder nicht. Die Liste der möglichen anderen Faktoren ist lang: Schwache Konjunktur, Strafzölle, hohe Zinsen, Overhiring während und nach der Corona-Pandemie, fehlender Innovationsgeist von Unternehmen, Pech…
Woher wissen wir, ob AI wirklich eine Rolle spielt? Aus dem Wüstenzug lässt sich nur schwer dessen Geschwindigkeit messen.
Die Stanford University bezeichnet ihre Studie nun als die “erste ihrer Art”, die den lange nur vermuteten Effekt tatsächlich nachgewiesen haben will – und zwar indem sie Branchen mit starker “AI Exposure” gegen Branchen mit schwacher AI Exposure gestellt haben.
Das Ergebnis: Die beruflichen Chancen für junge Menschen (v.a. zwischen 22 und 25) gehen tatsächlich stark zurück – aber nur in den Berufsfeldern, die besonders AI-exponiert sind: zum Beispiel Software-Entwicklung und Customer Service. In anderen Berufsfeldern – und für ältere Arbeitnehmer – gehen die Zahlen eher nach oben.
Wenn sich das bekräftigen sollte, folgen aus dieser Erkenntnis einige Fragen:
Wo kommen die neuen Seniors her, wenn niemand mehr Juniors einstellen will?
Könnte der Effekt in Deutschland, wo wir uns schon immer mehr um den Erhalt bestehender Jobs als um das Schaffen neuer Jobs kümmern, noch stärker ausfallen?
Related: Wie viel unfairer kann die Lage für die junge Generation bei uns eigentlich noch werden?
UNTERSUCHUNG 2: MIT
Wie schnell saust also unser Zug durch die Wüste?
Ziemlich schnell, legt die Stanford-Studie nahe.
Umso interessanter, dass nur wenige Tage zuvor eine andere Studie für Aufsehen gesorgt hat, die das genaue Gegenteil nahelegt. Hier – just for fun – die clickbaitigste Interpretation der Studie, die ich finden konnte.
Die Untersuchung, gepaart mit einem indirekten Zugeständnis von Sam Altman, dass AI ein Bubble-Problem haben könnte, hat sogar kurzzeitig für eine paar abstürzende Börsenkurse gesorgt – wobei es auch hier schwer ist, die genaue Kausalität nachzuweisen und die Kurse sich inzwischen längst wieder erholt haben.
Worum geht es aber eigentlich?
Bei der MIT-Study handelt es sich um eine Befragung von 153 amerikanischen Führungskräften zu 300+ Initiativen, bei denen “aufgabenspezifische AI-Tools” (also keine allgemeinen LLMs wie ChatGPT) intern in Auftrag gegeben wurden.
Das Ergebnis: 95 Prozent dieser Projekte schafften es nicht, innerhalb von 6 Monaten nach Pilotphase “deutliche und nachhaltige” Produktivitätssteigerungen zu erzeugen.
Man kann relativ leicht Löcher in diese Untersuchung pieksen, wenn man möchte (z.B. wurde nach AI-Projekten seit Januar 2024 gefragt, 9 Monate vor dem ersten Reasoning-Modell).
Aber so zu pieksen ist weniger interessant als den Bericht ernst zu nehmen, denn er legt den Finger in eine offene und entzündungsgefährdete Wunde: Viele AI-Projekte in Unternehmen, vor allem zwischen 2023 und 2024, wurden vor allem als Prestige- und Leuchtturm-Projekte konzipiert. Nicht als echte Unterstützung für die Belegschaft.
Aus Fortune:
The core issue? Not the quality of the AI models, but the “learning gap” for both tools and organizations. While executives often blame regulation or model performance, MIT’s research points to flawed enterprise integration. Generic tools like ChatGPT excel for individuals because of their flexibility, but they stall in enterprise use since they don’t learn from or adapt to workflows, Challapally explained.
Die wichtigste Eigenschaft von Generative AI (wie ich auch in diesem Newsletter immer wieder gerne betone), ist dass Generative AI eine formbare und dynamische Technologie ist, die für individuelle Personen Riesensprünge ermöglicht.
Individuelles Arbeiten in Allzweck-Tools wie ChatGPT funktioniert deshalb auch deutlich besser als die meisten vertikalen Leuchtturmprojekte.
Der MIT-Bericht zeigt das ganz direkt.
Deutlich mehr Wissensarbeiter nutzen Sprachmodelle wie ChatGPT als es eigentlich sollten:
Diese Nutzer trauen ihren AI-Tools mittlerweile bei einfachen Aufgaben mehr zu als ihren menschlichen Kollegen:
Und – ganz besonders wichtig – es reiht sich Datenpunkt an Datenpunkt, dass breit einsetzbare “horizontale“ Allzweck-Tools wie ChatGPT, Gemini und Claude bessere Ergebnisse liefern als spezialisierte “vertikale” Tools (Erinnerung: diese spezialisierten Tools waren die mit der Scheiterquote von 95%).
Aus der MIT-Studie:
A corporate lawyer at a mid-sized firm exemplified this dynamic. Her organization invested $50,000 in a specialized contract analysis tool, yet she consistently defaulted to ChatGPT for drafting work:
"Our purchased AI tool provided rigid summaries with limited customization options. With ChatGPT, I can guide the conversation and iterate until I get exactly what I need. The fundamental quality difference is noticeable, ChatGPT consistently produces better outputs, even though our vendor claims to use the same underlying technology."
This pattern suggests that a $20-per-month general-purpose tool often outperforms bespoke enterprise systems costing orders of magnitude more, at least in terms of immediate usability and user satisfaction.
Die beste AI-Innovation setzt also keine Leuchtturm-Prestige-Projekte in den Mittelpunkt des Unternehmens.
Sondern die Menschen, die tatsächlich dort arbeiten.
Und wie schnell fahren wir nun?
Solange es so schwer ist, das zu messen, bleibt das fast eine Glaubensfrage.
Ich halte weder die Crash-Propheten für sonderlich glaubwürdig, die jede Woche das komplette Ende des “AI-Hype” vorhersehen, noch die Silicon Valley-Ultras, für die eine übermenschliche Superintelligenz chronisch nur noch ein paar Monate entfernt ist.
Wichtiger als die Frage, wie schnell wir fahren, ist ohnehin die Frage, wohin.
Und das kriegt man durchaus raus.
Es dauert vielleicht ein bisschen, bis man sich nach vorne zur Lok durchgekämpft hat. Aber sobald man einmal vorne ist, ist die Sicht gar nicht so schlecht.
Außerdem
Portfolio
Der KI-Podcast (ARD) – der Podcast von Marie, Fritz und mir auf Spotify. open.spotify.com
Der KI-Podcast (ARD) – der Podcast von Marie, Fritz und mir in der ARD Audiothek. ardaudiothek.de
Ich war zu Gast bei Gavin Karlmeier im Haken dran-Podcast. spotify.com
Ich war zu Gast bei Paul Elvers im Off the Record-Podcast. spotify.com
AI und Text / Sprachmodelle
What Happened When I Tried to Replace Myself with ChatGPT in My English Classroom. lithub.com
I trapped an AI model inside an art installation. youtube.com
Deep learning gets the glory, deep fact checking gets ignored. rachel.fast.ai
People use AI more than you think. Nutzung und Umsätze vieler KI-Dienste wachsen rasant, oft limitiert durch Compute-Angebot – nicht durch Nachfrage. interconnects.ai
What my daughter told ChatGPT before she took her life. nytimes.com
Toxische AI Boyfriends. mashable.com
How to manipulate Perplexity & AI Overviews. linkedin.com
Das Browser-Unternehmen Brave zeigt, wie Webseiten per Prompt Injection unsichtbare Befehle an KI-Browser schicken können. brave.com
Auf Pfifferlingsjagd mit ChatGPT. welt.de
AI und Arbeit
AI is doing job interviews now—but candidates say they’d rather not. fortune.com
Wenn GPT-5 eine Wette auf mehr Geschäftskunden war (wie von mir vor einigen Wochen in diesem Newsletter spekuliert), dann scheint die Wette aufzugehen. cnbc.com
The résumé is dying, and AI is holding the smoking gun. arstechnica.com
A hidden network handles chats for OnlyFans stars. AI could soon take over. restofworld.org
AI und Bild/Video/Audio
Gemischte Reviews für die neue LLM-fizierte Alexa. nytimes.com
how we will tell stories together. theprompters.substack.com
Introducing Gemini 2.5 Flash Image. Das beste AI-Bildbearbeitungs-Modell bisher. googleblog.com
AI und alles andere
The End of Mutual Assured Destruction? Was KI für nukleare Abschreckung bedeutet. foreignaffairs.com
Google briefs brands on AI Mode ads ahead of Q4 rollout. searchengineland.com
A Mysterious Science. Geschichte des Begriffs “Artificial Intelligence”. learningfromexamples.com
Human. quarter--mile.com
Hank Green: I’m Changing How I Manage My Money Because of AI. youtube.com
Content
TikTok Shop: Gemischte Gefühle vier Monate nach dem Deutschlandstart. omr.com
Nine Ways to Improve an Ad (1963). draytonbird.net
Designing for the Eye – Optical Corrections in Architecture and Typography. Optische Korrekturen erklären, warum „perfekt“ gezeichnet oft falsch wirkt – und wie Design das ausgleicht. nubero.ch
Tech
Introduction to Computer Music. cmtext.com
History of F1 Design. espn.com
When Disney Went Digital. animationobsessive.substack.com
Malicious compliance by booking an available meeting room. clientserver.dev
Shanghai Lets Riders Design Their Own Routes. sixthtone.com
Internet Artifacts. neal.fun
On the Death of Daydreaming. afterbabel.com
The Screenless Office. buttondown.com
Side Quests
The Sunlight Budget of Earth. asimov.press
At 17, Hannah Cairo Solved a Major Math Mystery. quantamagazine.org
Astronomy Photographer of the Year 2025 shortlist. rmg.co.uk
Dicing an Onion, the Mathematically Optimal Way. pudding.cool
How to Build a Medieval Castle. archaeology.org
We’re Not So Special. democracyjournal.org
🚄,