du liest gregor schmalzrieds newsletter über ai, tech und media.
ich bin freier journalist, berater, speaker und host von der ki-podcast (ARD)
Software für alle
1 ALTES PROBLEM, NEUE LÖSUNG
Vor kurzem hatte ich ein technisches Problem:
Ich hatte jede Menge Text aus einer komplizierten Datenbank exportiert und das Ganze jetzt in meinem Downloads-Ordner liegen.
Die Form dieser Daten: ca. 200 HTML-Dateien.
Die Form, in der ich die Daten brauchte: eine einzige TXT-Datei.
Wie hätte ich früher versucht, dieses Problem zu lösen? Vielleicht so:
Vielleicht hätte irgendeine dieser ziemlich misstrauisch machenden Seiten mir geholfen.
Deutlich wahrscheinlicher: Die erste Seite hätte mich mit drei Bannern und Popups begrüßt, mich nach 3 konvertierten Dateien gemobbt, ein Premium-Abo abzuschließen und am Ende wären meine Daten wer-weiß-wo gelandet.
Aber... Wie habe ich mein Problem stattdessen gelöst? Ich habe einfach um Hilfe gefragt.
Nach nur zwei Minuten hatte Claude mir ein Skript zur Verfügung gestellt, samt Anleitung, wie das Ganze funktioniert und eine Nachfrage von mir zur korrekten Anwendung beantwortet.
Nach weiteren zwei Minuten war die Aufgabe erledigt und ich hatte alle Dateien wie gewünscht konvertiert. Datensicher, clean und einfach auf meinem eigenen Laptop. Einfach nur durch einen Dialog.
2 DAS LETZTE GUI
Im März 2023 begann Bill Gates einen Blogpost mit folgendem Satz: ”In my lifetime, I’ve seen two demonstrations of technology that struck me as revolutionary.“
Die erste Technologie-Demo, die er meint, ist das “Graphical User Interface”, das “GUI”.
Bevor es das GUI gab, sah Software so aus:
Die Revolution des GUI war nicht nur eine ästhetische. Die wesentliche Neuerung: Anstatt dass man den korrekten Namen und Pfad des Programms eintippen musste, um es zu starten, gab der Computer einem eine visuelle Übersicht von allen Programmen, die zur Verfügung stehen: Revolutionär!
Die zweite Technologie-Demo, die Gates meint, ist ChatGPT.
Tatsächlich spricht mittlerweile einiges dafür, dass LLMs mehr sind als nur ein weiteres Programm in der Liste von Apps und Websites. LLMs könnten die nächste Entwicklungsstufe darstellen – und alles daran verändern, wie wir Computer benutzen.
Schritt 1: Kommandozeile
Schritt 2: GUI
Schritt 3: Dialog in natürlicher Sprache
Mein Datei-Konvertierungs-Beispiel ist technisch nicht super anspruchsvoll – aber das Konzept dahinter ist unglaublich mächtig.
Ich muss nicht länger wissen, wie genau das Programm heißt, das ich brauche.
Ich muss nicht einmal wissen, wie das Programm grob funktioniert, das ich brauche.
Auf einmal reicht es, wenn ich meinem Computer einfach nur mein Problem beschreibe. Und sofort geht mein Computer an die Arbeit – und nimmt mich mit einer Engelsgeduld an die Hand.
Jahrzehntelang haben Computernutzer in Schulungen und Selbsterkundungen gelernt, die Sprachen und Eigenheiten der Software zu lernen. Auf einmal dreht sich das um. Auf einmal hat die Software unsere Sprache gelernt.
3 EIN LLM IST KEIN KONTEXTMENÜ
Nicht jeder ist überzeugt, dass ausgerechnet ein Chatfenster wirklich der nächste logische Schritt für Software-Nutzung ist. Seit dem Start von ChatGPT versuchen große und kleine Unternehmen auf aller Welt, für LLM-Technologie eine neue optische Form zu finden. Die Devise: “Es muss doch irgendetwas besseres geben als den Dialog!”
Das hat gute Gründe: Chatfenster sind vor allem für Anfänger schwierig zu bedienen, Chatfenster-Workflows lassen sich schlecht automatisieren, manche Prompts müssen immer wieder eingegeben werden und das “weiße Leinwand”-Problem sorgt dafür, dass viele Nutzer immer noch nicht wissen, was sie eigentlich alles mit diesen Tools anfangen können.
Apples neue AI-gestützte “Writing Tools” sind ein Versuch, das zu lösen:
Hier finden wir verschiedene Promptvorlagen – übersichtlich in ein Dropdown-Menü geordnet.
Aus der Sicht von Apple ist das ein logischer Schritt: Man nimmt eine neue Technologie (LLMs) und gießt sie in eine Form, die Nutzer schon kennen (das Kontextmenü).
Apple ist mit dieser Idee nicht alleine – jede Menge AI-gestützte Software-Lösungen bauen gerade ähnliche Dinge ein. “Zusammenfassen”-Buttons sind in Text-Software heute das, was früher Story-Funktionen in Social Media-Apps waren.
Nur… warum funktioniert das dann nicht?
Die viel herbeigeschriebene Verbraucher-AI-Revolution ist bislang zumindest ausgeblieben. Aus Apples großer AI-Offensive ist ein langsames Tröpfeln ignorierter neuer Funktionen geworden. Büro- und Verwaltungssoftware sieht immer noch aus wie vor zehn Jahren. Auch Microsoft und Google tun sich mit ihren AI-Integrationen schwer (auch wenn es besser läuft als bei Apple).
Es sind bislang so viele Erwartungen unerfüllt geblieben, dass ein Spiegel-Journalist im Interview mit Jonas Andrulis ganz selbstverständlich den Satz fallen lässt: “Der große Hype um generative KI scheint insgesamt aber erst einmal vorbei zu sein.”
Jeder, der aktiv mit AI arbeitet, weiß natürlich, dass überhaupt nichts vorbei ist. LLMs werden im Monatstakt besser – auch im Open Source-Bereich. Die Berichte über OpenAIs neues “o3”-Modell sind gewaltig. Der Markt hat mehr Dynamik als je zuvor.
Aber wer nicht aktiv mit AI arbeitet, bekommt davon wenig mit.
Wie Garrison Lovely im Time Magazine treffend beschreibt: “AI progress hasn't stalled—it's just become invisible to most people.”
Es sei denn, man verbringt viel Zeit in einem Chatfenster.
4 SOFTWARE FÜR ALLE
Zusammenfassungen sind einer der häufigsten Use Cases für LLMs. Für Apple & Co klingt es deshalb völlig logisch, das in ein Feature zu verwandeln und einen “Zusammenfassen”-Button als Teil ihrer Software anzubieten.
Aber in meine eigene Arbeit würde das nie hineinpassen. Wenn ich mir von einem LLM etwas zusammenfassen lasse… dann schreibe ich eigentlich nie
“fasse zusammen”
Ich schreibe:
“fasse alle Aspekte zusammen, die sich auf [THEMA A] beziehen”
“fasse es so zusammen, dass auch jemand mit Background in [BEREICH B], aber ohne Vorwissen in [BEREICH C] es versteht”
“fasse zusammen, nenne wichtige Kennzahlen”
“fasse sehr ausführlich zusammen”
“fasse zusammen, mit illustrierenden Anekdoten”
“fasse zusammen und gib mir wichtige unveränderte Zitate von [PERSON D] zur Untermauerung”
Das Tolle an LLMs ist nicht, dass sie einen vorgefertigten Katalog an Use Cases mitbringen. Sondern, dass sie ihren Nutzern den Freiraum lassen, diesen Katalog selbst zu entdecken. Und jeder Versuch, aus LLMs ein Verbraucherprodukt wie jedes andere zu machen, grenzt ausgerechnet ihre größte Stärke ein.
Dass man mit einem Textzusammenfassungs-Bot auch Programme fürs Dateienkonvertieren schreiben kann, geht gegen jede Software-Produkt-Logik. Kein Wunder, dass gerade alle versuchen, diese zwei Welten wieder voneinander zu trennen. Und wer weiß, vielleicht schafft es irgendwann jemand. Aber bislang hat noch niemand ein besseres Endverbraucher-Interface für LLMs gefunden als das schnöde alte Chatfenster.
Wer erforschen will, wie die Zukunft der Wissensarbeit aussieht, der kommt heute nicht drum herum, LLMs zu verstehen.
Und wer LLMs verstehen will, der muss sie in freier Wildbahn kennenlernen. Nicht eingezäunt im Kontextmenü.
Außerdem
Portfolio
Das medium magazin hat mich auf Platz 2 der Journalisten des Jahres in der Kategorie “Wissenschaft” ausgezeichnet. Freue mich sehr! linkedin.com
Einstündiges Radiofeature von mir mit fantastischem Sounddesign – es geht um die Schnittmengen zwischen AI und Religion: Die letzte Religion: KI als Schöpfungsgeschichte. ardaudiothek.de
Story von mir: Hunderttausende liken Fake-Bilder von KI-Kindern auf Facebook. br.de
Aktuelle Folge von Der KI-Podcast: Was wird dieses Jahr in der KI-Welt passieren? ardaudiothek.de
Aktuelle Folge von Der KI-Podcast: Welche KI ist 2025 die richtige für mich? (auch für Einsteiger geeignet!) ardaudiothek.de
AI und Text / Large Language Models
LLMs als Fischaugenperspektive – fantastisch gestaltetes visuelles Essay. wattenberger.com
DeepSeek, ein neues chinesisches AI-Startup, baut konkurrenzfähige Modelle auf GPT-4 und o1-Niveau. Aber: Wer Sprachmodelle aus China einsetzt, muss mit Zensur rechnen. the-decoder.de
Related: Chinesische E-Book-Reader-Firma Boox ersetzt GPT-KI durch stark zensiertes China-LLM. the-decoder.de
Things we learned about LLMs in 2024. simonw.substack.com
OpenAI bringt ChatGPT zu WhatsApp (mein Use Case: ChatGPT geht ab sofort im Flugzeug unter dem Messenger-WLAN-Tarif). the-decoder.de
OnlyFans models are using AI impersonators to keep up with their DMs. wired.com
Amazon brings generative AI-powered recaps to Prime Video. techcrunch.com
LLMs as a catalyst for introspection. maried.substack.com
AI und Arbeit
Microsoft quietly assembles the largest AI agent ecosystem. venturebeat.com
Publishers find the AI era not all that lucrative. niemanlab.org
A.I. insiders are falling for Claude, a chatbot from Anthropic. Is it a passing fad, or a preview of artificial relationships to come? nytimes.com
EU is ‘losing the narrative battle’ over AI Act, says UN adviser sciencebusiness.net Der Text zitiert EU-Verantwortliche, die hinter den gewaltigen Image-Problemen des AI Act eine amerikanische Kampagne wittern. Meiner Ansicht nach war da keine Kampagne notwendig.
The AI agent spectrum. interconnects.ai
AI und Bild/Video/Audio
The Ghosts in the Machine: Spotify, musicians, and AI. harpers.org
ElevenLabs AI voice generation likely used in Russian influence operation. techcrunch.com
AI is booming on the App Store, and developers are taking advantage of it. theverge.com
We Looked at 78 Election Deepfakes. Political Misinformation is not an AI Problem. aisnakeoil.com
The freaky rise of AI horrorcore. dazeddigital.com
Burda und Black Forest Labs kooperieren mit einem AI-Kinderbuch. burda.com
AI und alles andere
Die Meldung des Monats, vielleicht des Jahres: OpenAI, Softbank und Oracle starten, mit Blessing von President Trump, ein AI-Rechenzentrums-Projekt für (angekündigte) 500 Milliarden Dollar. Gemessen auf die Wirtschaftsleistung der USA entspricht das in etwa einem neuen Manhattan Project. theverge.com
Let’s get real: Von dem, was in den USA und China gerade gebaut wird, sind wir in Europa mittlerweile Lichtjahre entfernt. Eine Zukunft, in der Europa nicht komplett von amerikanischer und chinesischer AI-Infrastruktur abhängig ist, wird immer schwerer vorstellbar.Attention is what makes us human. dirt.fyi
To whom does the world belong? The battle over copyright in the age of ChatGPT. bostonreview.net
Arizona schools’ curriculum will be taught by AI, not teachers. gizmodo.com
Truth Terminal started as a techno-modernist art project meant to invite discussion about the applications and potential dangers of autonomous AI agents. Then it took on a life of its own. wired.com
AI + stablecoins. apifirst.tech
People prefer A.I. art because people prefer bad art. maxread.substack.com
Artificial intelligence has become a subject for people in the art and theater worlds who are worried about being replaced by it. nytimes.com
Scaling creativity with AI. addition.substack.com
David Lynch on music, sound, and AI. bfi.org.uk
Content
Podcast-Prognosen 2025: Was die deutsche Szene erwartet. beifahrersitz.substack.com
How WhatsApp became a global cultural force. restofworld.org
The expert class confronts reality. niemanlab.org
Costco guys. zine.kleinkleinklein.com
Tech
Hello, is this the nice peaceful charming internet? socialwarming.substack.com
Waymos Robotaxis kommen nach Tokyo. waymo.com
Reddit introduces new trends tools for businesses. techcrunch.com
Ben Thompson über Metas Policy-Änderungen. stratechery.com
Related: Suddenly everybody loves community notes. socialwarming.substack.com
Touchscreens Are Out, and Tactile Controls Are Back. spectrum.ieee.org
Culture
The decay of lying. dirt.fyi
Pornhub trends. zine.kleinkleinklein.com
Behind 50 years of SNL opening credits. fastcompany.com
The Fight to Save Googie, the Style of Postwar Optimism. nytimes.com
Robert Pattinson Lied in a TV Interview About Seeing a Clown Die in a Car Explosion; He Makes Up Stories Because Boring Questions Put Him in a ‘Fugue State. variety.com
Side Quests
Typewriter simulator. shifthappens.site
Color in the Middle Ages. medievalists.net
An unreasonable amount of time. allenpike.com
Always go to the funeral. npr.org
London transport explained in nine graphs. londoncentric.media
📋,