das ist gregor schmalzrieds newsletter über künstliche intelligenz.
ich bin freiberuflicher journalist, berater, speaker und host von der ki-podcast (ARD)
Agents aus der Zukunft
“Was ist ein KI-Agent?”
Die gebräuchliche Antwort auf diese Frage geht ungefähr so:
“Ein KI-Agent ist ein KI-System, das nicht einfach nur Antworten gibt, sondern selbst Handlungen ausführt, um ein Ziel zu erreichen. Dabei passt es seine Handlungen selbständig an, je nachdem, was es auf dem Weg zum Ziel vorfindet.”
Schicke Definition! Das Problem mit ihr: Denjenigen, die gerade die Frage nach dem Agenten stellen, hilft sie in der Regel nicht wirklich weiter.
Die Definition fällt in einen Bereich, den der Autor Jacob Morgan als “true but useless” bezeichnet. Sie stimmt zwar im Wesentlichen. Aber wer wissen will, was ein Agent ist, will meiner Erfahrung nach eigentlich noch etwas anderes wissen: “Sollten mich KI-Agenten jucken?”
Diese Frage ist komplizierter zu beantworten, und scheinbar verheddert in jede Menge Widersprüchen.
Einerseits verkündeten zahllose LinkedIn-Posts und Präsentationen Anfang des Jahres, 2025 wäre das “Jahr der Agents”.
Andererseits hat das Forschungsunternehmen Gartner gerade prognostiziert, dass fast die Hälfte aller “Agentic AI”-Projekte die nächsten zwei Jahren nicht überleben werden.
Two things can be true at once.
Denn wenn wir heute über Agenten reden, dann meinen Leute damit eigentlich zwei sehr verschiedene Dinge.
Beide werden von der obigen Definition abgedeckt (true but useless). Aber sonst haben sie kaum etwas miteinander zu tun.
1 AGENTS AUS DER ZUKUNFT
Die erste der zwei Agent-Kategorien ist gerade in aller Munde – denn ChatGPT hat sie vor ein paar Tagen der gesamten Welt zugänglich gemacht.
Das ist der “ChatGPT Agent”.
Die Idee hinter diesem Tool ist relativ simpel:
Wir geben ChatGPT einen Auftrag. Und anschließend lädt ChatGPT einen virtuellen Desktop, um diesen Auftrag auszuführen. Dabei kann das Tool Websites und Programme bedienen, Präsentationen und Excel-Listen erstellen und auch relativ komplexe Aufträge ausführen.
In einem meiner Tests habe ich dem Agenten den Auftrag gegeben, auf die Filmbewertungsseite Letterboxd zu gehen, dort meine persönliche Watchlist zu finden und dann nachzusehen, welche meiner Filme gerade auf Netflix verfügbar sind.
Menschen mit einem gesunden Menschenverstand können sich an dieser Stelle fragen: “Bedeutet das nicht, dass ich dem Chatbot meine persönlichen Login-Daten samt Passwort geben muss?”
Und ja. Genau das bedeutet es.
Ich habe für dieses Experiment auf jeden gesunden Menschenverstand verzichtet.
Es ist beeindruckend, dem Agenten beim Bedienen seines Computers zuzuschauen. Tatsächlich findet er innerhalb weniger Sekunden die richtigen Felder, klickt problemlos Cookie-Banner und Captchas weg (“Ich bin kein Roboter”) und findet Wege, das Problem zu lösen.
In meinem Fall kam der Agent zum Beispiel schnell auf die Idee, meine Filme-Watchliste nicht händisch durchzugehen, sondern die “Exportieren”-Funktion zu nutzen. Ich persönlich wusste nicht einmal, dass die existiert.
Und tatsächlich steht am Ende eine Liste, inklusive Links. Der Auftrag wurde erfolgreich ausgeführt.
Seit der Veröffentlichung des ChatGPT Agent haben Leute Spaß damit, immer neue Dinge zu finden, die der Agent für sie tun kann. Er kann Lebensmittel bestellen. Er kann das Handelsregister durchsuchen. Etc.
So gesehen ist es ein bisschen eigenartig, dass nicht die ganze Welt wegen ChatGPT Agent durchdreht. Wo sind die Reportagen darüber, dass ganze Jobs von diesem Agent übernommen werden? Dass menschliche Computerarbeit nun überflüssig ist?
Tatsächlich erleben wir bei diesen Beispielen immer einen gewaltigen Selection Bias. Gepostet werden nur die Male, bei denen der Agent erfolgreich war. Nicht die, bei denen es schiefgegangen ist.
Und es geht immer noch sehr oft schief.
Als ich das erste Mal dem Agenten den Netflix-Auftrag gab, verwechselte er ganz am Anfang zwei Buttons und kam minutenlang nicht vom Fleck.
Ein anderes Mal löschte er versehentlich einen der Filme aus meiner Watchlist und verbrachte die nächste Zeit mit dem Versuch, seinen Fehler rückgängig zu machen.
Der ChatGPT Agent ist eine beeindruckende Technologie. Aber es gibt einen Grund, warum ich ihn bislang nur in meinen Letterboxd-Account gelassen habe – und nicht in deutlich wichtigere Tools. Er ist schlicht und einfach nicht robust genug.
Hier liegt das zentrale Problem:
Damit ein Agent wirklich sinnvolle Arbeit im Alltag erledigen kann, benötigt er Zugriff auf unsere echten Systeme und Daten.
Aber damit wir einem Agent Zugriff auf unsere echten Systeme und Daten geben können, müssen wir sicher sein, dass er damit keinen Quatsch anstellt.
Und diese Sicherheit haben wir noch nicht.
Der ChatGPT Agent ist ein Agent aus der Zukunft, der in der Gegenwart noch nicht fertiggestellt ist. Wer mit ihm herumspielt, erkennt schnell Bruchstücke eines kommenden Systems, das unseren Umgang mit dem Computer verändern wird (ähnlich wie es durch “Reasoning” und “Research” in Chatbots bereits passiert ist).
Aber er ist noch nicht fertig. Er ist kein Alltagstool für die Gegenwart.
2 AGENTS AUS DER GEGENWART
Wenn wir heute über Agenten reden, dann reden wir eigentlich über zwei verschiedene Dinge.
Einerseits über Systeme wie den ChatGPT Agent – unfertige, experimentelle Systeme mit unklaren Fähigkeiten.
Und andererseits über Systeme wie dieses:
Das ist ein kleiner agentischer Workflow, den ich letzte Woche im Rahmen einer Demo in make.com gebaut habe. Jeder der Kreise symbolisiert einen Schritt einer Arbeitskette.
Das Prinzip ist in etwa folgendes:
Wird eine Email an eine bestimmte Email-Adresse gesendet, wird diese automatisch an einen kleinen Agent (basierend auf Claude Sonnet 4) weitergeleitet. Dieser Agent soll nun untersuchen, ob er die Email beantworten kann oder nicht. Dafür nutzt er ein Tool, das er zur Verfügung hat, um sich mehr Informationen zu holen. Findet er in diesen Informationen das, was er gesucht hat, formuliert er eine Antwort und schickt diese weiter an den Workflow, zusammen mit dem Befehl “JA”. Findet er nicht das, was er gesucht hat, lässt er das Antwortfeld leer, zusammen mit dem Befehl “NEIN”. Im letzten Schritt des Workflows liest dann ein Router aus, ob der Agent ein “JA” oder “NEIN” befohlen hat und schickt entweder eine Antwort an den ursprünglichen Absender (bei “JA”) oder leitet die Email des Absenders an eine andere Email-Adresse weiter, zum händischen Beantworten (bei “NEIN).
Was wir nun haben, ist im Grunde genommen ein kleiner automatischer Kundendienst-Bot.
In dieser Demo drehen sich die hinterlegten Daten und Prompts um einen fiktiven Steuerberater aus dem Star Wars-Universum, der sein Büro auf Tatooine hat.
Das bedeutet, ich kann diesem Steuerberater jetzt eine Email schicken, er verarbeitet die Email und prüft seine nächsten Schritte. In diesem Fall sieht er nach, ob er in einem der angeschlossenen Dokumente die Antwort auf die Frage in der Email finden kann. Sobald er diese gefunden hat, schickt er mir nach ein paar Sekunden eine Antwort zurück – und das im sprachlich gleichen Stil, in dem die Anfrage kam:
Das ist ziemlich cool!
Es ist auch weit weniger dramatisch als automatisierte Lebensmitteleinkäufer und Account-Einlogger, und technisch ist es nicht sehr kompliziert.
Man könnte sogar argumentieren, dass dieser kleine Workflow größtenteils aus klassischen Automatisierungstools besteht und damit nur mit etwas Wohlwollen wirklich “agentic” ist.
Aber im Alltag ist mir das relativ egal. Denn wir reden hier nicht über die Zukunft. Sondern über die Gegenwart.
In der Gegenwart sind Agents dann am besten, wenn wir sie nicht von “Was wäre das Verrückteste, was wir damit machen können?” aus denken. Sondern wenn wir einfach fragen: “Welches Problem könnte eine AI heute für uns lösen, und wie bauen wir uns die robusteste Version davon zusammen?”
Die Zukunft kann immer noch kommen, wenn sie bereit ist.
Außerdem
Portfolio
Der KI-Podcast (ARD) auf Spotify. open.spotify.com
Der KI-Podcast (ARD) in der ARD Audiothek. ardaudiothek.de
AI und Text / Sprachmodelle
China exportiert Staatspropaganda mit günstigen Open-Source-KI-Modellen. the-decoder.de
Google and OpenAI Get 2025 IMO Gold. Zwei LLM-Systeme lösen fünf von sechs Aufgaben der Mathe-Olympiade und erreichen damit Goldniveau. thezvi.substack.com
Ein australischer Pflegestudent wehrt sich gegen den Vorwurf, er habe KI zum Schreiben einer Arbeit genutzt. abc.net.au
Grok 4 befragt bei politisch sensiblen Fragen automatisch Elon Musks Tweets, bevor es antwortet. simonwillison.net
Why my p(doom) has risen, dramatically. garymarcus.substack.com
AI und alles andere
AI Sovereignty: The Emperor Has No Clothes. engineeringprompts.substack.com
Reflections on OpenAI. calv.info
Donald Trump just laid out his vision for AI policy. Trumps neuer „AI Action Plan“ ist etwas weniger wild als befürchtet. Trotzdem sollte eine Sache mittlerweile klar sein: Außer Europa ist niemand auf der Welt an KI-Regulierung interessiert. understandingai.org
SoftBank and OpenAI’s $500-Billion AI-Projekt “Stargate” stockt. wsj.com
The Summer of Free AI-gency. Über AI-Forscher als gefragte Stars. theringer.com
Netflix uses generative AI in one of its shows for first time. theguardian.com
Content
Attention Is the Last Scarce Resource. Über die Coldplay-Geschichte. digitalnative.tech
TikTok-Clips statt Pressekonferenzen: Did Superman kill the press junket? theguardian.com
Substack Raises $100 Million, Betting on Subscriptions but Coming Around to Ads. nytimes.com
Tech
Most Americans Opposed the Moon Landing. newsletter.pessimistsarchive.org
If GLP-1 Drugs Are Good For Everything, Should We All Be on Them? derekthompson.org
Meta’s WhatsApp Pay experiment in India fizzles. restofworld.org
How does a screen work? makingsoftware.com
Culture
Deutschrap ist nicht tot. Aber Deutschrap liegt im Sterben. welt.de
The bewildering phenomenon of declining quality. english.elpais.com
Modern Dissonances. maried.substack.com
The Tokyo capsule tower that gave pod-living penthouse chic. theguardian.com
Overtourism in Japan, and How it Hurts Small Businesses. craigmod.com
Side Quests
HP Offers ‘That Cloud Thing Everyone Is Talking About’. youtube.com
All The Ghosts You Will Be. youtube.com
Men I Trust – Tailwhip. youtube.com
🔮,