das ist gregor schmalzrieds newsletter über künstliche intelligenz.
ich bin freiberuflicher journalist, berater, speaker und host von der ki-podcast (ARD)
Was ist GPT-5?
Seit 24 Stunden kennen wir GPT-5 – OpenAIs neues Flaggschiff-Sprachmodell und das nominell größte Upgrade für ChatGPT seit über zwei Jahren.
Trotzdem steht die Welt noch. Trotz jahrelangem Hype und wilden Spekulationen über “AGI” und Super-Systeme gibt es seit gestern keine Hamsterkäufe, keine panischen Tweets, keinen Brennpunkt nach der Tagesschau.
Alles läuft weiter wie bisher. Erstmal zumindest.
Also, was ist da gerade passiert?
Da dieser Newsletter für alles Mögliche optimiert ist, aber nicht für Klicks und Engagement, beginne ich meinen Text über das neue Sprachmodell von OpenAI mit einem kleinen Abschnitt über ein anderes Sprachmodell: Claude 4.
Ich verspreche, das macht nachher alles Sinn.
Claude 4 ist das aktuelle Sprachmodell von OpenAI-Konkurrent Anthropic und wurde vor einigen Monaten als Upgrade für das bisherige Sprachmodell Claude 3.7 veröffentlicht.
Interessanterweise war der Launch von Claude 4 relativ understated. Es gab kein langes Teasing im Vorhinein… Claude 4 war einfach eines Tages da.
Die Message:
Claude 4 ist halt einfach mehr Claude.
Aber man muss deswegen nicht gleich die Revolution ausrufen. Der Schritt war nur ein weiterer kleiner, wie von Claude 3 auf Claude 3.5, und von Claude 3.5 auf Claude 3.7. Kleine Schritte, ohne Paukenschlag.
Der Launch von GPT-5 wurde von OpenAI sehr anders kommuniziert. OpenAI-Chef Sam Altman tingelt seit Wochen durch Podcasts, als würde er einen neuen Marvel-Film bewerben. Er postet ominöse Bilder des Todessterns, denkt laut über die Super-Intelligenz nach und darüber, dass sein neugeborenes Kind nie so schlau sein wird wie die schlauste AI der Welt.
Seit Monaten, wenn nicht Jahren, bauen er und OpenAI Erwartungen auf, dass der nächste große Quantensprung unmittelbar bevorsteht – und dass der Wechsel von der 4 auf die 5 genau dieser Quantensprung sein könnte.
Und jetzt ist GPT-5 da… und was ist es?
Es ist kein Quantensprung.
Es ist halt einfach mehr GPT.
Grob gesagt vereinheitlicht GPT-5 die bisher absurd komplizierte Modell-Familie rund um Modelle wie GPT-4o, o3, o4-mini, GPT-4.1 und GPT-4.5 zu zwei Hauptmodellen: GPT-5 (ungefähr das Upgrade zu GPT-4o) und GPT-5 Thinking (ungefähr das Upgrade zu o3). Das ist in etwa das gleiche System wie wir es auch von anderen Anbietern kennen – bei Anthropic gibt es z.B. Claude Sonnet und Claude Sonnet with Extended Thinking. (Wer mehr zu den Basics wissen will, kann auch Casey Newtons Text lesen).
GPT-5 macht das Anwenden und Verstehen von Sprachmodellen, vor allem für technisch weniger versierte Nutzer, damit etwas leichter. Und es hat einige klare Stärken gegenüber seinen Vorgängern (mehr dazu gleich).
Aber es ist nicht unbedingt revolutionär.
Ist das ein Problem?
Zurück zu Claude:
Vor zwei Monaten habe ich ein kleines experimentelles Tool gebaut – ich wollte nämlich, dass Claude mir automatisch Formulare auf Websites ausfüllt.
Also habe ich ein Programm geschrieben (bzw von Claude schreiben lassen), das den Inhalt von Websites scannt, das Formular versteht und dann mit Inhalten füllt, die ich per Prompt vorgebe.
Beispiel:
Ich gehe auf das Kontaktformular der Stadtverwaltung München und sage dem Tool folgendes:
Und das Tool befüllt automatisch die Felder hiermit:
Das ist ziemlich fun und ein schöner kleiner AI-Case.
Trotzdem: Als ich das Tool vor zwei Monaten zum ersten Mal in Betrieb nahm, waren die Outputs viel schlechter als ich gehofft hatte. Das Tool übersah ständig Felder, verwechselte Vor- und Nachnamen, blieb in den Antworten zu kurz, und so weiter.
Es dauerte eine Weile, bis ich erkannte, was das Problem war: Ich hatte statt des aktuellen Claude 4 versehentlich die API für Claude 3 damit verknüpft – ein Modell, das zu diesem Zeitpunkt über ein Jahr alt war.
Wir erinnern uns: Weder der Sprung von Claude 3 auf Claude 3.5, noch von Claude 3.5 auf Claude 3.7, noch von Claude 3.7 auf Claude 4, war von irgendeiner seriösen Person als “revolutionär” bezeichnet worden. Niemand hatte in einem dieser Modelle einen Brennpunkt-würdigen Todesstern-Moment gesehen. Es waren einfach nur iterative kleine Schritte gewesen.
Aber ich hatte in diesem Moment die Möglichkeit, ein ganzes Jahr kleiner Schritte auf einmal gehen zu können. Ich tauschte die Claude 3-API im Code gegen die Claude 4-API aus, ließ das Tool noch einmal laufen… und es funktionierte perfekt. Mein Tool erkannte plötzlich auch die Zusammenhänge auf komplizierten und verwirrenden Websites, es war kreativ und es war robust. Everything I wanted. Ein ziemlicher Sprung.
Bei OpenAI ist über die letzten zwei Jahre natürlich genau das Gleiche passiert. Der Sprung von GPT-4 auf GPT-4o im Frühjahr 2024 war für viele Nutzer kaum sichtbar, und obwohl die Nummerierung seitdem bei GPT-4o hängen geblieben ist, gab es auch seitdem kontinuierlich Updates Richtung der aktuellen Fähigkeiten. Die letzte Version von GPT-4o war von der Qualität her viel näher an GPT-5 als an der ursprünglichen Version von GPT-4.
Kleine Schritte.
GPT-5 ist noch nicht einmal 24 Stunden veröffentlicht, deshalb möchte ich mir an dieser Stelle noch kein fertiges Urteil darüber erlauben, wie gut oder schlecht der aktuellste dieser Schritte am Ende wirklich ist.
Mein erster Eindruck ist in etwa dieser:
GPT-5 schreibt etwas besser als GPT-4o und definitiv besser als o3, was es zum ersten Reasoning-Modell mit okayem Stil macht.
Viele der größten Verbesserungen sind in Bereichen, die nah an Alltagsaufgaben sind: Es kann lange Texte und Aufgaben sehr viel besser verarbeiten, produziert weniger Halluzinationen und gibt vernünftiger kritisches Feedback als bisherige Modelle. Außerdem ist es in der API relativ günstig. All das sind gute Voraussetzungen für den alltäglichen Einsatz im Business-Kontext.
Der Fokus von OpenAI scheint weniger gewesen zu sein, das beste Modell der Welt zu produzieren und eher, ein möglichst gutes Modell möglichst vielen Menschen zugänglich zu machen. Das hat positive Folgen, aber auch negative (vor allem für Nerds wie mich, die gerne ein möglichst gutes Modell möglichst präzise kontrollieren wollen).
GPT-5 Thinking ist das einzige Sprachmodell, das einige meiner peniblen persönlichen Benchmarks bestanden hat (z.B. gibt es mir verlässlich die richtige Antwort auf die Frage, was der nächste Weihnachtsmarkt zu einer beliebigen Münchner Adresse ist), zeigt aber anderswo eher Rückschritte (z.B. beim Schreiben von Gemischten Doppeln).
Das System weiß immer noch nicht sicher selbst, wann es eine Frage mit dem einfachen GPT-5 beantworten soll und wann es das mächtigere Reasoning-Modell GPT-5 Thinking anschmeißen soll, was zu lustigen Situationen führt, wenn man das Reasoning-Modell per Prompt anwählt:
In vielen Bereichen finde ich Claude oder Gemini weiterhin besser. Trotzdem ist GPT-5 hochinteressant. Nicht, weil es das beste Modell auf der Welt sein könnte – das ist eh Geschmackssache und aktuell eine eher langweilige Frage. Nein, GPT-5 ist interessant, weil es das erfolgreichste Modell auf der Welt sein wird. Hunderte Millionen Menschen, bald wohl eine Milliarde, werden die Modelle dieser Familie via ChatGPT oder den Microsoft Copilot für Privates und Arbeit nutzen. Und trotzdem: den meisten von ihnen wird kaum aufgefallen sein, dass es einen weiteren kleinen Schritt nach vorne gab.
Das heißt übrigens nicht, dass sich nichts verändert.
Wie der berühmte metaphorische Frosch, der nicht bemerkt, dass das Wasser in seinem Kochtopf langsam zu kochen beginnt, werden auch wir zunehmend taub für die Fortschritte dieser Systeme, denn es braucht immer wieder zufällige Aha-Momente, um sie überhaupt wahrzunehmen.
Aber die Zukunft kommt, egal, ob wir sie bemerken oder nicht.
Außerdem
Portfolio
Der KI-Podcast (ARD) auf Spotify. open.spotify.com
Der KI-Podcast (ARD) in der ARD Audiothek. ardaudiothek.de
AI und Text / Sprachmodelle
It’s a feature, not a bug: How journalists can spot and mitigate AI bias. reutersinstitute.politics.ox.ac.uk
What a ChatGPT checkout system could mean for retail. modernretail.co
Persona vectors: Monitoring and controlling character traits in language models. anthropic.com
Ein LLM-Benchmark über das Erledigen von Steuererklärungen. Gemini 2.5 Pro liegt vorne, GPT-5 noch nicht getestet. arxiv.org
AI und Arbeit
OpenAI baut einen Consulting-Arm zur Implementierung ihrer Modelle auf und macht damit Accenture (und mir) Konkurrenz. forbes.com
Take: AI-Agenten kontrollieren ist nicht schwer, man behandelt sie einfach wie Menschen. understandingai.org
AI will make personality hires of us all. learningfromexamples.com
AI und Bild/Video/Audio
Genie 3: A new frontier for world models. Experimentelles (und leider noch nicht veröffentlichtes) Google-Modell – sehr interessant für Nerds. deepmind.google
Jim Acosta interviews ‘made-up’ AI avatar of Parkland victim Joaquin Oliver. theguardian.com
Unilever baut mit Partnern eine AI-„Fabrik“ für Beauty-Assets. Relevant für Agenturen. digiday.com
Ein indischer Filmklassiker bekommt ein neues AI-Ende. Proteste folgen. variety.com
Amazon investiert in das ‘Netflix of AI’, Fable. Sehr skeptisch, ob es für ein solches Produkt tatsächlich einen großen Markt gibt. variety.com
AI und alles andere
How AI Conquered the US Economy: A Visual FAQ. derekthompson.org
Will data centers crash the economy? noahpinion.blog
The Making of Dario Amodei. bigtechnology.com
Silicon Valley Is in Its ‘Hard Tech’ Era. nytimes.com
Manifestieren als AI Use Case. nytimes.com
Tech
I Saved a PNG Image To A Bird. youtube.com
Wie das klassische Universal Studios Logo gedreht wurde. forums.stevehoffman.tv
Qwant and Ecosia debut Staan, a European search index that aims to take on Big Tech. techcrunch.com
Culture
The Making and Un-Making of a Personal Library. lithub.com
Orcas start wearing dead salmon hats again after ditching the trend for 37 years. livescience.com
Temporal realness is the hottest commodity. onethingnewsletter.substack.com
Windows XP Crocs. winfuture.de
Side Quests
Face it: you’re a crazy person. experimental-history.com
Helsinki just went a full year without a single traffic death. politico.eu
Soulwax – ‘Is It Always Binary’. youtube.com
🌳,