Warum AI immer noch unterschätzt wird (und manchmal überschätzt)
Arbeiten mit dem schnellsten Praktikanten der Welt
du liest den tech- und medien-newsletter von gregor schmalzried. find me on linkedin!
Warum AI immer noch unterschätzt wird (und manchmal überschätzt)
0. DER STATE OF AI
Der 2023 Report on AI von Retool enthält eine Menge interessanter Nuggets. Leider beginnt er mit eine der wertlosesten Fragen, die man aktuell stellen kann:
“Wird AI gerade überschätzt oder unterschätzt?” (Die Antwort im Report ist: die Hälfte der Tech-Personen hält AI für überschätzt, ein Viertel für unterschätzt, ein Viertel für richtig eingeschätzt.)
Warum diese Information einem nichts bringt?
Weil je nachdem wen man fragt, Menschen in Sachen AI-Wissensstand mittlerweile in komplett unterschiedlichen Realitäten leben.
In Realität 0 spricht man davon, dass sich der Hype um Generative AI gerade wieder etwas “abkühlt”, dass die wirklichen Anwendungsfälle noch Jahre entfernt seien und dass ChatGPT ja sowieso nur Quatsch produziert.
Menschen in Realität 0 findet man vor allem in bestimmten akademischen Kreisen, auf Mastodon, bei Management-Level-Angestellten nahe der Rente und in der Berichterstattung vieler Massenmedien. Wenn man vor allem mit Leuten aus dieser Welt herumhängt, kommt man schnell auf die Idee, AI sei unterschätzt.
In Realität 1 spricht man davon, dass AGI (also eine Art übermenschliche Super-KI) quasi vor der Tür steht, dass in wenigen Jahren die gesamte Weltwirtschaft umgewälzt sein wird und Milliarden Menschen arbeitslos sein werden.
Menschen in Realität 1 findet man vor allem in der Tech-Welt (die in der Retool-Umfrage befragt wurde), in “Evangelist”-Jobs, in etwas anders gelagerten akademischen Kreisen und in LinkedIn-Hype-Posts. Wenn man vor allem mit Leuten aus dieser Welt herumhängt, kommt man schnell auf die Idee, AI sei überschätzt.
Wenn ich mich zwischen diesen zwei Realitäten einsortierten müsste, dann vielleicht in einer Realität 0,7. Keine der beiden Seiten scheint einen klaren Blick auf die Dinge zu haben, und es ist in solchen Debatten ohnehin nie verkehrt, sich erstmal in Richtung Mitte zu orientieren. Aber es gibt einen Grund, warum die Pro-Hype-Leute aus Realität 1 für mich etwas näher an einer präzisen Einschätzung dran sind als die Anti-Hype-Leute aus Realität 0:
Sie benutzen wenigstens wirklich die Technologie.
1. WARUM GENERATIVE AI (IMMER NOCH) UNTERSCHÄTZT WIRD
Es ist Anfang 2008. Jemand gibt dir das erste iPhone in die Hand und sagt “Das hier wird Videoproduktion für immer verändern”. Du probierst es aus, und stellst fest: Das iPhone kann überhaupt keine Videos machen. Nur Fotos. Und die sehen auch noch ziemlich schlecht aus.
Du hast jetzt zwei Möglichkeiten:
Du überlegst, was diese Art von Handheld-Kamera in einer Zukunft bedeuten könnte, in der Chips und Rechenleistung billiger und die Fähigkeiten eines solchen Geräts immer stärker werden.
Oder du sagst “Das Ding kann ja gar kein Video” und vergisst es wieder.
Ungefähr letzteres ist bei vielen Menschen mit ChatGPT passiert. Nur dass sie das iPhone 1 (Gratis-ChatGPT) zu einem Zeitpunkt ablehnen, an dem das iPhone 6 (Bezahl-ChatGPT) bereits existiert!
Die Gratis-Version von ChatGPT (basierend auf GPT-3.5) ist schon ziemlich gut. Sie hat aber auch einige Schwächen. Sie kann als Input und Output nur Text anbieten, sie ist schlecht mit Code, kann nicht googlen, halluziniert gelegentlich und kommt bei längeren Inputs schnell an ihre Grenzen.
Von den Leuten, die nur die Gratisversion von ChatGPT ausprobiert haben, höre ich oft Sätze wie “Es ist nett als Spielerei, aber wirklich nützlich ist es für mich nicht”.
Von den Leuten, die im Alltag mit der Bezahlversion von ChatGPT (basierend auf GPT-4) arbeiten, höre ich diesen Satz nie.
Das liegt zur einen Hälfte an den Fähigkeiten des Modells und der Oberfläche von ChatGPT Plus: GPT-4 hat einen viel akkurateren und nützlicheren Output als GPT-3.5, es kann Data Analysis, akzeptiert mittlerweile 300 Seiten Text auf einmal als Input, kann mit Bildern und Datensätzen arbeiten, sehr komplexe Zusammenhänge erstaunlich präzise darstellen, jederzeit auf das aktuelle Internet zugreifen und ist mit Trainingsdaten bis Frühjahr 2023 trainiert. Es gibt diverse Benchmark-Tests, die GPT-4s Fähigkeiten quantifiziert haben, aber am Ende ist es auch eine Gefühlssache: Wer einmal angefangen hat, mit GPT-4 zu arbeiten, kann unmöglich zu GPT-3.5 zurück. Es fühlt sich an wie das Downgrade von einem iPhone 6 auf ein iPhone 1.
Aber die Technologie ist nur die eine Hälfte. Denn ihre wahre Magie entsteht erst, wenn sie tatsächlich eingesetzt wird.
Wer viel mit AI arbeitet, fängt an, AI permanent mitzudenken. Und wer AI permanent mitdenkt, findet ständig neue Dinge heraus, die man mit AI tun kann. Und wer ständig neue Dinge herausfindet, die man mit AI tun kann, der wird ein bisschen süchtig danach.
Man versucht es dann mit den minimalsten schlechtesten Prompts, einfach nur um zu schauen, ob das immer noch funktioniert:
Man versucht es mit etwas komplexeren Prompts:
Und man versucht es mit sorgfältig strukturierten Prompts, die man direkt in ein Custom-GPT einbettet. Diesen Chatbot hier habe ich mir z.B. gebaut, um wissenschaftliche Paper für mich durchzusehen und nach vorher vereinbarten Kriterien zusammenzufassen:
Es gibt für Large Language Models wie GPT-4 keine feste Bedienungsanleitung.
Was wir damit tun, finden wir nur durch Lernen und Ausprobieren heraus. Und am Ende haben keine zwei User den gleichen Workflow. Aber genau dieser ultra-individuelle Ansatz macht GPT-4 als das aktuell beste Large Language Model auch so wertvoll.
Die von mir hier genannten Beispiele sind natürlich eher spielerisch. Das liegt auch daran, dass es ziemlich schwer ist, den Nutzwert von GPT-4 in ein paar Grafiken zu erklären. Aber allein diese paar Beispiele zeigen, wie vielseitig die Technologie heute schon eingesetzt werden kann. Und dahinter stecken noch sehr viel mehr Möglichkeiten.
2. WARUM GENERATIVE AI ÜBERSCHÄTZT WIRD
In meinen Workshops und Vorträgen zum Thema “Arbeiten mit AI” bemühe ich mich immer, recht früh eines klarzustellen:
Generative AI ist ein hervorragender Praktikant.
Aber ein lausiger Ersatz für eine menschliche Fachkraft.
Immer wieder gehen Storys um wie
Neben einer Meldung über einen Todesfall wird eine AI-generierte Umfrage platziert, in der Nutzer zu ihrer Meinung zu diesem Tod befragt werden. link
Ein neuer öffentlicher Amazon-Chatbot könnte vertrauliche Daten leaken. link
Ein AI-generierter News-Artikel über den Tod eines NBA-Players beschreibt den Spieler als “nutzlos”. link
Wenn es einen Punkt gibt, an dem Generative AI jetzt gerade überhyped ist, dann sieht man es an diesen Beispielen. Denn hier wird versucht, menschliche Arbeit komplett durch AI zu ersetzen.
Ja, es werden sich viele Jobbeschreibungen ändern und viele Rollen sich neu orientieren. Ja, schon jetzt spüren eine Menge Leute (z.B. Illustratoren und Sprecherinnen) den Druck, den AI-generierte Inhalte auf ihre Berufe ausüben. Und ja, das kann alles auch sehr schnell noch sehr viel drastischer werden.
Aber in der absehbaren Zukunft wird “Wir lassen ein Large Language Model das machen, was bisher ein Mensch gemacht hat” oft nicht funktionieren.
Ein Beispiel: Klar könnte ein Medienhaus GPT-4 nutzen, um automatische Spielberichte über Fußball-Matches zu schreiben, und die bisher dafür zuständigen Redakteure entlassen.
Das Problem mit dieser Strategie: Wenn dieses Medienhaus das kann, dann kann das jeder andere auch. Und die GPT-4-generierten Spielberichte der neuen KI-Redaktion wären kein bisschen besser als das, was jeder andere zuhause auch herstellen kann. Auf einmal ist man keine Marke mit Mehrwert mehr — sondern nur noch einer von unzähligen Accounts, der quasi identische AI-generierte Berichte postet. Man zahlt zwar kein Geld mehr für die menschlichen Redakteure. Aber man nimmt auch keins mehr ein. Der AI-Effekt hat sich wegarbitriert.
Eine Redaktion, die feststellt, dass ihren Job auch eine AI machen kann, sollte daraus nicht schließen, dass sie die Menschen rauswerfen kann. Sondern sie sollte sich fragen, welche Rolle die Menschen in dieser veränderten Welt spielen. Was können sie tun, das die Maschine nicht kann? Menschliche Expertise wird immer eine Hebelwirkung haben.
3. WIE MAN WEITERMACHT
Eine der spannendsten Untersuchungen von GPT-4-Einsatz bei der Arbeit wurde im September von der BCG und der University of Pennsylvania veröffentlicht.
Consultants mit der Unterstützung von GPT-4 erzeugten Resultate von höherer Zahl (12,2% mehr als in der Kontrollgruppe), in kürzerer Zeit (25,1% schneller) und in höherer Qualität (40%). Aber: Das galt nur für den Bereich, der innerhalb von GPT-4s Kompetenzen lag.
Wenn die Consultants GPT-4 für Aufgaben außerhalb von GPT-4s Fähigkeiten nutzten, gab es keine Steigerung. Im Gegenteil: Die Leistung sank um 23%.
Das Experiment zeigt:
Es geht nicht einfach darum, ob man Generative AI über- oder unterschätzt.
Es geht darum, was man damit macht.
Author’s Note
Ich arbeite gerade in einem kleinen Team daran, den individuellen Nutzen von Large Language Models wie GPT-4 in den Arbeitsalltag zu bringen — und anstehende Veränderungen strategisch zu betrachten. Denn das Einarbeiten fällt nicht immer leicht — siehe: AI hat keine Bedienungsanleitung. Wenn das für dich interessant klingt, ich bin per Email oder LinkedIn erreichbar, sag gerne Hallo!
Außerdem
My work
Die zweite Staffel meiner Audio-Serie Mia Insomnia — u.a. mit Bastian Pastewka und Oliver Rohrbeck — ist erschienen!
Mia Insomnia ist eine Mystery-Geschichte über eine Podcasterin auf der Jagd nach einem Detektivhörspiel aus ihrer Kindheit. Das Redaktionsnetzwerk Deutschland sagte über Staffel 1: “Das ist großes Kino für die Ohren – und es empfiehlt sich, die Episoden vielleicht nicht gerade nachts alleine beim Joggen im Wald zu hören.”
Alle Folgen von Staffel 1 sind ab sofort frei verfügbar, z.B. hier: spotify.com
Alle Folgen von Staffel 2 und 1 sind ab sofort in der ARD Audiothek: ardaudiothek.deZusammen mit Marie Kilg und Fritz Espenlaub hoste ich für die ARD den wöchentlichen KI-Podcast auf Spotify, Apple Podcasts und in der ARD Audiothek. In den aktuellen Folgen geht es u.a. um das Chaos bei OpenAI und die Frage, ob wir synthetische Fakes noch erkennen können.
Ich habe als Gast im neuen Podcast-Newsletter Beifahrersitz von Denise Fernholz Tipps für KI-Nutzung gegen Schreibblockade geteilt. Denise ist eine der besten Personen im deutschen Podcast-Space und ich empfehle ihren Newsletter und ihre Arbeit wärmstens. beifahrersitz.substack.com
Der von mir moderierte KI-Gipfel bei den Medientagen München dieses Jahr ist jetzt online, mit aufschlussreichen Gästen von u.a. Google und ElevenLabs. youtube.com
AI und Text / Large Language Models
Apple arbeitet an der Integration von LLM-Technologie in sein gesamtes iOS-Ökosystem. Apple ist in der AI-Welle ungewöhnlich langsam, wird aber, sobald das alles läuft, einen großen Vorteil haben: Ein funktionierendes und integriertes Interface. bloomberg.com
Was Meta von “Galactica” gelernt hat, seinem gescheiterten KI-Modell, das kurz vor ChatGPT veröffentlicht und sofort wieder offline genommen wurde. venturebeat.com
Minderwertige AI-generierte Texte verstopfen das Web — und machen Internetsuche zu einer Herausforderung. wired.com
AI und Arbeit
Laut einer Salesforce-Befragung in 14 Ländern nutzen 28% der Wissensarbeiter Generative AI-Tools am Arbeitsplatz — und nur die Hälfte von diesen mit dem Wissen ihrer Vorgesetzten. salesforce.com
“Make It Real” ist eine neue Mockup/Design-Software, mit der man visuell und in natürlicher Sprache kommunizieren kann. Man glaubt (und versteht) es erst, wenn man es sieht. arstechnica.com twitter.com
Welche Anwendungen werden durch den (immer noch unfertigen) AI Act der EU gecovered. Dieser Compliance Checker bemüht sich um Klarheit: artificialintelligenceact.eu
Wieder ein Must-Read von Matthew Ball über Microsoft und strategisches Denken im AI-Zeitalter. matthewball.vc
AI und Bild/Video/Audio
Über den Impact von AI-generierten Produktbildern auf Amazon und anderen Plattformen. nymag.com
Chinesische Influencer*innen streamen 24/7 — dank Deepfakes. technologyreview.com
Abgefahrenes Beispiel, was multimodale AI schon heute kann: Ein synthetischer David Attenborough erklärt im “Planet Earth”-Stil live Webcam-Bilder. arstechnica.com
State of the Art von synthetischer Bildgenerierung: “DALL-E 3 ist a wake-up call for visual artists” arstechnica.com
Microsoft stellt die Weichen für AI-generierten Videospiel-Content. theverge.com
“How to replace the sky”. Ein Comic über digitale Bildbearbeitung und die Sehnsucht nach der Realität. theverge.com
Scarlett Johansson verklagt eine AI-App, die mit ihrer geklonten Stimme Werbung gemacht hat. theverge.com
Die argentinische Präsidentschaftswahl war geprägt von AI-Fakes. nytimes.com
Content
Die New York Times über Blue Collar-Arbeiter, deren Profile auf Social Media bekannt werden. Keiner davon so gut wie Dachdeckerin Chiara! nytimes.com
Wie 13 globale News Publisher WhatsApp Channels nutzen. niemanlab.org
“The people who ruined the internet”. Der SEO-Deepdive, der in der SEO-Community für viel Drama gesorgt hat. theverge.com
Threads kommt im Dezember nach Europa. Ich habe Twitter und Musk über das letzte Jahr quasi gar nicht gecovered (auch aus persönlichem Desinteresse), aber wenn es nur eine Twitter-Ersatz-Plattform gibt, auf die man in Zukunft achten sollte, dann ist es nicht Mastodon oder Bluesky, sondern Threads. t3n.de
Lange waren junge Frauen im digitalen Raum überdurchschnittlich stark durch unrealistische Beauty-Standards belastet. Um dieses Problem auszugleichen, gibt es jetzt auch für Männer jede Menge unrealistische Beauty-Standards. nytimes.com
Dystopia
“The AI-generated child abuse nightmare is here.” wired.com
Die QAnon-ifizierung von großen Teilen der “post-kolonialen” Linken schreitet voran. Verschwörungstheorien, Terrorglorifizierung und Judenfeindlichkeit von links wurden lange ignoriert — allmählich wird das Problem so offensichtlich, dass Wegschauen nicht mehr möglich ist. calmdownben.com theconversation.com
TikTok, die für die westliche Jugend mit Abstand einflussreichte App, fungiert als Megaphon für Antisemitismus. adl.org
🎄,