du liest den tech-newsletter von gregor schmalzried. find me on linkedin!
Wir sind alle DJs
1 HELICOPTER RIDE
Diese Woche hat eine AI einen vier Jahre alten Song von mir zu Ende geschrieben.
Vor knapp vier Jahren, im verregneten Corona-Herbst, war ich circa zwei Tage lang besessen von FL Studio. FL Studio ist eine “Digital Audio Workstation” und vor allem bei Elektro-Produzenten beliebt, die anders als ich wirklich etwas von Musik verstehen.
Trotzdem habe ich damals nach bestem Gefühl die Anfänge eines “Bedroom Pop”-Songs namens Helicopter Ride zusammengezimmert.
Ein Ausschnitt:
Helicopter Ride war weder sonderlich gut, noch wurde er fertig. Das mit Abstand beste daran sind die Vocals von meiner Frau Veronika (wenn man die Mischung ignoriert).
Bis vor ein paar Tagen hatte ich das Experiment auch wieder komplett vergessen.
Dann kam ein neues Release von der Text-zu-Song-AI Udio (verantwortlich für Hits wie “Wow..... I Didn't Know That” und “MEOW, MEOW, WREE!”): Das Feature heißt “Audio Upload”. Und es geht ziemlich hart. Für mich war es ein neuer “Sora-” oder “ChatGPT-Moment” – das Gefühl, wenn die eigene Fantasie von der technologischen Realität überholt wird.
Alles, was ich getan habe: Den unfertigen Helicopter Ride-Song in Udio hochgeladen. Die Software mit einer groben Beschreibung des Songthemas gefüttert.
Und schon generiert die AI ein neues Ende für den Song.
Alles nach den ersten 5-6 Sekunden (die noch Überbleibsel des Originals sind) stammt aus der AI.
Vor allem die zweite Hälfte ist beeindruckend. Das Tool klont die Original-Stimme und nimmt sich Melodien und Motive aus dem originalen Song, baut diese aber um, gibt ihnen neuen Kontext und neue Rhythmen, arbeitet neue Layers und Höhepunkte mit ein. Man könnte sich sogar einbilden, dass die schnelle Hi-Hat im Hintergrund ab 0:15 die Rotoren eines Helikopters nachahmen soll?
Zwar ist der Text relativ lame, und wenn man genau hinhört, merkt man den Cut am Anfang, an dem der originale Song in seine AI-Nachbildung wechselt.
Aber es zeigt sich: Am wirksamsten sind AI-Tools – wieder einmal – nicht dann, wenn man sie alleine lässt. Sondern als Teil eines Remix.
Niemals hätte ich das alleine so hinbekommen.
2 EIN ECHTER SONG UND EIN FALSCHER
Eine ganz ähnliche Geschichte wie mit meinem Song ist vor Kurzem rund um den Hip-Hop-Producer Metro Boomin passiert. Nur stand die AI bei ihm nicht am Ende des Prozesses. Sondern am Anfang.
Für seinen Beat “BBL Drizzy” (der, wenn ich das richtig verstehe, irgendwas mit dem Beef zwischen Drake und Kendrick Lamar zu tun hat) nutzte Metro Boomin ein Sample, dessen Urheber er nicht genau kannte.
Kurz darauf kam die Wahrheit heraus: Es gab keinen klassische Urheber. Das Sample stammte, wie meine Song-Vervollständigung, aus dem AI-Tool Udio.
“BBL Drizzy” ist mittlerweile ein viraler Hit. Ein KI-generiertes Sample ist Popkultur.
Was auch Popkultur ist:
Ein Taylor Swift-Song, mit dem Taylor Swift nichts zu hatte.
Vor der Veröffentlichung von 1989 (Taylor’s Version) gab Taylor Swift die Tracklist des Albums bekannt. Mit auf der Liste: Ein Song namens Suburban Legends.
Noch bevor der Song offiziell veröffentlicht wurde, tauchte auf TikTok dieses Snippet auf:
Enable 3rd party cookies or use another browser
Das Snippet ist – natürlich – AI-generiert. Der echte Song wurde kurz darauf veröffentlicht, und klang völlig anders.
Aber erzählt das nicht den Kommentaren unter dem TikTok-Snippet.
Noch heute passiert das hier, wenn man auf YouTube nach dem Song sucht:
3 WIR SIND ALLE DJs
Wir haben also
einen “echten” Song, der von AI vervollständigt wird
einen AI-Song, der von einem menschlichen Produzenten vervollständigt wird
einen echten Songtitel, der von einer AI in einen “falschen” Songteaser verwandelt wird
Dass diese Möglichkeiten in der Kreativbranche einiges verändern… Völlig klar.
Aber damit hört es nicht auf. Denn diese drei Arten von Mensch-Maschine-Interaktion passieren auch anderswo.
Eine Software-Entwicklerin zum Beispiel kann heute schon…
ihren Code einem AI-Assistenten übergeben, um ihn optimieren zu lassen
einen AI-Assistenten eine erste Version seines Codes schreiben lassen, um diesen als Basis für die Arbeit zu nehmen
eine grobe Idee mit AI in einen schnellen Proof of Concept verwandeln, um ein Gefühl dafür zu bekommen, ob es sich lohnt, weiter mit der Idee zu arbeiten
Und ein Communications Manager kann…
sich zu einem Konzept Vorschläge geben lassen, welche Formulierungen direkter und welche Ideen klarer gemacht werden könnten
eine erste Struktur für ein Projekt von der AI bauen lassen, und diese selbst mit Leben füllen
eine Idee aus einem Brainstorming noch während des Brainstormings visualisieren
Bei allem Gerede über “AGI” und “Agents”…
Die wirklich spannenden AI-Anwendungen finden nach wie vor da statt, wo Menschen ganz nah an der Technologie dran sind. Ein LLM ist kein Allheilmittel, aber es ist wie ein synthetisches fremdartiges Gehirn mit eigenen Stärken, Macken und Intuitionen… und es kann uns an vielen Stellen weiterhelfen.
Egal ob im künstlerischen Bereich oder im klassischen White Collar-Beruf… Wenn viele Workflows bisher “Singer-Songwriter”-Workflows waren… dann werden sie jetzt “DJ”-Workflows. Es sind nicht immer unsere Platten, die wir auflegen. Wir holen uns immer wieder Hilfe und Ideen dazu.
Ein guter DJ muss kein Instrument selbst eingespielt haben. Er braucht einfach die Kontrolle über die Show.
Ich bin in nächster Zeit als Speaker oder Workshopleiter bei u.a. folgenden Events:
Waterkant Festival. Kiel, 14.6. waterkant.sh
1E9 Festival der Zukunft. München, 29.6 (Live-Ausgabe von Der KI-Podcast!). festival.1e9.community
Interaktiv-Barcamp #meko24. München, 2.7. interaktiv-muc.de
Freu mich über Hallosagen vor Ort!
Außerdem
Portfolio
Ich habe mit Philipp Klöckner (Doppelgänger Tech Talk) eine Sonderfolge von Der KI-Podcast aufgenommen – über “Apple Intelligence”! Unsere Reaktion, aufgenommen nur wenige Minuten nach dem Ende der Keynote, bildet die Stimmung der letzten zwei Tage schon ganz gut ab: Anfängliche Ernüchterung, dann aber doch Anerkennung, dass viel von dem funktionieren könnte, was Apple vorhat. ardaudiothek.de spotify.com
AI und Text / Large Language Models
Technischer Deep Dive in die Cloudstruktur hinter “Apple Intelligence”. interconnects.ai
Google hat seine “AI-Overviews” vorerst etwas zurückgefahren, nachdem die ChatGPT-mäßige Textzusammenfassung über den Suchergebnissen Nutzern riet, Steine zu essen. Ich habe zum ersten Mal im Februar 2023 in diesem Blog über die Problematik geschrieben, den Formfaktor Suchmaschine mit LLM-generierten Antworten zu verbinden – zumindest beim aktuellen Stand der Technologie. Bislang steht diese These noch ganz gut da. Wahrscheinlich würde Googles “AI Overview” besser funktionieren, wenn er einfach die Suchergebnisse beschreiben würde, anstatt sie zu einer “Wahrheit” zu synthetisieren. searchengineland.com
Untersuchung des Reuters Insitute über die Akzeptanz von AI-Einsatz im Journalismus. reutersinstitute.politics.ox.ac.uk
Why Substack Launched a Support Chatbot. understandingai.org
GPT-4 ist ziemlich gut im Prognostizieren von bestimmten Finanzmetriken. Wir lesen Stories dieser Art immer wieder: Große Foundation-Modelle wie GPT-4 sind oft eine bessere Lösung als kleine, spezialisierte. Außerdem muss man keine Ressourcen ins Training stecken (dafür zahlt man mehr für den Betrieb). venturebeat.com
“Accidental Prompt Injection” in RAG: Warum hat dieser Chatbot eine Frage nach dem Sinn des Lebens aus der Perspektive einer “gewitzten Rennmaus” beantwortet? simonwillison.net
What We Learned From a Year of Building with LLMs. oreilly.com
AI und Arbeit
Klarna spart 10 Millionen an Marketing-Ausgaben durch AI-Einsatz. Hauptsächlich durch das Verlagern von klassischen Agenturen-Aufgaben ins In-House-Geschäft. reuters.com
Etwas abgefahrene Kolumne einer hochrangigen Anthropic-Mitarbeiterin über ihre Erwartung, in nur wenigen Jahren ihre Arbeit an AI abgeben zu können. Muss man im Kontext des Silicon Valley-Hype-Cycles lesen natürlich. Trotzdem interessant. palladiummag.com
PwC und Aleph Alpha gründen ein AI-Venture für Compliance. Versteckt im Text: Der Hinweis, dass Aleph Alpha dabei auch auf externe Modelle zurückgreifen will, weil die kostenlosen Open Source-Modelle von Meta Aleph Alphas eigene Modelle wohl schlagen. Oops. handelsblatt.com
Meanwhile wird PwC der größte Enterprise-Kunde von OpenAI und stattet die gesamte Belegschaft mit ChatGPT aus. wsj.com
AI und Bild/Video/Audio
AI-Fakes als Manipulationstaktik auf TikTok in UK. BBC News.
AI-Fakes als russische Propaganda in China. nytimes.com
Wie AI (vor allem in Form von digitalen Avateren und Deepfakes) im Wahlkampf in Indien und anderen Ländern eingesetzt wird. internetobservatorium.substack.com
AI und alles andere
Apple Intelligence is Boring and Practical — That’s Why It Works. techcrunch.com
Ziemlich vernichtender Takedown des “rabbit r1” – der vielleicht kürzester Hype-Cycle aller Zeiten. youtube.com
Blick in Tech-Konzerne wie Microsoft während des AI-Hypes. AI-Projekte werden stark priorisiert – egal, ob sie Sinn machen oder nicht. Hier wird wahrscheinlich noch einiges weggespült werden, ähnlich wie es bei gescheiterten Mid-Size-Startups wie Inflection AI passiert ist. cnbc.com
Über AI-Werteketten und die verschiedenen Strategien der großen Tech-Firmen: Integriert man AI ins eigene System oder arbeitet man modular? stratechery.com
Content
Keila Shaheen’s “The Shadow Work Journal” shows how radically book sales and marketing have been changed by TikTok. nytimes.com
Kurzvideo von Hank Green über ein interessantes Phänomen: TikTok-Starstun sich sehr viel schwerer mit dem “Crossover” in ein anderes Medienformat. Auf TikTok bekommt man keine Personen, sondern Content angezeigt. Das macht es viel schwerer, ein Publikum woandershin “mitzunehmen”. YouTube
Porträt von MSCHF, ein "artist's collective that happened to raise venture capital" aus Brooklyn. every.to
Poetry Takes Over Tech. maried.substack.com
Tech
How to Detect Quantum Bullshit. youtube.com
Ein Leak von Teilen des Google-Such-Algorithmus hat die eh etwas gebeutelte SEO-Branche in Aufregung versetzt. theverge.com
Ein Blick darauf, wie Änderungen im Google-Algorithmus eine junge Medienmarke ans Existenzminimum getrieben haben. platformer.news
Facebook hat erstmals seit Jahren wieder steigende Nutzerahlen bei jungen Leuten. yahoo.com
Rise and Fall of DeviantArt. slate.com
Haptische Computer und Spatial Computing. kleinkleinklein.com
Dystopia
How Q Became Everything. motherjones.com
As China’s Internet Disappears, ‘We Lose Parts of Our Collective Memory’. nytimes.com
Side Quests
RAYE - Genesis. youtube.com
Der japanische Serien-Hit Extremely Inappropriate! versetzt das Land in eine Debatte über Political Correctness und die “wilden 80er”. Lustig: die Serie, um die es geht, hat anscheinend den gleichen Plot wie die deutsche Serie Der letzte Bulle. nytimes.com
The End of Merch. gq.com
I Adore You, Sweetheart. lettersofnote.com
💿,