Sommerhit mit künstlicher Intelligenz (5/6): Avatar Kevin singt unseren Song | Zürichsee-Zeitung

Ihr Browser ist veraltet. Bitte aktualisieren Sie Ihren Browser auf die neueste Version, oder wechseln Sie auf einen anderen Browser wie Chrome, Safari, Firefox oder Edge um Sicherheitslücken zu vermeiden und eine bestmögliche Performance zu gewährleisten.

Zum Hauptinhalt springen

Auf dem Weg zum KI-Sommerhit (5/6)
Tag 5: Avatar Kevin singt unseren Song

Ein richtiger Sommerhit braucht Gesang: Wir kaufen uns deshalb einen singenden Avatar und testen, was er so drauf hat – er klingt erstaunlich echt.

Ane Hebeisen

Publiziert: 08.08.2023, 18:51

So stellt sich die KI einen Rapper am Strand vor. — So stellt sich die KI einen Rapper am Strand vor.
Bild: KI-generiert mit Stable Diffusion

Mein Assistent Steff und ich sind uns einig, dass es unserem Sommerhit gut stehen würde, wenn dieser mit leichtem Gesang auftrumpfen könnte. Der erste Versuch, über die KI einen dazugehörigen, sommerlichen Text auf Deutsch zu verfassen, ist eher nicht geglückt. Viel besser gelang Chat-GPT dies in der Sommerhitsprache Spanisch: «Corazón vacío / Dolor emergente», das klang bereits wie Musik in unseren Ohren, und wir wedelten auf einmal ganz beschwingt durchs Kellerstudio. Also müsste uns die künstliche Intelligenz nur noch einen geeigneten Sänger zur Verfügung stellen.

Die KI irrt sich

Das ist nicht ganz so einfach, wie es den Anschein macht. Zwar gibt es eine ganze Menge an Generatoren, welche Stimmen imitieren können. Der berühmt und berüchtigt gewordene Song von Drake, den dieser gar nie gesungen hat, stammt jedoch bloss von einem Tool, das einer eingesungen Gesangsspur die Stimme von Drake quasi überzustülpen imstande war. Auf die Anfrage, ob es ein singendes KI-Tool gebe, antwortet selbst die KI mit negativem Bescheid: «Eine KI, die tatsächlich singen kann, wäre eine, die menschenähnliche Gesänge erzeugt. Dies erfordert Technologien wie Text-zu-Sprache und Gesangssynthese. Im Moment gibt es noch keine weitverbreitete KI, die menschenähnliche Gesänge erzeugen kann.»

Da dieser viel gerühmte Chat-GPT offenbar seit 2021 keine neue Datenfütterung mehr erhalten hat, irrt er sich. Steff hat nach einer längeren Surfsession für 140 Franken ein nigelnagelneues Programm der Firma Dreamtonics heruntergeladen, das genau dies kann: Es singt. Und es ist somit der wahr gewordene Traum des menschenscheuen Musik-Nerds, der sich bisher – in Ermangelung an singenden Menschenkontakten – zum Erzeugen instrumentaler Elektromusik in seinem Musikkeller verschanzt hat.

Man kann dem Sing-Avatar auch sagen, wie stark er beim Singen schnaufen und wie resolut sein Vibrato und wie hoch die Intensität seines Gesangs sein soll.

Unser Sing-Avatar heisst Kevin und ist einer der wenigen im Firmensortiment, der der englischen Singsprache mächtig und nicht im Pathos-Metal-Bereich tätig ist. Die meisten anderen singen auf Mandarin oder Japanisch, was folgerichtig heisst, dass wir unseren Sommerhit mit spanischem Gesang vergessen können.

Dafür legt sich der Kevin gesanglich ziemlich ins Zeug, und Steff glaubt, sich zu erinnern, dass ähnliche Sing-Avatare es in asiatischen Ländern bereits zu Superstarruhm und bejubelten Hologrammauftritten gebracht haben.

«Lass uns Drake ins Studio holen», schlägt Steff vor, «allein mit diesem Kevin wird der Song kaum zum Sommerhit.»

Unser Kevin funktioniert folgendermassen: Man konfrontiere ihn in seiner Programmumgebung mit einem Pianolauf, und schon singt er diesen in einem beherzten Lalala-Gesang nach. Gibt man einen Text ein, dann singt er diesen aus voller Kehle mit. Verteilt er die Silben ungünstig, kann man ihm dies im Editor des Musikprogramms korrigieren.

Man kann dem Kevin auch sagen, wie stark er beim Singen schnaufen und wie resolut sein Vibrato und wie hoch die Intensität seines Gesangs sein soll. Das klingt erstaunlich echt. Nur dass wir jetzt halt keinen lateinamerikanischen Schmachtsänger im Studio haben, sondern eher einen kernigen Folksänger amerikanischer Provenienz.

Leider kann er kein Spanisch: Sing-Avatar Kevin singt den KI-generierten Text unseres Sommerhits.

Video: Tamedia

Inspiriert von einer Melodie aus dem MusikGen von Meta spielen wir ihm eine Strophen- und Refrainmelodie vor, Steff ruckelt ihm die von Chat-GPT neu gedichteten Silben zurecht, und nach einigen Stunden haben wir eine Strophe und einen Refrain beisammen. Grund zum Ausflippen liefert das Gebotene noch nicht. Also beschliessen wir, uns musikalisch noch ein bisschen zu verstärken.

Drake hat sich aus allen Stimmimitationsprogrammen entfernen lassen

«Lass uns Drake ins Studio holen», schlägt Steff vor, «allein mit diesem Kevin wird der Song kaum zum Sommerhit.» Er hat wohl recht. Wir beginnen erneut zu forschen, erfahren, dass Drake sich aus allen Stimmimitationsprogrammen hat eliminieren lassen, stossen aber bald auf ein Programm, das uns beim Rappen weiterhelfen könnte.

Es heisst Uberduck und funktioniert so: Man gibt eine Rap-Aufgabe ein (in unserem Fall die Geschichte mit dem Strand, der Sonne und dem fehlenden Gegenüber), und der Generator kreiert eigens einen Rap-Text zum Thema. Dann wählt man aus diversen Stimmen einen Rapper aus, der den Text in rhythmischen Sprechgesang übersetzt.

Noch nicht ganz so gut sind die Rapper. Immerhin dichten sie auch gleich selbst.

Video: Tamedia

Das klingt in der Theorie indes noch besser als in der Realität: Die Tonqualität ist furchtbar schlecht und die Rapper noch von sehr überschaubarer Coolness, jedenfalls erreichen sie bei weitem nicht die Qualität unseres Sängers Kevin. Doch wenn man bedenkt, dass dieses Tool während der Pandemie ausgeheckt wurde, erst Ende letzten Jahres auf den Markt kam und nun emsig trainiert wird, so schlau zu werden, dass es die ganze Arbeit leibhaftiger Sprechgesangskünstlerinnen und -künstler zur allgemeinen Zufriedenheit übernehmen kann, dürfte es dem einen oder anderen Mikrofonhelden doch ein bisschen mulmig ums Rapper-Gemüt werden.

Steff bestellt das Premium-Abo mit Uberduck gleich wieder ab: «In drei Monaten können wir wieder schauen gehen, wie weit sie sind», sagt er, während er diverse Rap-Spuren, die das System ausgespuckt hat, in unseren Song zu implementieren versucht. Es ist das letzte Element, das uns zum Sommerhit 2023 bringen soll. Wir ahnen Böses.

Nächste Folge: Der Song ist da und stellt sich der Musikkritik – ein Fazit.

Ane Hebeisen ist Musikredaktor und schreibt seit 1996 über Pop und Artverwandtes aus aller Welt.Mehr Infos

Fehler gefunden?Jetzt melden.

Neuer Chef der VerwaltungHorgen hat nun einen Geschäftsführer

Porträt eines lächelnden Mannes mit lockigem Haar, der einen Anzug trägt, vor einem neutralen Hintergrund.

AboWährend Sanierung in ZollikonSchwimmbad Fohrbach bezahlt Restbeträge von Abos zurück

Hallenbad Fohrbach in Zollikon, am 07.01.2022, mit wenigen Besuchern aufgrund der Corona-Vorgaben. Foto von Michael Trost, Tamedia AG.

AboAllgemeinbildungLehrabschluss ohne Prüfung: Eine Reform sorgt für Streit

Katrin Schneider (17) schweisst beim Wettbewerb Jugend schweisst in Gelsenkirchen, als einzige weibliche Teilnehmerin unter 25 Jungen, April 2015.

AboCircus Knie feiert PremiereDer Nationalzirkus punktet mit dem Nachwuchs und viel Frauenpower

Maycol Junior und Ivan Frederic Knie bei der Premiere der Zirkus Knie Tournee 2025 in Rapperswil-Jona, reiten schwarze Pferde in der Manege. Beleuchtete Bühne mit Zuschauern im Hintergrund.

AboRückläufige RübenproduktionDarum ist in Schweizer Produkten heute weniger Schweizer Zucker drin

Nicolas Vincent, ein Zuckerrübenbauer, steht neben einem grünen Traktor auf einem Feld in Vallamand am 14. Februar 2025. Foto von Chantal Dervey.

Weinlese 2024Zweitschlechteste Ernte der letzten 50 Jahre

Marie Besse transportiert Bio-Rotweintrauben mithilfe eines Monorails im steilen Weinberg von Martigny bei der Ernte der Cave Florian Besse am 29. September 2023.

AboZwischennutzung auf KasernenarealEin Zürcher Verein setzt auf nachhaltige Mode

Nahaufnahme von Händen, die einen grünen Stoffstreifen auf einem Tisch mit Garn in verschiedenen Farben bearbeiten.

AboKrise in der VelobrancheDie Umsätze mit Velos gehen stark zurück – der Corona-Boom ist definitiv vorbei

Fahrräder der Marke Tour de Suisse Rad AG warten am Ende der Produktionslinie in einer Fabrikhalle in Kreuzlingen auf die Endkontrolle, aufgenommen am 28. November 2023.

Die Redaktion empfiehlt

«Zürichsee-Stonehenge»Mysteriöse Steinhügel vor Männedorf werfen Fragen auf

Unterwasseraufnahme eines felsigen Meeresbodens mit Algen und klarem Wasser.

AboZwei Traditionen vereintRäbechilbi-Böögg aus Richterswil ist am Sechseläuten dabei

Böögg-Bauer Lukas Meier erklärt einer Schulklasse aus Richterswil in seiner Werkstatt den Bau eines Böögs.

AboDom Perignon vom Reichsmarschall

Dom Perignon vom Reichsmarschall

AboQuaggamuschel im Zürichsee«Kommt viel zu spät» – die neue Putzpflicht ist bei Seglern umstritten

Ein Segelboot am Zürichsee wird gereinigt.

AboCafés in der ZürichseeregionHier kann man bei Kaffee und Kuchen die Frühlingssonne geniessen

Im Café Lycka auf dem Meilemer Dorfplatz sitzen die Gäste schon draussen in der Gartenwirtschaft. 2.4.2025 Bild: Sabine Rock

AboVon Agglo in oberste LigaFast 5 Millionen für eine 4,5-Zimmer-Wohnung: Preise in Horgen legen enorm zu

Luftaufnahme eines Hafens mit Segelbooten, einer grünen Uferlandschaft und einer ansässigen Stadt im Hintergrund.