Weird Al” Yankovic, uma estranha imersão no mundo da clonagem de voz amaldiçoada.


No universo paralelo da história de Weird: The Al Yankovic Story do ano passado, o Dr. Demento incentiva um jovem Al Yankovic (Daniel Radcliffe) a afastar-se das paródias de músicas e começar a escrever suas próprias canções originais. Durante uma viagem de LSD, Al escreve “Eat It”, uma música 100% original que definitivamente não se baseia em nenhuma outra música e que rapidamente se torna “o maior sucesso de todos os tempos, de qualquer pessoa”.

Mais tarde, Weird Al fica furioso ao descobrir através de seu empresário que o ex-vocalista do Jackson 5, Michael Jackson, virou o jogo contra ele, alterando as palavras de “Eat It” para criar sua própria paródia, “Beat It”.

Isso me fez pensar: e se cada música do Weird Al fosse a original, e todos os outros artistas estivessem fazendo versões das suas músicas? Com os avanços recentes na clonagem de voz por inteligência artificial, percebi que poderia dar vida a essa monstruosa realidade alternativa.

Isso foi uma ideia terrível e eu me arrependo de tudo.

Claro, comecei com Michael Jackson fazendo uma versão de “Eat It,” o single vencedor do Grammy de 1984 que tornou Weird Al famoso.

A música de Michael Jackson está com um tom mais baixo e é cantada bem mais aguda do que a paródia de Weird Al, então eu ajustei os vocais para cima em uma oitava e abaixei a música inteira em meio tom para tentar igualar o original.

Esteja avisado: você não conseguirá esquecer isso depois de ouvir.

Desconsiderando os artefatos, parece que Michael Jackson está fazendo uma imitação de Weird Al?! Cada linha tem um vibe distintamente “nerd e esquisito”: perde qualquer seriedade e originalidade, exagerando palavras para efeitos cômicos e enunciando as letras de forma bem clara para que as piadas possam ser ouvidas.

Tentei seis modelos de clonagem de voz de Michael Jackson por IA diferentes, incluindo um treinado com sete horas de vocais ao longo de 300 épocas – um termo sofisticado para ciclos no conjunto de dados de treinamento – mas isso não fez muita diferença. (Geralmente, não é necessário usar mais do que 15 minutos de áudio limpo para um bom modelo.) Os resultados eram, em sua maioria, a mesma mistura profana: “Weird Michael” Jacksonkovic.

Aqui está Michael Jackson pela IA fazendo um cover de “Fat”, usando um modelo treinado com músicas de Destiny, Off The Wall e Thriller.

Mas não se trata apenas de Michael Jackson: a voz e a pronúncia distintivas de Weird Al tornam difícil substituir seus vocais por qualquer outra voz gerada por inteligência artificial.

Nenhuma inteligência artificial atual é poderosa o suficiente para ocultar a excentricidade de Weird Al.


O centro da comunidade de músicas de cover por inteligência artificial é um enorme servidor do Discord com mais de 500.000 membros chamado A.I. Hub, onde os membros trocam dicas, ferramentas, técnicas e links para suas músicas originais e covers. (Atualização: Três dias após a publicação deste artigo, o Discord baniu o A.I. Hub devido a reclamações de direitos autorais. Veja a atualização no final deste artigo.)

Os membros da comunidade também fazem upload dos modelos de voz por IA que eles treinaram, adicionando centenas de novos modelos diariamente a um crescente banco de dados de tópicos do Discord. Músicos são uma categoria popular, mas também há personagens fictícios, personagens de anime, YouTubers/streamers e celebridades.

Uma olhada nos tópicos de modelos de voz recentes do A.I. Hub é uma miscelânea caótica: Francoise Hardy, Pato Donald, todos os membros do grupo de garotas coreanas VCHA, Markiplier, Tom Waits, LeBron James, Knuckles e, ah, Adolf Hitler.

Captura de tela dos tópicos recentes de modelos de voz no AI Hub.