Jukebox: la inteligencia artificial que compone música desde ceroInteligencia Artificial

Jukebox: la inteligencia artificial que compone música desde cero

Descubre cómo funciona esta red neuronal que imita el estilo de tus artistas favoritos y genera canciones originales con letra y voz

Anneth Marín

¿Te imaginas tener un compositor virtual que pueda crear cualquier tipo de música que desees? ¿O escuchar una nueva canción de los Beatles, Frank Sinatra o Lady Gaga, aunque nunca la hayan grabado? Esto es lo que ofrece Jukebox, una inteligencia artificial desarrollada por OpenAI, la compañía de investigación en IA fundada por Elon Musk y otros empresarios.

Jukebox es una red neuronal que genera música en formato de audio en una variedad de géneros y estilos de artistas. Lo más increíble es que lo hace desde cero, como si un músico humano estuviera componiendo una nueva obra maestra. Para ello, se basa en el análisis de 1,2 millones de canciones en casi todos los géneros musicales.

¿Cómo funciona Jukebox?

Para generar una canción, Jukebox toma como entrada el género musical, el artista y la letra, y produce una muestra de música completamente original. El resultado es sorprendente, ya que la IA es capaz de capturar la esencia de diferentes estilos musicales y de imitar la voz y el tono de los cantantes. Además, puede generalizar a letras que nunca ha visto durante su entrenamiento, lo que significa que no solo crea música, sino que también juega con las palabras de manera impresionante.

La generación automática de música no es una idea nueva, pero Jukebox lleva esta idea a un nivel completamente nuevo. Durante más de medio siglo, los músicos y los científicos han estado tratando de encontrar formas de generar música de manera automática. Algunos enfoques anteriores se centraron en generar música de manera simbólica, como un rollo de piano, que especifica la duración, la nota, la velocidad y el instrumento de cada nota a tocar. Esto dio lugar a resultados impresionantes, como producir corales de Bach o música polifónica con múltiples instrumentos.

Sin embargo, estos generadores simbólicos tienen limitaciones, ya que no pueden capturar voces humanas ni muchos de los matices sutiles, dinámicas y expresividad que son esenciales para la música. Aquí es donde Jukebox marca la diferencia.

Jukebox toma un enfoque diferente. En lugar de generar música de manera simbólica, modela la música directamente como audio en crudo. Esto es un desafío considerable, ya que las secuencias de audio suelen ser muy largas. Un tema musical de 4 minutos a calidad de CD (44 kHz, 16 bits) tiene más de 10 millones de pasos de tiempo. Por eso, Jukebox utiliza un autoencoder que comprime el audio a un espacio de menor dimensión, y luego lo reconstruye con una red generativa.

El resultado es una música de alta calidad que suena realista y natural. Sin embargo, Jukebox también tiene sus limitaciones. A veces, la música puede tener artefactos o distorsiones, o la letra puede ser incoherente o poco relevante. Además, generar una canción puede llevar varias horas, dependiendo de la complejidad y la duración. Por eso, OpenAI ha publicado el código y los pesos del modelo, junto con una herramienta para explorar las muestras generadas, para que otros investigadores y entusiastas puedan mejorar y experimentar con Jukebox.

Jukebox es una muestra más del potencial de la inteligencia artificial para la creación artística. Ya existen otras redes neuronales que pueden generar imágenes, textos, vídeos o incluso videojuegos. Con Jukebox, se abre un nuevo horizonte para la música, que podría beneficiarse de la creatividad y la innovación que ofrece la IA. ¿Te animas a probar Jukebox y escuchar lo que puede hacer?

Temas

Más Noticias