Meta lanza MusicGen: cómo funciona el nuevo modelo IA para crear música

MusicGen de Meta fue entrenado con 20,000 horas de música licenciada, es de código abierto y puede utilizarse con fines comerciales.
Meta MusicGen
Imagen conceptual de un sistema de inteligencia artificial usado para crear música.onetime/Getty Images

El equipo de investigación de Audiocraft de Meta acaba de lanzar MusicGen, un nuevo modelo de lenguaje de aprendizaje profundo que es capaz de generar nuevas piezas musicales a través de simples prompts.

La nueva plataforma basada en inteligencia artificial (IA) generativa de Meta “opera sobre varios flujos de representación de música discreta comprimida, es decir, tokens. (...) MusicGen se compone de un transformador LM de una sola etapa junto con patrones de entrelazado de fichas eficientes, lo que elimina la necesidad de conectar en cascada varios modelos, por ejemplo, jerárquicamente o sobremuestreando”, según el equipo de desarrollo.

Esto quiere decir que los usuarios, además de introducir una breve descripción en texto sobre la melodía que desean obtener como resultado, pueden combinar esta indicación con un pequeño fragmento de una pieza musical existente para obtener una pieza mucho más alineada con sus necesidades.


Meta inteligencia artificial
Con la presentación de LIMA, Meta demuestra sus intenciones de conquistar el mercado IA a la sombra de miles de despidos en su plantilla laboral.

La arquitectura permite al servicio descomponer los datos de audio en pequeños fragmentos gracias al uso de Encoder, códec desarrollado por Meta que utiliza técnicas de aprendizaje automático para aumentar la relación de compresión de contenidos de audio sin perder calidad y mejorar las capacidades del modelo en términos de  procesamiento de varios fragmentos en paralelo.

MusicGen fue entrenado con 20,000 horas de música licenciada, incluidas 10,000 pistas de música de alta calidad de una base de datos interna así como una biblioteca con pistas de Shutterstock y Pond5.

El resultado fueron tres versiones del modelo con 300 millones, 1,500 millones  y 3,300 millones de parámetros respectivamente. De acuerdo con el equipo de Meta, aunque es evidente que este último es el que mejor calidad de audio ofrece, la propuesta intermedia fue la mejor calificada por los evaluadores humanos.

MusicGen de Meta y un duro debate en la industria musical

Aunque por ahora MusicGen solo es capaz de entregar resultados de hasta 12 segundos de duración (sin ninguna intervención manual), es importante mencionar que se trata de un desarrollo de código abierto. Tanto el código como los diferentes modelos están disponibles para su uso personal y comercial desde GitHub. Además, los interesados en probar la nueva propuesta de Meta también pueden hacerlo desde HuggingFace.

MusicGen está lejos de ser el único modelo basado en IA generativa capaz de generar piezas musicales a golpe de un simple prompt. No obstante, Meta parece seguro en que su propuesta tiene las capacidades para superar a otros competidores en el rubro como MusicLM de Google, Riffusion y Musai. Para probar el punto, los investigadores hicieron una comparativa dentro de una página de muestra que puede ser consultada por cualquier persona para emitir un juicio al respecto.

X content

This content can also be viewed on the site it originates from.

El avance tecnológico que proponen servicios como MusicGen es impresionante. Sin embargo, no podemos olvidar que este tipo de desarrollos ya han desatado un debate en el lucrativo negocio musical. Para muchos, sistemas como el ahora presentado por Meta comprometen a los procesos de la cadena valor de la industria. La creación de nuevas producciones musicales, su distribución y comercialización ahora parecen actividades que pueden ser ejecutadas por modelos de inteligencia artificial.

En meses pasados, Universal Music solicitó a servicios de música en streaming como Spotify y Apple Music que bloquearan de sus plataformas la música generada mediante sistemas de inteligencia artificial y que cerrarán el acceso para los desarrolladores a su catálogo musical para que no puedan entrenar a sus sistemas IA. Ambas actividades, según Universal Music, atentan contra la propiedad intelectual.