Skip to content
BCKSTG
Playback

BCKSTG · La Búsqueda

¿Tu música está enDISCO-12M?

12,320,916 canciones de YouTube. Y subiendo. Unos 91 años de música. Ya en un dataset público para entrenar IA. Escribe el nombre del artista. Mira cuántas de las tuyas aparecen.

Lee la historia: 12,320,916 canciones de YouTube ya están entrenando una IA

Busca en LAION-DISCO-12M por nombre de artista.

Dataset: LAION-DISCO-12M (Apache 2.0).

Solo cubre LAION-DISCO-12M. SLEEPING-DISCO 9M y DISCO-10M son datasets aparte que esta herramienta no busca.

Qué es

12,320,916 canciones. Ya en circulación.

DISCO-12M es una lista de videos de YouTube, empaquetada para que cualquier laboratorio de IA pueda entrenar un modelo musical con ella. LAION la subió a Hugging Face. Cualquiera con un botón de descarga la tiene.

DISCO-12M no es el único. SLEEPING-DISCO 9M y DISCO-10M son datasets públicos aparte, armados de la misma manera. Esta herramienta solo busca en DISCO-12M. Si no apareces aquí, todavía podrías estar en alguno de los otros.

El dataset no incluye el audio. Incluye el ID de YouTube de cada canción, que es todo lo que alguien necesita para bajar la pista y entrenar un modelo con ella.

Quién lo carga

Los independientes. Sobre todo en español.

Las disqueras grandes tienen departamentos legales. Tú no. LAION-DISCO-12M se armó desde YouTube, que también es la plataforma de distribución, el motor de descubrimiento y la salida real de la mayoría de la música independiente. No hay una manera práctica de salirte.

AI Watchdog de The Atlantic viene siguiendo este tipo de lanzamientos según van saliendo, y su herramienta busca en varios de estos datasets. Nosotros solo pudimos obtener este, LAION-DISCO-12M, así que nuestra búsqueda cubre menos terreno que la de ellos.

Qué haces hoy

Tres movimientos. Antes de que los tribunales decidan nada.

Uno. Captura tu resultado con la fecha para tu propio registro. El registro real es el dataset público en Hugging Face, que cualquiera puede revisar.

Dos. Pide la baja al host. La remoción se gestiona en la página del dataset, no con LAION ni con Google.

Tres. Sigue el caso Lyria 3. Lo que falle el tribunal marca la plantilla para el próximo dataset.

La historia completa en Playback

Google dice que ya lo licenciaste cuando subiste a YouTube.

Cómo la moción de Google para desestimar la demanda Lyria 3 enmarca tu subida a YouTube, qué es DISCO-12M en realidad, y por qué la cobertura hasta ahora ha sido solo en inglés.

Leer en Playback

In English