O The Atlantic mapeou 12 milhões de músicas usadas para treinar IA — e qualquer um pode pesquisar
A repórter Alex Reisner, do The Atlantic, identificou quatro conjuntos de dados musicais utilizados para treinar modelos de IA e transformou essa descoberta em um banco de dados público e pesquisável. Os conjuntos são massivos: apenas dois deles somam 12 milhões de faixas. O projeto permite que músicos, produtores e compositores verifiquem se suas obras foram utilizadas sem permissão para treinar sistemas de IA.
O timing é significativo. A indústria da música está em meio a litígios com empresas de IA sobre uso não autorizado de obras protegidas. Diferentemente dos casos envolvendo texto e imagens — mais discutidos publicamente —, o uso de áudio para treinamento permanecia em grande parte invisível. Esse banco de dados coloca, pela primeira vez, evidências concretas na mão de criadores e advogados.
Por que importa: Se você trabalha com produção musical, trilhas sonoras, jingles ou licenciamento de áudio, essa ferramenta é diretamente relevante para entender se seus direitos foram potencialmente violados. Mais amplamente, é um precedente: quando a transparência sobre dados de treinamento se torna exigência prática, toda a indústria de IA muda.
Fonte
The Vergehttps://www.theverge.com/ai-artificial-intelligence/953183/the-atlantic-searchable-database-music-ai-training-data
Este destaque faz parte da newsletter Limiar #86 — ChatGPT no limite, chatbots não são seus amigos e o atlas musical da IA
Receba conteúdo direto no seu email
Escolha o que funciona melhor pra você.