Organizações de mídia líderes estão cada vez mais assinando acordos de licenciamento com gigantes da IA. Para jornais como o The New York Times, tal acordo protege sua propriedade intelectual e fornece uma fonte adicional de receita.
Enquanto isso, empresas como OpenAI e Amazon podem treinar seus modelos em informações precisas e evitar processos judiciais por infração de direitos autorais. No entanto, especialistas da IoTeX Network, O.XYZ e AR.IO disseram ao BeInCrypto que alternativas descentralizadas existentes poderiam alcançar os mesmos resultados para criadores de conteúdo de forma mais transparente e equitativa.
A Nova Estratégia de IA do The New York Times
Em um movimento que chamou considerável atenção, o The New York Times assinou um acordo com a Amazon no início deste mês, permitindo que a Amazon use seu conteúdo editorial para treinar os modelos de inteligência artificial (IA) da empresa de tecnologia.
O acordo de licenciamento entre o The New York Times e a Amazon permite que a empresa de tecnologia use artigos do jornal e suas outras publicações. No entanto, o anúncio público do jornal sobre o acordo não revelou os termos financeiros.
Esta decisão marca uma mudança pública na estratégia do The New York Times, que anteriormente se opôs ao uso de modelos de linguagem de grande escala (LLMs) que utilizam seu conteúdo sem permissão.
Em janeiro de 2024, o jornal processou a OpenAI e a Microsoft por infração de direitos autorais. O The New York Times alegou que essas empresas usaram artigos protegidos por direitos autorais para treinar seus LLMs sem permissão ou compensação. Esse processo ainda está em andamento e ainda não teve um resultado.
O The New York Times não é a primeira organização de mídia a processar uma empresa de tecnologia por uso injusto de sua propriedade intelectual.
“Nos últimos anos, muitos grandes projetos de tecnologia enfrentaram inúmeros desafios legais e multas. Por exemplo, o Google enfrentou mais de €8 bilhões em multas da UE na última década devido a práticas de dados inadequadas”, disse Ahmad Shadid, CEO da O.XYZ, ao BeInCrypto.
À medida que os criadores de LLMs precisam de acesso mais amplo a informações precisas, tais acordos estão se tornando cada vez mais comuns.
A Ascensão dos Acordos de Licenciamento
Os acordos de licenciamento estão crescendo em popularidade. No ano passado, a OpenAI, liderada por Sam Altman, assinou um acordo com a empresa multinacional de mídia europeia Axel Springer SE. O acordo espelhava de perto o que foi recentemente feito entre o The New York Times e a Amazon.
O acordo permite que a OpenAI use artigos de organizações de mídia pertencentes a Axel Springer, incluindo Politico, Business Insider e Morning Brew, entre outras publicações internacionais de destaque.
Altman mais tarde assinou acordos semelhantes com o Financial Times, Vogue e as empresas-mãe de veículos como The New Yorker, Cosmopolitan e Le Monde, para citar alguns. A OpenAI concordou em vincular todas as informações relevantes aos artigos originais como parte desses acordos.
À medida que grandes empresas de tecnologia enfrentam pressão crescente sobre violações de propriedade intelectual e infrações de direitos autorais, essas situações são uma vitória para todas as partes envolvidas.
“Após processos judiciais como o que o The New York Times entrou, as empresas de IA estão sendo mais cautelosas sobre o que treinam. Acordos de licenciamento oferecem tranquilidade e, para os editores, é uma chance de transformar décadas de conteúdo arquivado em uma receita constante. Ao mesmo tempo, as empresas de IA se beneficiam do acesso exclusivo a fontes confiáveis, o que ajuda a melhorar a qualidade de seus modelos”, explicou Aaron Basi, Chefe de Produto da IoTeX Network.
Mas, existe uma maneira melhor de alcançar os mesmos resultados com maior transparência?
A Descentralização Pode Trazer Transparência para Acordos de IA?
Está se tornando cada vez mais urgente encontrar uma solução que amplie o acesso a informações confiáveis ao interagir com IA e compense de forma justa seus criadores. Acordos de licenciamento oferecem um caminho para esse objetivo.
“Há um enorme valor estratégico. Esses acordos podem incluir melhor visibilidade, como ser destacado em respostas geradas por IA ou resumos. Também há acesso a análises mostrando como o conteúdo está sendo usado ou interagido”, disse Basi.
Isso também ajuda bastante a prevenir desinformação ao usar LLMs.
“Treinar IA sem dados verificados e transparentes é como voar às cegas. Se não conseguimos rastrear o que entrou, não podemos confiar no que sai. É assim que acabamos com falhas silenciosas criadas por modelos de IA frágeis que carecem de consideração a longo prazo”, disse Phil Mataras, fundador da AR.IO, ao BeInCrypto.
No entanto, esses acordos de licenciamento são frequentemente privados, tornando difícil para criadores de conteúdo menores garantir acordos semelhantes ou proteger-se contra casos de uso injusto. A descentralização tem o potencial de nivelar o campo de jogo aqui.
“Modelos fechados vencem sprints de curto prazo. Modelos descentralizados vencem a maratona. A confiança reina suprema ao lado da transparência e auditabilidade”, acrescentou Mataras.
Existem várias ferramentas diferentes que o Web3 tem a oferecer que podem alcançar tal coisa.
Tokenizando Conteúdo em Redes Descentralizadas
Tecnologias descentralizadas podem criar um sistema mais democrático e transparente para todos os criadores licenciar seu conteúdo. Isso é especialmente benéfico para aqueles frequentemente negligenciados em acordos privados tradicionais.
“Em vez de fechar acordos de licenciamento individuais a portas fechadas, os criadores podem fazer upload de conteúdo para uma rede descentralizada. Contratos inteligentes podem fazer cumprir os termos e lidar automaticamente com os pagamentos. Isso facilita a participação de criadores independentes ou organizações menores. Também cria mais transparência sobre quem está usando os dados e como”, explicou Basi.
A tokenização também oferece aos criadores um método para rastrear o uso ativo de seu conteúdo por modelos de IA.
“Tokenizar conteúdo poderia dar aos editores mais controle e melhor rastreamento. Por exemplo, eles poderiam estabelecer regras sobre acesso ou uso e receber pagamentos automaticamente através de contratos inteligentes. Ainda é cedo, mas para empresas de mídia digitais, esse tipo de configuração pode oferecer novas maneiras de gerar receita sem abrir mão do controle”, acrescentou Basi.
Outras soluções baseadas em blockchain podem garantir um registro inquebrável para fortalecer ainda mais essas opções descentralizadas.
Proteger Propriedade Intelectual Através de Sistemas Baseados em Blockchain
Outro aspecto vital de um ecossistema digital verdadeiramente equitativo envolve garantir autenticidade, rastrear uso e proteger propriedade intelectual. É aqui que sistemas de proveniência baseados em blockchain emergem como soluções poderosas.
Sistemas de proveniência baseados em blockchain são projetados para registrar meticulosamente a história e a linhagem do conteúdo digital. Eles aproveitam as características centrais do blockchain - sua rastreabilidade, transparência e imutabilidade - para criar registros confiáveis e à prova de adulterações.
Todo evento significativo no ciclo de vida de um conteúdo, desde sua criação até quaisquer mudanças ou transferências, pode ser registrado em um livro-razão distribuído, criando um registro inquebrável de sua história.
“Sistemas de proveniência têm sido muito úteis na indústria de tecnologia. Ter que descrever, precisamente, a história de um conjunto de dados que está sendo utilizado ou transferido. Isso ajuda a ditar o proprietário inicial, para quem foi vendido, como foi vendido, quando, e o atual detentor daquele conjunto de dados. Sistemas de blockchain já possuem mecanismos de armazenamento permanente - eles proporcionam rigidez quando se trata de propriedade de dados”, disse Shadid ao BeInCrypto.
Construindo sobre este fundamento de história verificável, ferramentas de marca d'água complementam sistemas de proveniência ao embutir informações ocultas e identificáveis diretamente no conteúdo digital.
“Ferramentas de marca d'água desempenham um papel fundamental em prevenir infrações de direitos autorais, roubo de dados e reivindicações indevidas de propriedade... Essas técnicas trazem um jogo mais difícil para os ladrões de dados e hackers, a fim de fornecer integridade de dados, justiça e ética”, acrescentou Shadid.
Os princípios da descentralização também poderiam ser estendidos à governança e gestão coletiva de conteúdo.
DAOs de Mídia: Empoderando Criadores em Licenciamento de Conteúdo
Em vez de criadores individuais ou a liderança de grandes organizações de mídia tomarem decisões de licenciamento de conteúdo, organizações autônomas descentralizadas (DAOs) poderiam capacitar coletivos de criadores, como jornalistas, a assumir o controle da tomada de decisões de forma colaborativa.
“Um grupo de criadores poderia reunir seu trabalho e usar uma DAO para gerenciar licenciamento, pagamentos e governança. Essa abordagem dá vozes independentes um assento à mesa ao lidar com grandes empresas de IA. Também torna mais fácil negociar termos justos e garante que as decisões sejam tomadas coletivamente. É como um sindicato, mas projetado para a era digital”, explicou Basi.
Apesar do foco na transparência, os acordos de licenciamento entre modelos de IA e fontes de informação ainda estão em estágios iniciais. Isso levanta uma questão crítica: os modelos de código aberto ficarão para trás enquanto as empresas de IA garantem acordos de dados exclusivos?
Acordos de Licenciamento vs. Descentralização: Qual Caminho Terá Sucesso?
O uso não autorizado e opaco de conteúdo por LLMs inicialmente gerou descontentamento significativo entre os criadores originais. Os acordos de licenciamento agora melhoraram a situação.
No entanto, a transparência total ainda não foi vista. Acordos como o firmado entre o The New York Times e a Amazon não serão suficientes para pessoas que desejam saber de onde obtêm seus dados e para criadores que desejam entender como seu conteúdo está sendo usado.
“Modelos fechados vencem sprints de curto prazo. Modelos descentralizados vencem a maratona. A confiança reina suprema ao lado da transparência e auditabilidade”, disse Mataras.
Basi concordou, acrescentando:
“A transparência é uma vantagem poderosa. As pessoas querem entender o que entra nas ferramentas que usam, especialmente em campos sensíveis como saúde ou educação. Projetos de código aberto podem se adaptar rapidamente, obter ajuda da comunidade e construir confiança através da abertura. A longo prazo, essa confiança pode ser mais importante do que o acesso a alguns conjuntos de dados exclusivos.”
Embora acordos de licenciamento sejam um bom ponto de partida, a verdadeira transformação para criadores de conteúdo e transparência em IA provavelmente virá de abordagens descentralizadas e de código aberto.