Andrea Bartz, Charles Graeber e Kirk Wallace Johnson v. Anthrópica PBC, recuperada em 25 de junho de 2025, faz parte de Série PDF legal de Hackernoon. Você pode pular para qualquer parte neste arquivamento aqui. Esta é a Parte 8 de 10.
3. A quantidade e a substancial da parte usada
O terceiro fator de uso justo é “a quantidade e a substancial da parte” do trabalho protegido por direitos autorais usado pelo acusado. 17 USC § 107 (3). O cerne desse fator é se a quantidade era “razoável em relação ao objetivo da cópia”. Campbell, 510 US em 586. Assim, a quantidade de cópia é considerada primeiro contra a própria obra, depois mais importante contra o proposto proposto para fins transformadores. Veja Warhol, 598 EUA em 543 & n.18.
A. As cópias usadas para treinar LLMs específicos
As cópias selecionadas para inclusão nos conjuntos de treinamento foram selecionadas porque estavam completas e porque continham uma expressão rica protegível, ou assim, essa ordem aceita os shows de registro para os autores. Toda essa cópia foi razoavelmente necessária para o uso transformador?
Sim.
“O que importa [ ] não é tanto ‘a quantidade e a substancial da parte usada’ em fazer uma cópia, mas a quantidade e a substancial do que é assim tornado acessível a um público [in the purported secondary use] para o qual pode servir como um substituto concorrente [for the primary use]. ” Google, 804 F.3d em 222. Aqui, mais uma vez, não há alegação de qualquer conexão rastreável entre as saídas do Serviço Claude e os trabalhos dos autores.
Em resposta, os autores se opõem principalmente a que a cópia usada no treinamento era extremamente extensa e não estritamente necessária.
Quanto à cópia extensa, é verdade que trabalhos inteiros foram copiados. E “copiando [ ] trabalho inteiro[s] Militar[s] contra uma descoberta de uso justo. Indirecionado.
Quanto a uma necessidade estrita, os autores fazem um ponto mais forte. Quando um uso produtivo é possível apenas emprestando um trabalho específico, o uso justo sobe em direção ao seu zênite. Quando um uso produtivo é possível sem esse empréstimo, o uso justo cai em seu nadir – e o empréstimo merece uma justificativa particularmente atraente. Veja Warhol, 598 EUA em 543 & n.18, 547. Aqui, é verdade que o Antrópico poderia ter usado outros livros ou nenhum livro para treinar seus LLMs – ou assim, esta ordem aceita os shows dos autores. Mas o Anthropic apresentou uma explicação convincente para o motivo pelo qual era razoavelmente necessário usá -los de qualquer maneira.
Por um lado, todos concordam que os bilhões de palavras antrópicas precisavam treinar qualquer LLM. Se usando apenas livros, o antrópico precisaria de milhões de livros por modelo. Se usar um conjunto compreendendo apenas uma pequena fração de livros e uma fração maior de outros textos, o antropic ainda precisaria de centenas de milhares de livros. Os autores afirmam que, como o Antrópico mostrou que poderia usar conjuntos de livros tão menores, certamente não poderia ter usado livros – ou pelo menos não seus livros (Opp. 23). Mas os autores esquecem que “razoavelmente necessário” não significa “estritamente necessário”. Os autores não contestam que o volume de texto necessário para treinar um LLM seja monumental. Como o uso de tantas obras era razoavelmente necessário, o uso de qualquer um trabalho para o treinamento de LLMs era tão razoável quanto o próximo.
Para outra coisa, nenhuma saída para o público foi acusada de infringir. Então, sim, os trabalhos dos autores foram escolhidos como os exemplos mais fortes de escrita. Mas os benefícios convincentes do treinamento dos LLMs em exemplos fortes não foram compensados por revelações ao público de qualquer parte das obras. O que foi copiado foi, portanto, especialmente razoável e convincente.
O terceiro fator, portanto, favorece o uso justo para as cópias de treinamento.
B. As cópias usadas para construir uma biblioteca central
Mas, novamente, houve um uso separado – uma distinção que faz alguma diferença sobre se a quantidade e a substancialidade da cópia era “razoável em relação ao objetivo da cópia” para as cópias da biblioteca. Campbell, 510 US em 586.
(i) As cópias da biblioteca adquiridas convertidas de impressão para digital.
Para a biblioteca de impressão cópias que o antrópico comprou e depois convertido em cópias da biblioteca digital, antrópico já teve o direito de manter as cópias em sua biblioteca. O objetivo da cópia era mantê -los em sua biblioteca, mas com propriedades mais favoráveis de armazenamento e pesquisa. Copiar todo o trabalho foi exatamente o que esse objetivo exigia. Não houve cópia excedente. A cópia fonte foi destruída.
O terceiro fator de uso justo favorece o uso justo para as cópias da biblioteca adquiridas convertidas de impressão para digital.
(ii) as cópias da biblioteca pirata.
Para as cópias da biblioteca pirata, no entanto, o Antrópico não tinha direito a manter cópias dos livros. Seu objetivo, diz ele, era treinar LLMs. Mas sua conduta objetiva era procurar “todos os livros do mundo” e depois mantê -los, mesmo depois de decidir que não faria mais cópias deles para treinamento – indicando que havia outros usos adicionais. Contra o objetivo de adquirir todos os livros que alguém poderia, com a chance, alguns podem ser úteis para o treinamento de LLMs e talvez outras coisas, quase qualquer cópia não autorizada teria sido demais. Antrópica copiava milhões de livros em Toto, os autores trabalham entre eles.
O terceiro fator aponta contra o uso justo para as cópias da biblioteca pirata.
Sobre a série PDF legal de Hackernoon: trazemos a você os mais importantes e perspicazes registros de casos de domínio público.
Este processo judicial recuperado em 25 de junho de 2025, do storage.courtlistener.com, faz parte do domínio público. Os documentos criados pelo tribunal são obras do governo federal e, nos termos da lei de direitos autorais, são automaticamente colocados em domínio público e podem ser compartilhados sem restrição legal.