Close Menu
  • Notícias
  • Ciência e Tecnologia
  • Games
  • TV e Cinema
  • E-Sports
  • Análises
  • Dicas

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
Dan Stevens

Dan Stevens em negociações para reprisar papel na sequência de Godzilla x Kong

3 fevereiro 2025, 18:25
Cobra Kai

Cobra Kai Temporada 6 Parte 3: novo trailer revelado

3 fevereiro 2025, 18:18
antonie

Produtor de Capitão América 4 detalha papel principal de Anthony Mackie em Vingadores: Doomsday

3 fevereiro 2025, 17:52
Facebook X (Twitter) Instagram
Geek de Primeira
  • Notícias
  • Ciência e Tecnologia
  • Games
  • TV e Cinema
  • E-Sports
  • Análises
  • Dicas
Geek de Primeira
Início » ChatGPT memoriza e escreve poemas inteiros, apesar dos direitos autorais
chatgpt
Ciência e Tecnologia

ChatGPT memoriza e escreve poemas inteiros, apesar dos direitos autorais

Por Luana Lima11 janeiro 2024, 13:00Nenhum comentário3 minuto de leitura
Compartilhar
Facebook Twitter LinkedIn Pinterest Email

Se você pedir ao ChatGPT um poema conhecido, ele provavelmente escreverá o texto inteiro, independentemente da lei de direitos autorais, pelo menos de acordo com um novo estudo realizado por pesquisadores da Cornell.

O estudo apresentado na Conferência de Pesquisa em Humanidades Computacionais mostrou que o ChatGPT, um chatbot baseado em um grande modelo de linguagem desenvolvido pela OpenAI, estava “memorizando poemas”, especialmente os famosos que são comumente encontrados on-line. Isso levanta questões éticas sobre como o ChatGPT e outros modelos de IA são treinados usando dados extraídos da Internet.

“Em geral, não é bom que modelos de linguagem grandes memorizem grandes trechos de texto, em parte porque isso é uma questão de privacidade. Não sabemos em que eles foram treinados e, muitas vezes, empresas privadas podem treinar modelos proprietários em nossos dados privados”, disse a primeira autora Lyra D’Souza em um comunicado à imprensa. D’Souza é formada em ciência da computação e assistente de pesquisa de verão em Cornell.

Leia Também:  A Volkswagen integra o ChatGPT em seus veículos

Os pesquisadores têm muitos motivos para escolher poemas. Eles são curtos o suficiente para se encaixar no contexto de um modelo de linguagem. Mas, ao mesmo tempo, seu status é complicado. Muitos dos poemas estudados pelos pesquisadores estão tecnicamente protegidos por direitos autorais, mas estão amplamente disponíveis on-line em fontes confiáveis, como a Poetry Foundation.

Modelos de linguagem grandes são treinados para gerar texto prevendo a próxima palavra mais provável, repetidamente. Eles fazem isso com base em seus dados de treinamento, que consistem principalmente de páginas da Web. Esses modelos podem começar a memorizar quando seus dados de treinamento incluem passagens duplicadas. Isso ocorre porque a duplicação reforça essa sequência específica de palavras.

Leia Também:  OpenAI lança a GPT Store para capitalizar o sucesso do ChatGPT

Por exemplo, se um modelo for exposto ao mesmo poema repetidamente, ele reproduzirá o poema literalmente algumas vezes.

Os pesquisadores testaram os recursos de reprodução de poemas do ChatGPT e de três outros modelos de linguagem de grande porte – PaLM do Google, Pythia do instituto de pesquisa de IA sem fins lucrativos EleutherAI e GPT-2, uma versão anterior do GPT 4 que sustenta o ChatGPT. Eles reuniram um conjunto de poemas de 60 poetas americanos de diferentes períodos, raças, gêneros e níveis de fama e, em seguida, solicitaram aos modelos o texto dos poemas.

O ChatGPT recuperou com sucesso 72 dos 240 poemas, enquanto o PaLM obteve apenas 10. Tanto o Pythia quanto o GPT-2 falharam na recuperação de poemas completos. O Pythia repetiu a mesma frase várias vezes, enquanto o GPT-2 produziu um texto sem sentido. Isso talvez não pudesse ter ocorrido em um momento pior para a OpenAI, que foi atingida por ações judiciais movidas por escritores de ficção e não ficção sobre o suposto uso de seu trabalho para treinar programas de IA.

Leia Também:  OpenAI lança a GPT Store para capitalizar o sucesso do ChatGPT
ChatGPT
Compartilhar. Facebook Twitter Pinterest LinkedIn Tumblr Email
Luana Lima
Luana Lima
  • Facebook

Editora no Geek de primeira é formada em Redes, Adora pesquisar sobre novas tecnologias de Hardwares, E as novas inovações e criações de Softwares.

Veja também

Dan Stevens

Dan Stevens em negociações para reprisar papel na sequência de Godzilla x Kong

3 fevereiro 2025, 18:25
Cobra Kai

Cobra Kai Temporada 6 Parte 3: novo trailer revelado

3 fevereiro 2025, 18:18
antonie

Produtor de Capitão América 4 detalha papel principal de Anthony Mackie em Vingadores: Doomsday

3 fevereiro 2025, 17:52
A Caçada a Gollum

A Caçada a Gollum; Ator Viggo Mortensen aborda possível retorno como Aragorn

29 maio 2024, 17:45
Adicionar um comentário

Comments are closed.

ÚLTIMAS NOTÍCIAS
ÚLTIMAS ANÁLISES
Geek de Primeira
  • Sobre Nós
  • Contato
  • Equipe
  • Política de Privacidade
© 2025 Geek de Primeira - Todos os direitos reservados

Type above and press Enter to search. Press Esc to cancel.