Robô android com as mãos na cabeça
Shutterstock

A OpenAI, a empresa por trás do popular sistema de Inteligência Artificial (AI) ChatGPT, disse durante esta semana que está melhorando as habilidades matemáticas de resolução de problemas do chatbot com o objetivo de reduzir as chamadas “alucinações” da ferramenta.

“Mitigar as alucinações é um passo crítico para a construção de AIs”, disse a OpenAI em um post.

Publicidade

A mais recente iteração do ChatGPT, GPT-4, lançada em março, continua a empurrar a inteligência artificial para o mainstream. Mas os chatbots generativos de AI vem tendo problemas com fatos e inventam informações falsas — coloquialmente conhecidas como “alucinações.”

As alucinações de AI referem-se a casos em que uma AI gera resultados inesperados e falsos, não apoiados por dados do mundo real. As alucinações de AI podem ser conteúdo falso, notícias ou informações sobre pessoas, eventos ou fatos.

A OpenAI adverte os usuários contra a confiança cega no ChatGPT, apresentando um aviso que diz: “O ChatGPT pode produzir informações imprecisas sobre pessoas, lugares ou fatos.”

Embora a OpenAI não tenha citado nenhum exemplo específico que tenha conduzido à investigação mais recente sobre alucinações, dois acontecimentos recentes ilustraram a questão em situações do mundo real.

Em abril, Jonathan Turley, advogado de defesa criminal dos EUA e professor de direito, afirmou que o ChatGPT o acusou de cometer agressão sexual. Pior, a AI inventou e citou um artigo do Washington Post para fundamentar a alegação.

Publicidade

Na semana passada, Steven A. Schwartz, advogado do caso Mata vs. Avianca Airlines, admitiu “consultar” o chatbot como fonte ao realizar pesquisas. O problema? Os resultados que o ChatGPT forneceu à Schwartz foram todos fabricados.

“Isso é culpa do declarante ao não confirmar as fontes fornecidas pelo chat GPT dos pareceres legais que forneceu”, escreveu Schwartz na declaração apresentada ao tribunal, acrescentando que” lamenta muito ” a utilização de inteligência artificial gerativa para complementar a pesquisa. Schwartz jurou nunca mais fazê-lo sem uma verificação absoluta da sua autenticidade.

Choque do ChatGPT

Em fevereiro, a gigante da tecnologia Microsoft deu aos repórteres uma demonstração dos recursos do Chatbot do Bing, incluindo relatórios de ganhos, especificações de aspiradores de pó e planos de viagem. Os resultados foram menos do que estelares.

“Estou chocado que a equipe do Bing tenha criado esta demonstração pré-gravada cheia de informações imprecisas e a apresentado com confiança ao mundo como se fosse boa”, disse o Pesquisador de AI, Dmitri Brereton, que participou do evento, no Substack. “Estou ainda mais chocado que esse truque tenha funcionado e todos pularam no trem de propaganda do Bing AI sem fazer um pingo de avaliação prévia.”

Publicidade

Apesar desses problemas, a Microsoft está apostando muito no ChatGPT, incorporando a tecnologia em seu navegador Bing após um investimento de US$ 13 bilhões na OpenAI.

Em sua pesquisa, a OpenAI comparou a “supervisão de resultados”, que fornece feedback com base em um resultado final, e a “supervisão de processos”, que fornece feedback para cada etapa de uma cadeia de pensamento.

“Avaliamos nossos modelos de recompensa supervisionados por processos e resultados usando problemas do conjunto de testes de matemática”, disse a OpenAI. “Geramos muitas soluções para cada problema e, em seguida, escolhemos a solução classificada como a mais qualificada por cada modelo de recompensa.”

A equipe de investigação concluiu que a supervisão do processo proporcionou um melhor desempenho, uma vez que incentiva o modelo a seguir um processo aprovado pelo homem, ao passo que a supervisão dos resultados é geralmente mais difícil de analisar.

A OpenAI reconheceu que não se sabe como os resultados irão além da matemática, mas diz que o trabalho futuro deve explorar o impacto da supervisão de processos em outros domínios. A empresa divulgou seu conjunto completo de dados de supervisão de processos para incentivar a pesquisa.

Publicidade

“Se esses resultados se generalizarem, podemos descobrir que a supervisão de processos nos dá o melhor dos dois mundos — um método que é mais eficiente e mais alinhado do que a supervisão de resultados”, disse OpenAI.

A OpenAI ainda não respondeu ao contato do Decrypt.

*Traduzido por Gustavo Martins com autorização do Decrypt.

VOCÊ PODE GOSTAR
Ilustração de moeda gigante de Bitcoin observada por investidores e prestes a ser cortada ao meio

Quando será o próximo halving do Bitcoin?

O tão falado halving do Bitcoin acabou de acontecer, e o próximo já está no horizonte.
moeda de bitcoin à frente da bandeira de hong kong

Aprovação de ETFs de Bitcoin e Ethereum pode ocorrer segunda em Hong Kong

O esperado aceno regulatório abriria um dos maiores mercados financeiros do mundo para os ETFs de Bitcoin e Ethereum
Imagem da matéria: ETF de Bitcoin da BlackRock encerra sequência de 71 dias de entradas

ETF de Bitcoin da BlackRock encerra sequência de 71 dias de entradas

Após entrar no top 10 de ETFs com a maior sequência de entradas diárias, o ETF da BlackRock deu uma pausa
Moedas douradas à frente de bandeira do Brasil

Fundos cripto do Brasil captam R$ 28 mi enquanto balanço global segue negativo pela 2º semana

Fundos de criptomoedas enfrentaram saídas de US$ 206 milhões com mercado tentando entender o que irá acontecer com os preços após o halving; Brasil seguiu sentido contrário e ficou no verde