tela de celular mostra logo da deepseek
Shutterstock

A plataforma de inteligência artificial DeepSeek impactou o mundo financeiro e tecnológico como um cometa na última semana. A empresa chinesa afirma ter investido apenas US$ 5 milhões — menos de um vigésimo do padrão — para treinar um modelo que, ao que tudo indica, é tão poderoso quanto, ou até superior a, seus principais concorrentes.

O resultado foi um terremoto que derrubou bolsa ao redor mundo e que em questão de 24 horas estilhaçou todas as previsões que existiam para o futuro da tecnologia. 

Uma semana no mundo “pós-DeepSeek”, especialistas, mercado e público começam a entender melhor o potencial da empresa. O número de US$ 5 milhões vem sendo contestado por alguns concorrentes e a OpenAI afirma que a startup chinesa usou ilegalmente dados do ChatGPT para treinar sua IA.

Publicidade

Mas uma coisa parece ser unânime: o DeepSeek produz ótimos resultados, no mesmo nível do que existe de vanguarda em Inteligência Artificial — Sam Altman, CEO da OpenAI, disse que a ferramenta chinesa é “impressionante”.

“De maneira prática, no uso trivial, realmente não há diferenças notáveis nos dois modelos (o que já é impressionante por si só). A diferença é que o DeepSeek é 100% gratuito”, afirma Ana Freitas, jornalista de formação e que nos últimos anos se especializou em pesquisar e ensinar sobre Inteligência Artificial no Brasil.

Ana Freitas, pesquisadora de Inteligência Artificial (Foto: Arquivo Pessoal)

A pesquisadora diz acreditar que há algo errado nos dados financeiros divulgados pelo DeepSeek — embora não possa afirmar com certeza. No entanto, isso não diminui o feito da plataforma, que já alcançou o impensável: rivalizar com o ChatGPT e o Claude.

Um ponto ressaltado por Freitas é que o projeto do DeepSeek é open source, o que pode acelerar o desenvolvimento de ferramentas ao redor do mundo: “Tem sim o potencial de democratizar o acesso a desenvolvimento de modelos e também de aplicações que usam a tecnologia via API. Claro que existem outros modelos open source já no mercado, incluindo o Llama, da Meta. Mas nenhum é tão bom quanto o DeepSeek.”

Publicidade

Nessa guerra tecnológica, a pesquisadora aponta que em um futuro de dois a quatro anos, a perspectiva não é de modelos que simplesmente entreguem melhores respostas. “De marco realmente disruptivo, em algo entre 2 e 4 anos devemos ver o desenvolvimento da AGI, a Inteligência Artificial Geral, que tem tantos potenciais benefícios sem precedentes para a humanidade, quanto riscos.”

Ana Freitas é diretora de inovação e formação da Quid, uma organização sem fins lucrativos que atua como um laboratório de comunicação oara causas, e também uma das idealizadoras do CR_IA, que desde 2022 oferece cursos de IA generativa para pessoas e empresas, consultorias e desenvolve projetos tailor-made em IA.

Leia abaixo a entrevista completa:

O DeepSeek, dizem, consegue entregar a mesma potência dos concorrentes com uma fração do custo. Existem rumores de que os números divulgados desse custo são muito baixos para serem verdade. Acha improvável os números que estão sendo divulgados, de que teria sido um gasto de apenas US$ 5 milhões para treinar o modelo?

Ana Freitas: Embora eu não possa afirmar, acho que é razoável supor que que eles tenham maquiado planilhas de gastos e/ou usado tecnologia da OpenAI (algum tipo de vazamento de dados, como a própria OpenAI tem acusado) para treinar o modelo (o que aceleraria o tempo de desenvolvimento e reduziria custos). De fato é um valor muito menor, 20x menor, o que pede no mínimo cautela diante da informação. 

Publicidade

Não sabemos quais custos o DeepSeek está considerando dentro desses US$ 5,5 milhões que eles informaram terem gastado – e se os custos de servidor, de infraestrutura, de pesquisa, de testes, eventualmente até de licenciamento de conteúdo de treinamento (por mais que a OpenAI só tenha feito esse movimento de pagar para licenciar conteúdo mais recentemente, isso soma ao custo de desenvolvimento total da ferramenta).

Mas mais importante, essa premissa de que entrega a mesma potência é real? 

Ana Freitas: De acordo com benchmarks, o DeepSeek entrega uma capacidade de resolução de problemas que rivaliza a de modelos como o ChatGPT e o Claude, e é realmente impressionante. Ainda assim é importante notar também que a ferramenta em si não oferece todos os recursos que o ChatGPT ou mesmo que o Claude oferece, como geração de imagens, GPTs personalizados, o mais recente modo de agente… todas essas coisas somam em termos de custo de desenvolvimento, de pesquisa, de testes, estrutura e valor agregado. 

Isso não é tirar o mérito do modelo, que parece ter sido construído em tempo recorde e provavelmente com custo menor do que o rival americano. Mas é dizer que é importante observar com cautela essas informações que comparam as duas coisas de maneira muito simplista.

De maneira prática, no uso trivial, realmente não há diferenças notáveis nos dois modelos (o que já é impressionante por si só). A diferença é que o DeepSeek é 100% gratuito.

Já se sabia na comunidade de IA que essa empresa na China estava desenvolvendo um modelo tão avançado ou foi uma completa surpresa? Ou até mesmo que na China, como país, se estivesse em um ponto tão avançado na tecnologia?

Publicidade

Ana Freitas: No geral, a gente vinha acompanhando o desenvolvimento de modelos da AliBaba, com novidades interessantes deles, mas nenhuma Open Source ou então que replicasse o modelo de raciocínio do DeepSeek. O DeepSeek foi lançado no fim do ano passado, a propósito. Demorou algumas semanas para hypar.

O fato de ser open source tem potencial para acelerar o desenvolvimento da tecnologia por empresas menores que podem ter essa base já pronta?

Ana Freitas: Sem dúvida. Qualquer um pode trabalhar em cima do modelo e construir o seu próprio, o que é uma vantagem incrível em um modelo de linguagem com capacidade tão impressionante. Tem sim o potencial de democratizar o acesso a desenvolvimento de modelos e também de aplicações que usam a tecnologia via API. Claro que existem outros modelos open source já no mercado, incluindo o Llama, da Meta. Mas nenhum é tão bom quanto o DeepSeek.

Qual o próximo grande passo dos modelos de IA? Em um futuro próximo, digamos dois anos, acha que teremos um grande salto, como foi quando o GPT 3.5 foi ao ar?

Ana Freitas: Na verdade, temos alguns marcos intermediários e um marco maior, mais central, nos próximos anos. O principal marco disruptivo é a evolução dos modelos de linguagem para ferramentas que atuam como agentes, ou seja, que controlam o seu computador ou celular executando uma série de tarefas em sequência com base em compreensão e processamento de linguagem.

Você não precisaria executar as tarefas no computador, mas pediria para a IA, que as executaria entendendo o que você precisa e encadeando diferentes aplicações e workflows automaticamente. Isso já é realidade em alguns modelos, mas tende a ser a próxima fronteira para o uso de IA como um todo. A OpenAI lançou há poucas semanas um modo agente, disponível somente em seu modelo mais caro, e o Claude também tem um modo de agente disponível via API. 

Publicidade

De marco realmente disruptivo, em algo entre 2 e 4 anos devemos ver o desenvolvimento da AGI, a Inteligência Artificial Geral, que tem tantos potenciais benefícios sem precedentes para a humanidade quanto riscos. A AGI é uma tecnologia que não é apenas bot mais inteligente, como uma versão 5.0 do ChatGPT, um bot que tem a mesma capacidade que um humano (ou até mais) em diferentes áreas do conhecimento, e inclusive tem a habilidade de aprender, entender e aplicar conhecimentos de diferentes maneiras, além de se adaptar a novas situações como um humano faria.

A AGI consegue resolver problemas mais complexos de maneira integrada sem a necessidade de reprogramação. O problema é que o poder da AGI não oferece só possibilidades de desenvolvimento humano sem precedentes mas é também vista como um risco fundamental para a existência da humanidade. 

Acha que as criptomoedas poderiam ser algo como o meio de pagamento oficial em um mundo no qual agentes de IA podem criar e manejar smart contracts e coisas do gênero?

Ana Freitas: Em um mundo inundado de fake news e deepfakes, em que se torna cada vez mais difícil atestar a origem e a autenticidade de conteúdo e da informação, blockchain pode ser a tecnologia que precisamos para conseguir identificar de maneira inequívoca a autenticidade e as alterações e modificações. Já existem algumas iniciativas nesse sentido e eu acredito que é para onde a gente vai.

VOCÊ PODE GOSTAR
Tela de smartphone mostra logomarca da Cardano

Cardano passa por hard fork hoje; veja o que muda

O hard fork ‘Plomin’ marca a transição da Cardano para uma governança “totalmente descentralizada”
Microstrategy, Michael Saylor, bitcoin, hold, hodle

MicroStrategy compra US$ 1,1 bilhão em Bitcoin na 12ª semana consecutiva

Nesta última compra, a MicroStrategy pagou um valor superior à cotação atual do Bitcoin
Gary Gensler, presidente da SEC

Ex-presidente da SEC voltará ao MIT para ensinar inteligência artificial

Gary Gensler levará sua expertise sobre riscos da inteligência artificial para a sala de aula em um momento em que a corrida global por modelos avançados de IA se intensifica
ilustração de IA em forma humana humano sinalizando 'pense'

5 tokens de IA promissores para investir em fevereiro

Atualmente existem muitos projetos de cripto relacionados à inteligência artificial, que se expandiu notavelmente nos últimos anos