Imagem da matéria: Gemini Advanced ou ChatGPT Plus: qual escolher se você estiver disposto a pagar?
(Foto: Decrypt)

O ChatGPT da OpenAI tornou-se um nome familiar quando se trata de ferramentas de Inteligência Artificial, mas o Google não está ficando para trás. Com sua nova marca Gemini e o serviço Gemini Advanced, o Google lançou um forte concorrente para o principal produto da OpenAI.

O Google afirma que o Gemini Advanced (uma evolução do seu chatbot Bard anterior) supera o GPT-4 — mas será mesmo? Se você tem apenas US$ 20 por mês para gastar, qual ferramenta de IA multimodal paga você deveria usar?

Publicidade

Vamos esclarecer: não há um “melhor” claro aqui. O que diferencia esses chatbots não é necessariamente qual é objetivamente “mais inteligente”, mas quais recursos, capacidades de nicho e integrações externas se alinham melhor com suas ferramentas e fluxos de trabalho existentes.

Se vale a pena gastar seus US$ 20 por mês em uma dessas poderosas ferramentas depende inteiramente das ferramentas que você já usa e das tarefas com as quais precisa de ajuda, e estamos aqui para ajudá-lo a decidir com os detalhes minuciosos.

Geração de imagem: realismo versus flexibilidade

Tanto o Gemini quanto o ChatGPT Plus podem transformar suas palavras em representações visuais. Ao contrário da Stable Diffusion e de outros geradores de imagens, esses dois entendem prompts em linguagem natural. O foco atual do Gemini é alcançar realismo, mas fica aquém do modelo ImageFX do Google, que, mesmo em beta, nos impressionou e pode eventualmente ser implementado no Gemini Advanced. Mas esses dois só podem gerar imagens quadradas de 1024×1024.

O Dall-E 3 da OpenAI troca realismo por maior flexibilidade. Você pode especificar dimensões de imagem (quadrado, retrato, 16:9, etc.), uma vantagem se você precisa de visuais personalizados para sites específicos ou designs e quer evitar o recorte manual. Mas ele tem um estilo de desenho animado característico que faz com que as imagens do Dall-E sejam facilmente reconhecíveis de longe.

Publicidade
Imagem gerada pelo Gemini (esquerda) e ChatGPT (direita)

Escolher um ou outro depende dos seus objetivos. Se deseja fotos de produtos quase perfeitas para uma loja online, ainda pode precisar de ferramentas especializadas como as oferecidas pela Adobe ou Corel. Mas para ilustrações caprichosas ou visuais de brainstorming lúdicos, qualquer um desses concorrentes pode ser suficiente, deixando espaço para sua preferência pessoal de estilo.

Conveniência de voz: em casa versus em movimento

Às vezes, você quer ouvir as respostas da sua IA, seja para permitir a multitarefa ou simplesmente para dar um descanso de olhar para uma tela. Graças à sua conexão com o ecossistema do Google, o Gemini oferece um recurso de leitura em voz alta sem emendas. No entanto, o ChatGPT Plus tem sua própria vantagem: um aplicativo móvel nativo que permite que suas conversas aconteçam praticamente em qualquer lugar. Em termos gerais, a voz da OpenAI parece mais humana, mas está disponível apenas via smartphone.

A escolha se resume a como você trabalha. Se o uso da sua IA ocorre principalmente em uma mesa onde a integração com outras ferramentas do Google é útil, o Gemini vence. Mas para aqueles que estão constantemente em movimento, ter essas conversas narradas enquanto mantêm o telefone no bolso pode incliná-lo para o ChatGPT Plus. Isso pode parecer importante para pessoas com deficiência visual, mas muitas preferem outros métodos de texto para fala (TTS) que reproduzem o conteúdo em velocidades extremamente altas porque acham a cadência de uma “voz natural” muito lenta. Nesses casos, ambos os sites são compatíveis com TTS, então é indiferente.

Necessidade de velocidade

Vamos dar uma olhada por baixo do capô, por assim dizer. Embora seu “poder cerebral” (contexto de token) pareça comparável, há uma enorme diferença em velocidade: o Gemini Ultra é extremamente rápido quando comparado ao GPT-4 (ou ao Claude AI da Anthropic). Com o Gemini Ultra, você obtém saídas de qualidade GPT-4 com velocidades GPT-3.5.

Publicidade

Por exemplo: o Decrypt usou o prompt “Por favor, demore o tempo que precisar e escreva um ensaio sobre por que as criptomoedas podem desempenhar um papel importante na formação do futuro das transações econômicas.” O Gemini Advanced levou 12,14 segundos para escrever o ensaio inteiro, enquanto o GPT-4 precisou de quase um minuto — 53,13 segundos, para ser exato. A versão anterior do chatbot da OpenAI, GPT-3.5 Turbo, levou 11,06 para escrever seu ensaio.

Privacidade Importa

Uma das maiores preocupações gerais sobre IA é a privacidade: para onde os prompts e outras informações que você fornece são transmitidos, mantidos e acessados. O ChatGPT mantém suas conversas por 30 dias, usando isso para melhorar suas respostas — mas pessoas preocupadas com a privacidade podem ficar cautelosas. O Google, por outro lado, armazena as suas por impressionantes 18 meses.

Ambos os serviços levantam diferentes preocupações com a privacidade, tornando essa escolha tanto sobre seus sentimentos em relação aos dados quanto sobre os recursos. Felizmente, ambos também têm uma opção para deletar conversas — e uma opção para compartilhá-las.

Vitória de nicho do ChatGPT: análise de PDF

Se você vive e respira PDFs, essa disputa é clara: o ChatGPT Plus pode mergulhar nesses documentos para extrair insights, responder às suas perguntas sobre o documento e, geralmente, economizar seu tempo. O Google, provavelmente por razões legais ou técnicas, não integrou tais recursos no Gemini. Isso pode ser um problema se seus PDFs são pedaços curtos de texto que você pode simplesmente copiar e colar. Mas para quem lida com papelada de clientes, tabelas ou estudos de pesquisa, isso pode ser um fator decisivo.

Isso não é necessariamente um retrocesso permanente para o Gemini, mas por enquanto, aqueles que trabalham intensivamente com PDFs têm um motivo convincente para optar pelas capacidades aprimoradas do ChatGPT. Além disso, o Claude AI pode analisar PDFs gratuitamente — e seu modelo é quase tão bom e preciso quanto o GPT-4.

Publicidade

Guerras de Pesquisa

Se a qualidade dos resultados de pesquisa integrados às suas sessões de chatbot importa, a ligação nativa do Gemini com o Google vence de longe.

O Gemini Advanced permite que os usuários obtenham respostas em tempo real, com o modelo buscando dados do Google Search na hora. Outro recurso extremamente útil é que o Gemini Advanced tem um botão que permite às pessoas usar o Google Search para verificar todos os fatos em uma interação. Isso minimiza o impacto da ocasional alucinação e ajuda na raspagem de fontes e na verificação de fatos.

O ChatGPT se apoia no Bing, que, embora esteja melhorando, realmente não pode competir com a dominação do Google.

É importante notar que toda resposta fornecida por um chatbot está propensa a incluir alucinações. Essa é a natureza da IA generativa. Se um modelo não pode alucinar, então reproduziria por padrão informações já existentes. A verificação de fatos é extremamente importante ao interagir com modelos de IA.

O que o ChatGPT Plus tem que o Gemini Advanced não tem

Ecossistema Aberto e Integrações de Terceiros: o ChatGPT Plus se destaca integrando-se a aplicativos de terceiros — tanto plugins quanto GPTs gerados por usuários. Isso cria infinitas possibilidades para os usuários adicionarem plugins que interagem diretamente com seu assistente de IA, agilizando fluxos de trabalho e desbloqueando funcionalidades especializadas. Mudar para o Google Gemini parecerá um rebaixamento se você estiver acostumado a trabalhar com o Canva ou o Zapier e integrá-los ao ChatGPT em seu fluxo de trabalho.

Conversas Personalizadas (e Lucrativas): a loja GPT visa recompensar os criadores, prometendo inovação contínua e crescimento dentro do ecossistema do ChatGPT. Se você quer ganhar dinheiro criando chatbots personalizados ou quer experimentar conversas especificamente adaptadas com GPTs que garantem que seu chatbot saiba mais sobre um tópico específico, adote um estilo específico e possa ser mais personalizado do que qualquer outra opção… então não procure em outro lugar e pague pelo ChatGPT Plus.

Edições de Meio de Conversa para Eficiência: Com o ChatGPT Plus, você pode ajustar um prompt anterior mesmo dentro de uma conversa de várias partes. Por exemplo, imagine uma interação de 6 shots com seis comandos e seis respostas. No ChatGPT, o usuário pode editar o quarto comando, e o ChatGPT geraria uma nova resposta considerando todo o contexto antes dessa interação. Isso economiza muito esforço e torna a sessão mais eficiente. Com o Google, os usuários precisariam iniciar uma nova sessão se percebessem que cometeram um erro em um comando anterior.

Publicidade

Essa funcionalidade do ChatGPT Plus economiza tokens preciosos e evita reiniciar sessões inteiras, otimizando a interação e mantendo seu fluxo criativo.

O que o Gemini Advanced tem que o ChatGPT Plus não tem

Armazenamento em Nuvem Agrupado e Extras: A inclusão de uma assinatura de 2TB do Google One é uma economia substancial para aqueles já dentro do ecossistema do Google. Planos semelhantes custam cerca de US$ 10 mensais no iCloud e US$ 12 no Dropbox. Para esses usuários, mudar para o Gemini Advanced efetivamente reduz custos, pois seria apenas US$ 10 adicionais em média por um chatbot de IA de primeira linha, em vez dos US$ 20 que os usuários pagariam se estivessem usando o ChatGPT Plus ao lado de um serviço de nuvem.

Alimentado pelo Google para Precisão: O Gemini Advanced verifica suas respostas contra o vasto conhecimento da Pesquisa Google em tempo real. Isso significa informações precisas e atualizadas na ponta dos seus dedos, respaldadas pela confiabilidade e relevância do Google. O ChatGPT com o Bing não é tão preciso.

Rascunhos Instantâneos e Refinamento de Estilo: O Gemini Advanced permite que você personalize estilos de resposta (formal, casual, elaborado) com o clique de um botão. Não são necessários prompts extras! Para refinar seu trabalho, o Gemini também oferece vários rascunhos com diferentes frases ou focos, permitindo que você compare e melhore rapidamente seus resultados.

Aplicativos Google como Seu Playground de IA: Você pode mergulhar no Google Docs, planejar viagens, brincar com o YouTube, editar conteúdo e colaborar com a ajuda da integração direta do Gemini Advanced. Além disso, aquelas novas e poderosas ferramentas de edição de fotos que você obtém no Google Fotos (Magic Eraser para deletar objetos usando IA, camuflagem, ferramentas de iluminação, melhorias de HDR e mais) tornam-se ainda mais poderosas quando sua IA pode ajudar a ajustar parâmetros de imagem.

Um Veredito… mais ou menos

Se você já paga pelo ChatGPT Plus e usa seus recursos com frequência, o Gemini pode não trazer novidades suficientes para o seu caso de uso para justificar outros US$ 20 mensais. Da mesma forma, se suas necessidades são bastante modestas (assistência na escrita, brainstorming criativo), qualquer um desses serviços se adequaria.

Mas se você quer começar a pagar por um deles, esses extras fornecerão o fator decisivo. 2TB de armazenamento em nuvem, precisão de pesquisa, o pacote do Google – esses fatores inclinam você firmemente para um lado, ou a promessa de integração de aplicativos de terceiros da OpenAI deixa você querendo experimentar? A escolha realmente fica com você, porque quando se trata de IA, “depende” continua sendo a resposta honesta.

*Traduzido com autorização do Decrypt.

VOCÊ PODE GOSTAR
Mineração

Queda do Bitcoin faz com que apenas 6 máquinas de mineração continuem lucrativas

Com um custo de US$ 0.08 kWh, apenas as máquinas ASIC com eficiência de 23 W/T permanecem minerando Bitcoin com lucro
Mão segurando celular com logo da Toncoin e no fundo ícones do Telegram

Rede TON do Telegram vai se conectar ao Ethereum via blockchain de segunda camada

Em meio ao boom dos jogos do Telegram, The Open Network está pronta para lançar uma camada 2 compatível com Ethereum em colaboração com a Polygon
Ilustração de vários hamsters lado a lado vestidos de paletó e gravata

“Hamster Kombat é o serviço digital de crescimento mais rápido do mundo”, diz CEO do Telegram

Pavel Durov afirmou também que o jogo de criptomoedas atingiu 239 milhões de usuários mesmo sem uma data específica para o lançamento do token
Imagem da matéria: Polícia apreende R$ 100 mil em mineradoras de criptomoedas dentro de carro no Paraná

Polícia apreende R$ 100 mil em mineradoras de criptomoedas dentro de carro no Paraná

As mineradoras de criptomoedas estavam em um carro modelo Onix que foi abordado pelos policiais durante a Operação Protetor