Agentes de IA se Aproximam da AGI: Previsão da Sequoia para 2026 e a Corrida Rumo aos Sistemas Autônomos

A Sequoia Capital publicou recentemente uma análise intitulada "2026: Isto é AGI" examinando o rápido avanço dos agentes de IA de longo prazo. A empresa observa que esses agentes agora demonstram a capacidade de executar ações e iterar por períodos prolongados, com progresso exponencial ocorrendo neste domínio de pesquisa. A Sequoia estima que até 2028, os agentes completarão tarefas de forma confiável em um nível comparável ao de especialistas humanos, posicionando essa capacidade como um teste decisivo para a Inteligência Artificial Geral.

A pesquisa do Cursor sobre escalonamento de codificação autônoma de longa duração revela que os modelos GPT-5.2 superam o Opus 4.5 e o GPT-5.1-codex para trabalho autônomo prolongado. A análise enfatiza que a seleção de modelos se torna crítica para tarefas extremamente longas, e que muitas melhorias surgem da redução da complexidade em vez de adicioná-la. A pesquisa conclui que, embora infraestrutura e modelos importem, a engenharia de prompts continua sendo o fator mais significativo.

Inteligência Pessoal e IA Contextual

O Google apresentou a Inteligência Pessoal para o Gemini, um recurso beta que conecta o assistente de IA ao Gmail, Fotos, YouTube e Busca para fornecer respostas personalizadas baseadas nos dados do usuário. O sistema emprega a tecnologia "Context Packing" para extrair e comprimir apenas informações relevantes em vez de processar janelas de contexto inteiras. Disponível inicialmente para assinantes do Google AI Pro e Ultra, o recurso permanece desativado por padrão para proteção de privacidade.

O Google também está testando o Gemini Auto Browse para Chrome, um recurso no estilo agente que permitiria à IA navegar na web, gerenciar abas e interagir com o Chrome de forma autônoma. A análise do código sugere que isso pode ser lançado como um recurso premium do Gemini Ultra.

Pesquisa Desafia Práticas Convencionais de Prompting

Um artigo do Google Research desafia práticas estabelecidas de prompting ao demonstrar que simplesmente repetir prompts duas vezes melhora a precisão em Gemini, GPT-4o, Claude e DeepSeek. A técnica venceu 47 de 70 testes de benchmark sem nenhuma perda, com algumas tarefas mostrando melhorias de precisão de até 76 pontos percentuais. O método funciona porque os grandes modelos de linguagem processam texto da esquerda para a direita, e a repetição permite que os tokens referenciem a consulta completa para contexto adicional sem aumentar a latência ou o comprimento da saída.

Grandes Empresas de IA se Aproximam dos Mercados Públicos

OpenAI, Anthropic e SpaceX iniciaram trabalhos preliminares para potenciais IPOs, com avaliações combinadas se aproximando de US$ 2 trilhões. A SpaceX está avaliada em US$ 800 bilhões, a OpenAI em torno de US$ 500 bilhões e a Anthropic perto de US$ 350 bilhões em discussões recentes de financiamento. Se as três prosseguirem, poderiam exceder o capital total levantado de aproximadamente 200 IPOs nos EUA no ano anterior.

A Thinking Machines Lab, fundada pela ex-CTO da OpenAI Mira Murati, perdeu dois cofundadores que retornaram à OpenAI. O cofundador e CTO Barret Zoph partiu junto com Luke Metz e Sam Schoenholz. A startup havia levantado US$ 2 bilhões com uma avaliação de US$ 12 bilhões menos de um ano antes.

Parcerias de Infraestrutura e Computação

A OpenAI assinou um acordo plurianual com a Cerebras no valor de mais de US$ 10 bilhões para receber 750 megawatts de computação até 2028, visando aumentar a velocidade de inferência em todos os produtos da OpenAI. A parceria integra os sistemas em escala de wafer da Cerebras na pilha de inferência da OpenAI para reduzir a latência nas respostas de IA em tempo real.

A Character.ai dobrou a velocidade de inferência de produção através do ajuste de carga de trabalho da GPU e otimizações em nível de hardware, reduzindo tanto a latência quanto os custos operacionais em seus sistemas.

Aplicações de IA na Saúde

A OpenAI lançou o ChatGPT Health, integrando-se com Apple Health, wearables e prontuários eletrônicos para analisar tendências de dados longitudinais de pacientes em vez de simplesmente responder a consultas sobre sintomas.

A Anthropic lançou o Claude para Saúde, direcionado a fluxos de trabalho clínicos incluindo codificação médica, autorizações prévias e resumo de histórico de pacientes. O modelo cita fontes de literatura médica como PubMed para verificação.

O Google DeepMind lançou o MedGemma 1.5, um modelo de pesos abertos que interpreta imagens médicas 3D incluindo tomografias volumétricas e ressonâncias magnéticas, expandindo além da análise de raios-X 2D.

Lançamentos de Modelos e Avanços Técnicos

O GPT-5.2-Codex ficou disponível na API Responses, uma versão atualizada otimizada para tarefas de codificação agêntica. Ele suporta quatro níveis de configurações de esforço de raciocínio, tem uma janela de contexto de 400.000 tokens e custa US$ 1,75 por milhão de tokens de entrada e US$ 14,00 por milhão de tokens de saída.

O Claude Code introduziu o MCP Tool Search, permitindo que o Claude Code carregue ferramentas dinamicamente no contexto. Quando as descrições de ferramentas MCP consumiriam mais de 10% do contexto, as ferramentas são carregadas via busca em vez de serem pré-carregadas.

O Ministral 3 foi lançado como uma nova família de modelos de linguagem densos com variantes de 3B, 8B e 14B parâmetros otimizados para ambientes de baixo recurso. Os modelos suportam compreensão de imagens e foram treinados usando Cascade Distillation, um método iterativo de destilação e poda.

A Zhipu AI, criadora dos modelos de linguagem GLM, lançou o GLM-Image, seu primeiro modelo de imagem de código aberto.

Integração de IA em Serviços Financeiros

A Affirm atualizou seu sistema de subscrição para incorporar sinais em tempo real incluindo saldos de contas e tendências de fluxo de caixa, permitindo decisões de crédito mais informadas no checkout.

A FIS lançou uma plataforma em parceria com Visa e Mastercard que permite aos bancos suportar com segurança pagamentos iniciados por IA dentro das estruturas existentes de redes de cartões, com disponibilidade esperada para o primeiro trimestre de 2026. A plataforma visa autorizar transações conduzidas por agentes e aprimorar a proteção contra fraudes à medida que o comércio agêntico escala.

A Moneyhub implantará seu mecanismo de categorização e enriquecimento de transações alimentado por IA em 16 milhões de clientes do Nationwide, analisando pagamentos e adicionando contexto incluindo identificação de comerciantes, dados de localização e detalhes de pagamento para ajudar a gerenciar gastos e detectar fraudes.

Ferramentas Corporativas e para Consumidores

A OpenAI lançou o ChatGPT Translate, uma ferramenta de tradução que oferece tradução específica por idioma, melhorias de fluência, ajustes de tom para contextos empresariais e acadêmicos, e simplificação de texto. O recurso é gratuito e não requer uma conta paga.

O Google reformulou sua página Trends Explore com IA Gemini, adicionando recursos que destacam termos de busca relacionados, geram comparações automaticamente e sugerem consultas de acompanhamento.

O Slack lançou um agente de IA integrado para funcionar como assistente pessoal para busca dentro de canais.

A Perplexity fez parceria com a BlueMatrix para permitir buscas de relatórios de ações com respostas diretas via chat.

A SimilarWeb fez parceria com a Manus, uma plataforma de agentes de IA da Meta, para integrar dados de tráfego web e engajamento diretamente no chatbot. A integração fornece 12 meses de histórico de domínio, visualizações de página, usuários, fontes e dados de segmentação para análise de marketing.

Comércio e Padrões

Shopify e Google co-desenvolveram o Universal Commerce Protocol (UCP), um padrão aberto para agentes de IA que define mecanismos de descoberta e negociação entre agente e comerciante.

O Airbnb contratou Ahmad Al-Dahle, ex-líder de IA da Meta que liderou a IA generativa e a equipe de modelos Llama, como seu novo CTO. A mudança sinaliza o impulso do Airbnb para construir um concierge de viagens alimentado por IA para busca e planejamento personalizado de viagens.

Adoção Global de IA

Pesquisa da Microsoft mostra que a adoção global de IA atingiu apenas 15,1% em meados de 2025, com crescimento de 1,2 ponto percentual. As maiores taxas de adoção foram observadas nos Emirados Árabes Unidos (64%), Singapura (60,9%) e Noruega (46,4%). Os Estados Unidos ficam em 24º lugar (28,3%), enquanto a China fica em 61º (16,3%). A Coreia do Sul mostrou o maior crescimento com 4,8 pontos percentuais.

Decisões Estratégicas e Posicionamento de Mercado

A Anthropic bloqueou terceiros de usar a API do Claude Code, uma decisão que atraiu críticas pois pode empurrar usuários para outros provedores de modelos em vez de convertê-los de volta ao Claude Code.

Elon Musk afirmou que o novo Grok 4.20 se destacará em várias funções, mas não superará o Claude, reconhecendo que a Anthropic "fez algo especial" com o desenvolvimento de seu modelo.

Quer mais atualizações de IA?

Visite https://www.bosq.dev/blog para mais posts como este, além de guias práticos e links curados. Se este resumo foi útil, compartilhe com alguém do seu time.

Referências:

Tags: #AGI #AgentesIA #SequoiaCapital #OpenAI #Anthropic #GoogleGemini #InteligenciaPessoal #InfraestruturaIA #IASaude #AdocaoIA #AprendizadoMaquina #GrandesModelosLinguagem #ComputacaoIA #PlataformasIA #IAEmpresarial