Gmail AI Inbox, Claude Code 2.1 e Avaliação de US$ 350 Bilhões da Anthropic

O Google apresentou o AI Inbox para o Gmail, com duas seções principais que transformam o gerenciamento de e-mails. A seção "Tarefas sugeridas" extrai automaticamente itens de ação como pagamentos de contas e renovações de receitas médicas, enquanto "Tópicos para acompanhar" organiza atualizações por categoria. Recursos adicionais incluem capacidades de busca com IA, ferramentas de revisão de texto e acesso gratuito ao Help Me Write para todos os usuários. O recurso AI Overviews permite consultas em linguagem natural em threads de e-mail, substituindo a visualização cronológica tradicional da caixa de entrada por uma apresentação proativa de tarefas.

A Anthropic assinou um termo de compromisso para captar US$ 10 bilhões com avaliação de US$ 350 bilhões, liderado pela Coatue e pela GIC de Singapura. Isso representa o caminho mais rápido para tal avaliação em 4,5 anos desde a fundação da empresa em 2021, em comparação com a trajetória de aproximadamente 10 anos da OpenAI e os 22 anos da SpaceX. Nos últimos 12 meses, a avaliação da Anthropic aumentou 470%, subindo de US$ 61 bilhões em março de 2025 para US$ 183 bilhões em outubro de 2025, antes de atingir os atuais US$ 350 bilhões. A empresa foca em soluções empresariais através de acesso via API, Claude Code e serviços Enterprise, projetando lucratividade até 2027.

A Anthropic lançou a versão 2.1.0 do Claude Code com 1.096 commits, introduzindo melhorias significativas nos fluxos de trabalho de agentes. A atualização inclui mecanismos de recuperação de agentes quando permissões de ferramentas são negadas, capacidades de hot-reloading para habilidades, execução paralela de sub-agentes e recursos de resiliência que permitem aos agentes de codificação se adaptarem automaticamente e buscarem soluções alternativas quando bloqueados. O lançamento também adicionou hooks para agentes e habilidades, permissões de ferramentas com wildcards e um comando que transfere sessões diretamente para claude.ai/code. Essas melhorias sinalizam a evolução do Claude Code de um assistente de codificação baseado em chat para um ambiente estruturado para agentes programáveis e persistentes.

O Cursor implementou descoberta dinâmica de contexto, reduzindo o uso de tokens em 46,9% ao armazenar grandes saídas e histórico como arquivos em vez de em prompts, recuperando detalhes relevantes apenas quando necessário. Pesquisas sobre implantação iterativa e ajuste fino em traces curados demonstraram que essa abordagem dobra o desempenho de planejamento dos LLMs. Um estudo sobre detecção de alucinações integrou o framework leve HHEM, reduzindo o tempo de avaliação de horas para minutos mantendo a precisão.

A Microsoft anunciou o Copilot Checkout, permitindo que usuários façam compras e concluam transações diretamente no aplicativo. Essa capacidade se junta a ofertas similares da OpenAI, Perplexity, Gemini e Rufus da Amazon. A IA impulsionou 20% de todos os pedidos globais durante a temporada de festas de 2025, gerando US$ 262 bilhões em receita. Compradores indicados por IA converteram nove vezes mais do que indicações de redes sociais durante o mesmo período. As processadoras de pagamento Visa e Mastercard estão desenvolvendo soluções para transações de comércio agêntico com lançamento previsto para o início de 2026.

A OpenAI lançou o ChatGPT Health, uma interface dedicada para consultas médicas que permite aos usuários conectar prontuários médicos e aplicativos de saúde como o Apple Health. Os dados de saúde operam em um ambiente isolado, armazenados separadamente de outros dados do ChatGPT, podem ser excluídos instantaneamente e nunca são usados para treinamento de modelos. O recurso está atualmente disponível para usuários iniciais limitados, com lista de espera aberta para usuários gratuitos e pagos do ChatGPT fora do EEE, Suíça e Reino Unido. A OpenAI relata que 230 milhões de pessoas já fazem perguntas médicas ao ChatGPT semanalmente.

A capitalização de mercado da Alphabet atingiu US$ 3,89 trilhões, ultrapassando a Apple para se tornar a segunda empresa mais valiosa do mundo depois da Nvidia. A alta reflete a confiança dos investidores nos modelos Gemini, que agora reivindicam mais de 20% do tráfego global de chat de IA, e nos chips TPU personalizados do Google. Após uma queda de 30% nas ações em 2021 após o lançamento do ChatGPT, a Alphabet se recuperou com um ganho de 65% em 2025. Os principais impulsionadores incluem os modelos Gemini e Nano Banana alcançando desempenho de ponta nos benchmarks LMArena, manutenção da posição de terceiro maior provedor de nuvem, YouTube preenchendo o vácuo do streaming, a divisão de veículos autônomos liderando em unidades implantadas e um portfólio incluindo 7% da SpaceX e aproximadamente 15% da Anthropic.

Pesquisadores da OpenAI treinaram o GPT-5 Thinking para confessar violações de instruções ou políticas usando aprendizado por reforço. O modelo foi recompensado por produzir confissões precisas descrevendo restrições, quão bem as respostas as satisfaziam e quaisquer ambiguidades. Em 12 avaliações, o modelo ajustado confessou mau comportamento pelo menos metade das vezes em 11 delas. Para testes de alucinação, ele evitou alucinação ou admitiu erros 81,4% das vezes.

O Shanghai Artificial Intelligence Laboratory publicou o Science Context Protocol (SCP), um padrão de código aberto que permite aos agentes de IA conduzir pesquisas científicas automatizadas entre instituições. O SCP usa experimentos estruturados em JSON com identificadores persistentes, hubs centralizados que orquestram agentes e servidores, e inclui mais de 1.600 ferramentas especializadas. O protocolo visa tornar experimentos impulsionados por IA reproduzíveis e padronizados entre disciplinas.

A Microsoft analisou 37,5 milhões de conversas do Copilot de janeiro a setembro de 2025, descobrindo que os padrões de uso variavam por dispositivo e horário. Usuários de desktop durante o horário de trabalho focavam em produtividade e tópicos de carreira, enquanto usuários móveis à noite discutiam saúde, jogos e filosofia. Conforme 2025 avançava, os usuários buscavam cada vez mais conselhos pessoais, sugerindo integração da IA na vida social e pessoal além dos contextos de trabalho.

Pesquisadores desenvolveram o Delethink, um método de aprendizado por reforço que treina grandes modelos de linguagem para truncar periodicamente tokens de raciocínio a um máximo fixo. Ajustando o R1-Distill 1.5B para raciocinar em blocos de 4.000 tokens, o modelo igualou ou superou as linhas de base em 24.000 tokens e continuou melhorando com orçamentos maiores. O treinamento com orçamento de 96.000 tokens exigiu 7 H100-meses versus 27 para a linha de base, abordando a barreira de computação quadrática de contextos de raciocínio longos.

Quer mais atualizações de IA?

Visite https://www.bosq.dev/blog para mais posts como este, além de guias práticos e links curados. Se este resumo foi útil, compartilhe com alguém do seu time.

Referências:

Tags: #GmailAI #ClaudeCode #Anthropic #AvaliaçãoIA #AgentesIA #IAEmpresarial #ComércioIA #ChatGPTSaúde #CapitalizaçãoAlphabet #CopilotCheckout #CaixaDeEntradaIA #AprendizadoPorReforço #PesquisaCientífica #AdoçãoIA #AprendizadoDeMáquina