FunctionGemma e o cenário em evolução das capacidades de IA
FunctionGemma e o cenário em evolução das capacidades de IA
Em dezembro de 2025, o Google apresentou o FunctionGemma, uma variação do seu modelo leve Gemma 3 270M feita especificamente para traduzir linguagem natural em chamadas de função estruturadas capazes de executar ações no próprio dispositivo. Em vez de buscar inteligência conversacional ampla, o FunctionGemma foi projetado para interpretar a intenção do usuário com confiabilidade, acionar as APIs adequadas e, em seguida, devolver resumos dos resultados em linguagem humana. Sua arquitetura compacta torna viável rodar localmente em dispositivos como smartphones ou hardware de borda, uma estratégia alinhada às tendências emergentes de agentes de IA local-first (priorizando execução local) em vez de inferência centralizada na nuvem. O Google também publicou receitas de fine-tuning e compartilhou como a precisão em tarefas como ações no celular pode melhorar de forma expressiva com treinamento específico, elevando o desempenho de cerca de 58% para aproximadamente 85% nesses testes.
O foco do FunctionGemma em capacidades acionáveis — e não em raciocínio geral — reflete uma mudança mais ampla na área: em direção a modelos que conseguem interagir com o mundo ao redor de forma confiável, e não apenas gerar texto. Na prática, sua implementação cumpre dois papéis: como um agente leve no dispositivo capaz de lidar localmente com ações bem definidas e como um despachante inteligente que encaminha solicitações mais complexas para modelos maiores quando necessário.
Desenvolvimentos de IA em contexto
Qwen-Image, da Alibaba
O Qwen-Image, da Alibaba, é um sistema open-source de geração e edição de imagens em larga escala que se destaca por lidar bem com layouts textuais complexos e manipulação semântica de imagens. Com cerca de 20 bilhões de parâmetros, ele apresenta bom desempenho em benchmarks e suporta tarefas mais delicadas, como renderização de texto dentro de imagens e transferência de estilo. O modelo e seu ecossistema de ferramentas estão acessíveis em plataformas como o Hugging Face e também nas interfaces da própria Alibaba.
Integrações da Adobe com o ChatGPT
A Adobe incorporou recursos centrais do Photoshop, Adobe Express e Acrobat diretamente na interface do ChatGPT. Essas integrações permitem editar imagens, criar designs e manipular PDFs por meio de prompts conversacionais, sem trocar de aplicativo. A parceria coloca ferramentas criativas profissionais em um fluxo de trabalho único, aproximando a interação com IA generativa das funcionalidades tradicionais de criação.
Modelos “Mango” e “Avocado”, da Meta
A Meta Platforms está desenvolvendo dois modelos de IA de próxima geração com lançamento previsto para 2026. Com os codinomes Mango e Avocado, o primeiro foca em geração de imagem e vídeo, enquanto o segundo é um modelo de linguagem baseado em texto, com ambições de melhorar raciocínio e capacidade de programação. Esses esforços fazem parte da estratégia mais ampla da Meta para competir de forma mais direta com outros grandes provedores de IA, sinalizando a continuidade da diversidade de arquiteturas e especializações no setor.
Inovações robóticas da Disney
Os laboratórios de pesquisa da Disney revelaram um personagem robótico autônomo, com locomoção livre, inspirado no Olaf de Frozen. Esse robô que anda e interage combina design mecânico e estratégias de controle com IA para criar movimentos realistas e expressão gestual, representando mais uma fronteira em que a IA encontra a interação física e o engajamento humano.
Perspectivas sobre para onde a IA está indo
Ao observar essas novidades, emerge uma distinção ampla em como as tecnologias de IA estão evoluindo:
- De um lado, as interfaces estão se tornando mais adaptativas e expressivas, permitindo interações mais naturais e eficazes com conteúdo e ferramentas — como exemplificam extensões conversacionais de aplicativos criativos.
- De outro, agentes especializados e modelos de chamada de função como o FunctionGemma priorizam confiabilidade operacional e integração com sistemas reais, especialmente em contextos de borda, onde latência, privacidade e autonomia importam.
Em vez de tratar essas abordagens como excludentes, a trajetória atual aponta para um ecossistema heterogêneo: no qual adaptabilidade conversacional e execução orientada a tarefas se complementam para atender necessidades diferentes. O desafio — e a oportunidade — para profissionais e usuários será entender qual abordagem entrega mais valor para cada domínio ou fluxo de trabalho.
Quer mais atualizações de IA?
Visite https://www.bosq.dev/blog para mais posts como este, além de guias práticos e links curados.
Se este resumo foi útil, compartilhe com alguém do seu time.
Referências
- https://blog.google/technology/developers/functiongemma/
- https://ai.google.dev/gemma/docs/functiongemma
- https://ai.google.dev/gemma/docs/mobile-actions
- https://qwen-images.com/
- https://news.adobe.com/news/2025/12/adobe-photoshop-express-acrobat-chatgpt
- https://howaiworks.ai/blog/meta-mango-avocado-ai-announcement-2025
- https://www.wdwmagic.com/other/walt-disney-imagineering/news/19dec2025-inside-disneys-self-walking-olaf-new-research-details-how-the-character-works.htm
Tags: #IA #FunctionGemma #EdgeAI #IAEmBorda #IAGenerativa #QwenImage #Adobe #Meta #Robótica