Google libera IA que consegue mexer no computador e controlar a tela sozinha

0
2

“`json
{
"title": "Google Libera IA Gemini 3.5 Flash que Vê e Controla Seu Computador Sozinho: O Que Muda na Automação de Tarefas",
"subtitle": "A nova função "Computer use" do Gemini 3.5 Flash transforma a inteligência artificial em um agente autônomo, capaz de interagir com qualquer tela e executar tarefas complexas, prometendo revolucionar a automação corporativa.",
"content_html": "<p>O Google anunciou uma inovação significativa no campo da inteligência artificial, integrando a função “Computer use” ao seu modelo Gemini 3.5 Flash. Essa novidade permite que agentes de IA visualizem a tela de computadores, navegadores e aplicativos, e executem ações de forma autônoma. Disponível para desenvolvedores e empresas via API do Gemini e plataforma Gemini Enterprise Agent, a ferramenta representa um salto na capacidade de automação.</p><p>Com o “Computer use”, o Gemini 3.5 Flash se torna um agente capaz de realizar tarefas completas sem intervenção humana, como clicar em botões, preencher formulários, rolar páginas e navegar entre diferentes sistemas. O foco inicial é o ambiente corporativo, onde a tecnologia pode ser aplicada na automação de processos, análise de dados e testes de software, acelerando fluxos de trabalho complexos que exigem interação com interfaces gráficas.</p><h3>Como Funciona a Interação Autônoma?</h3><p>O recurso “Computer use” opera como uma camada nativa no Gemini 3.5 Flash, eliminando a necessidade de modelos separados para automação e substituindo o Gemini 2.5, que havia sido lançado em outubro de 2025 para uso em computadores. O processo ocorre em um ciclo contínuo e inteligente: a IA captura a imagem da tela atual, analisa os elementos visuais para entender a tarefa e, em seguida, cria comandos estruturados — como cliques ou digitação de texto. Cada ação executada atualiza a tela, e a IA usa essa nova imagem para continuar o processo, viabilizando a execução de tarefas em múltiplas etapas, como preenchimento de formulários complexos e navegação em sistemas internos.</p><h3>Segurança e Limitações da Nova Ferramenta</h3><p>Apesar do avanço tecnológico, o Google reconhece que o sistema ainda enfrenta desafios em situações imprevisíveis, como CAPTCHAs, pop-ups inesperados e interfaces dinâmicas. Para mitigar riscos, foram implementados mecanismos de segurança robustos. Entre eles, destaca-se a confirmação humana para ações consideradas sensíveis e a interrupção automática da IA caso sejam detectadas possíveis tentativas de manipulação. É importante notar que esses controles são opcionais e não vêm ativados por padrão. Além disso, o Google investiu em treinamento adversário, focando na prevenção de injeção de prompts, um tipo de ataque em que instruções maliciosas podem induzir a IA a executar ações não intencionais.</p><h3>Google no Cenário da Automação por IA</h3><p>A chegada do “Computer use” posiciona o Google em um cenário de crescente competição na área de agentes de IA. A empresa já havia incorporado recursos de navegação com agentes, como o Auto Browse no Chrome Enterprise, no início do ano. Agora, a nova integração no Gemini 3.5 Flash amplia essa lógica para funcionar sobre qualquer tela. O Google entra em confronto direto com pioneiras do segmento, como a Anthropic, cujo Claude Computer Use já oferece uma interação mais ampla com sistemas operacionais e arquivos, e a OpenAI, que também tem intensificado suas iniciativas em agentes de IA capazes de executar tarefas em ambientes digitais.</p><h3>Como Desenvolvedores Podem Testar o "Computer use"</h3><p>Para os desenvolvedores interessados em explorar as capacidades do “Computer use”, o Google oferece um ambiente de demonstração no Browserbase (gemini.browserbase.com), onde é possível experimentar a ferramenta em um cenário controlado. Além disso, a empresa recomenda acessar a documentação e a implementação de referência por meio da API do Gemini e da plataforma Gemini Enterprise Agent, permitindo que a comunidade comece a integrar e testar essa poderosa funcionalidade.</p>"
}
“`

Fonte: canaltech.com.br

LEAVE A REPLY

Please enter your comment!
Please enter your name here