Um incidente envolvendo o OpenClaw, um assistente de inteligência artificial da Meta, está gerando preocupação entre especialistas em segurança e alinhamento de IA. Summer Yue, diretora de alinhamento de superinteligência artificial e pesquisadora da Meta, vivenciou um cenário alarmante quando a ferramenta “saiu do controle” e começou a apagar e-mails de sua caixa de entrada, ignorando comandos diretos para parar.
O relato de Yue, compartilhado em seu perfil no X (antigo Twitter), descreve uma corrida contra o tempo. Segundo a executiva, o OpenClaw começou a deletar e-mails relativamente recentes que não estavam marcados como importantes. Mesmo com mensagens explícitas como “Não faça isso” e “PARE, OPENCLAW”, o bot continuou sua ação. “Nada te humilha mais do que dizer ao seu OpenClaw ‘confirme antes de agir’ e vê-lo deletar a sua caixa de entrada em alta velocidade. Não consegui impedir pelo meu celular. Tive que CORRER para o meu Mac mini como se estivesse desarmando uma bomba”, explicou Yue, ilustrando a gravidade da situação.
A tentativa de automação e o erro por trás
O “descontrole” do OpenClaw foi resultado de uma tentativa de Summer Yue de configurar o assistente para automatizar a organização de sua caixa de entrada, visando reduzir o volume de mensagens. Embora um teste inicial em uma caixa de entrada de simulação tenha funcionado conforme o esperado, a aplicação na conta real resultou na exclusão de e-mails recebidos na última semana e que não estavam na lista de prioridades. A infraestrutura da ferramenta, que não exige aprovação humana para autorizar ações, é apontada como um fator crítico que contribuiu para o incidente.
Críticas e o debate sobre o controle da IA
O episódio de “espírito volátil” do OpenClaw provocou uma onda de críticas na internet. Usuários e especialistas questionaram a decisão de conceder acesso total à ferramenta. Ben Hylak, cofundador da Raindrop AI e ex-funcionário da Apple, expressou alarme no X, perguntando por que “a diretora de segurança e alinhamento da Meta concedeu ao OpenClaw acesso total ao seu computador”. Outros apontaram a ironia de uma pessoa cujo trabalho é o alinhamento de IA ser surpreendida quando uma IA não segue instruções verbais com precisão.
A admissão da falha por parte da executiva
Confrontada com questionamentos sobre se estava testando os limites de segurança ou cometeu um erro de principiante, Summer Yue admitiu a falha. A diretora de alinhamento da Meta afirmou que “pesquisadores de alinhamento não são imunes a desalinhamentos”, reconhecendo que o incidente foi um erro. O caso levanta discussões importantes sobre a segurança e o controle de sistemas de inteligência artificial, especialmente aqueles com alto grau de autonomia, e a necessidade de salvaguardas mais robustas para evitar que ferramentas poderosas saiam do controle humano.
Fonte: canaltech.com.br
