A Anthropic, uma empresa líder em desenvolvimento de IA, atualizou as diretrizes de uso para seu chatbot Claude em resposta a crescentes preocupações com segurança. As novas regras, que entram em vigor em 15 de setembro de 2025, visam minimizar os riscos potenciais de modelos avançados de IA, especialmente em relação ao desenvolvimento de armas perigosas e ameaças cibernéticas. Ao mesmo tempo, a Anthropic está flexibilizando algumas restrições sobre conteúdo político para promover oportunidades de uso legítimo.
A política revisada expande as proibições anteriores que proibiam o uso do Claude para fabricar, modificar, comercializar ou distribuir armas e materiais perigosos. Novas adições incluem a menção explícita de explosivos de alta potência, bem como armas biológicas, químicas, radiológicas e nucleares (BCRN) como aplicações proibidas. Essa mudança reflete a crescente preocupação com o potencial de uso indevido de IA em áreas sensíveis.
Já em maio de 2025, a Anthropic introduziu as salvaguardas "AI Safety Level 3" (ASL-3) com o lançamento do Claude Opus 4. Isso inclui medidas de segurança aprimoradas para dificultar os chamados jailbreaks – ou seja, contornar restrições de segurança – e prevenir o auxílio no desenvolvimento de armas BCRN. Essas medidas foram introduzidas como precaução, pois não está totalmente claro se o Claude Opus 4 atingiu o limite de capacidade para ASL-3.
Outro foco da política atualizada é a resposta aos riscos de ferramentas de IA chamadas "agentivas", como "Computer Use", que permite ao Claude controlar o computador de um usuário, e "Claude Code", que integra o Claude em ambientes de desenvolvimento. Essas funcionalidades apresentam riscos como a criação de malware ou o auxílio em ataques cibernéticos. A nova política, portanto, contém uma seção própria, "Não Comprometa Sistemas de Computador ou Rede", que proíbe atividades como explorar vulnerabilidades de segurança, criar software malicioso ou desenvolver ferramentas para ataques de negação de serviço. No entanto, a Anthropic continua a apoiar aplicações positivas, como a descoberta de vulnerabilidades de segurança com o consentimento dos proprietários.
Paralelamente, a Anthropic flexibilizou as regras para conteúdo político. Em vez de uma proibição abrangente de conteúdo sobre campanhas políticas ou lobby, a nova política proíbe apenas usos que sejam "enganosos ou perturbadores para processos democráticos", como manipulação direcionada de eleitores ou campanhas. Além disso, foi esclarecido que os requisitos para casos de uso "de alto risco", como recomendações em contextos legais, financeiros ou profissionais, aplicam-se apenas a cenários voltados ao consumidor, não a aplicações empresariais.
As mudanças fazem parte da Política de Escalada Responsável (RSP) da Anthropic, que visa dimensionar as medidas de segurança proporcionalmente aos riscos potenciais dos modelos de IA. A empresa enfatiza que a política é um "documento vivo" que será adaptado à medida que a tecnologia de IA evolui. Ao colaborar com especialistas externos, formuladores de políticas e a sociedade civil, a Anthropic busca garantir que suas medidas de segurança acompanhem os padrões globais.
As novas regras destacam o esforço da Anthropic para equilibrar inovação e segurança em meio ao rápido crescimento do setor de IA generativa – com concorrentes como OpenAI, Google e Microsoft. A atualização pode servir de modelo para outras empresas que enfrentam desafios semelhantes no cenário de IA em rápida evolução.
