Skip to content
cropped-Logo-2.png

Regulação, riscos e notícias de IA

Primary Menu
  • Regulação
  • Riscos
  • Direitos Autorais
  • Estudos
  • Inovação
  • Home
  • Riscos
  • Anthropic lança ferramenta open source para testes de segurança em IA
  • Riscos

Anthropic lança ferramenta open source para testes de segurança em IA

Redação outubro 10, 2025

A Anthropic apresentou o Petri (Parallel Exploration Tool for Risky Interactions), uma estrutura de código aberto voltada para auditorias automatizadas. O sistema utiliza agentes de IA para avaliar o comportamento de diferentes modelos em uma ampla variedade de cenários.

Nos testes, o Petri foi aplicado a 14 modelos de ponta, usando 111 instruções iniciais, e conseguiu identificar diversos comportamentos problemáticos, como engano autônomo, manipulação de supervisão, denúncias internas e colaboração com usos indevidos por humanos.

A ferramenta está disponível no GitHub: github.com/safety-research/petri.

Post navigation

Previous: Relatório aponta impacto da IA de até US$ 1 trilhão no PIB da América Latina até 2038
Next: Comitê Nacional de Cibersegurança institui GT para aperfeiçoamento do PL da Cibersegurança

Notícias relacionadas

poison-1481596_1920
  • Estudos
  • Riscos

Poucos documentos maliciosos podem corromper LLMs de qualquer tamanho, conclui estudo da Anthropic

Redação outubro 15, 2025
image
  • Riscos

Comitê Nacional de Cibersegurança institui GT para aperfeiçoamento do PL da Cibersegurança

Redação outubro 10, 2025

Archives

  • outubro 2025

Categories

  • Direitos Autorais
  • Estudos
  • Regulação
  • Riscos
  • Política de Privacidade
  • Termos & Condições
  • Informações de Contato
  • Sobre Nós
Copyright © All rights reserved. | MoreNews by AF themes.