Skip to content
cropped-Logo-2.png

Regulação, riscos e notícias de IA

Primary Menu
  • Regulação
  • Riscos
  • Direitos Autorais
  • Estudos
  • Inovação
  • Home
  • Estudos
  • Poucos documentos maliciosos podem corromper LLMs de qualquer tamanho, conclui estudo da Anthropic
  • Estudos
  • Riscos

Poucos documentos maliciosos podem corromper LLMs de qualquer tamanho, conclui estudo da Anthropic

Redação outubro 15, 2025
Fonte: Image by Arek Socha from Pixabay

Estudo da Anthropic revelou que apenas 250 documentos maliciosos podem ser suficientes para criar uma vulnerabilidade do tipo backdoor em um modelo de linguagem — independentemente do tamanho do modelo ou do volume de dados de treinamento.,

Para chegar a esta conclusão, os estudiosos compararam um modelo de 13B parametros e um de 600M parâmetros, e ambos estavam susceptíveis às mesmas vulnerabilidades (apenas 250 documentos).

O estudo foi conduzido pela Anthropic, em parceria com o UK AI Security Institute e o Alan Turing Institute.

A descoberta representa um novo desafio para especialistas em auditoria e segurança de IA, já que o estudo aponta que responsáveis por usos maliciosos não precisam controlar uma porcentagem significativa do conjunto de dados, mas apenas inserir uma pequena quantidade de exemplos manipulados para comprometer o modelo.

Quer mais notícias sobre riscos em IA? Riscos

Post navigation

Previous: ANPD define participantes do primeiro Sandbox Regulatório em IA
Next: Mapa reúne os principais processos de copyright nos EUA envolvendo IA

Notícias relacionadas

image
  • Riscos

Comitê Nacional de Cibersegurança institui GT para aperfeiçoamento do PL da Cibersegurança

Redação outubro 10, 2025
Gemini_Generated_Image_dxo7badxo7badxo7
  • Riscos

Anthropic lança ferramenta open source para testes de segurança em IA

Redação outubro 10, 2025
Gemini_Generated_Image_bae1jbbae1jbbae1
  • Estudos

Relatório aponta impacto da IA de até US$ 1 trilhão no PIB da América Latina até 2038

Redação outubro 10, 2025

Archives

  • outubro 2025

Categories

  • Direitos Autorais
  • Estudos
  • Regulação
  • Riscos
  • Política de Privacidade
  • Termos & Condições
  • Informações de Contato
  • Sobre Nós
Copyright © All rights reserved. | MoreNews by AF themes.