O ARC-AGI-2 é a evolução direta de um do benchmark ARC – Abstraction and Reasoning Corpus. Seu...
Testes
A Artificial Analysis, organização independente especializada em benchmark de IA, anunciou uma reformulação significativa do seu principal...
A Anthropic apresentou o Petri (Parallel Exploration Tool for Risky Interactions), uma estrutura de código aberto voltada...



