USP Lança 'Último Exame da Humanidade' para Testar IA

Destaques
- •Nova ferramenta global para medir o avanço da inteligência artificial.
- •Criada por pesquisadores de mais de 40 países, incluindo o Brasil.
- •Ferramenta possui 2.500 questões com respostas objetivas para testar LLMs como ChatGPT e Gemini.
Pra quem acompanha o universo da inteligência artificial, uma novidade quentíssima: pesquisadores de mais de 40 países, com participação brasileira, acabam de lançar o Humanity’s Last Exam (HLE), um banco de dados com 2.500 questões que promete ser o 'teste final' para medir o quão longe as IAs já foram.
A ideia é simples e genial: criar um benchmark supremo, com respostas únicas e objetivamente verificáveis, para avaliar modelos como o ChatGPT e o Gemini em diversas áreas do conhecimento, desde matemática básica até física quântica e senso comum.
A ferramenta, divulgada na revista Nature e com participação da USP, já está disponível online e busca dar um norte para pesquisas e políticas públicas sobre o tema.
O grande lance é que, ao contrário de outros testes, o HLE foca em respostas exatas, facilitando a comparação e mostrando o real nível de acerto das IAs.
Com isso, teremos uma medida mais precisa do avanço da IA, algo crucial para entender o futuro da tecnologia. 🤯




