AINewz

Atenção, nerds de IA! O Gartner soltou uma projeção que pode mudar o jogo: o custo para rodar modelos de linguagem gigantes (aqueles com 1 trilhão de parâmetros) pode cair mais de 90% até 2030, comparado a 2025.

Essa queda é resultado de uma combinação de fatores, tipo avanços em semicondutores, modelos mais espertos e o uso de chips específicos para IA. A consultoria ainda estima que esses modelos podem ficar até 100 vezes mais baratos em custo por inferência até o fim da década.

Mas ó, nem tudo são flores. O Gartner alerta que essa redução no preço por unidade de processamento (o tal do token) não vai ser totalmente repassada. Com aplicações cada vez mais complexas e o uso massivo de IA generativa, o gasto total com processamento pode acabar subindo.

O segredo, segundo eles, estará nas plataformas que souberem orquestrar diferentes modelos de IA de forma eficiente. A ideia é usar modelos menores para tarefas simples e os gigantes só quando o raciocínio for realmente complexo. Assim, a gente pode ter o melhor dos dois mundos: eficiência e poder de processamento. 💰

IA Generativa: Custo de processamento pode despencar mais de 90% até 2030

Destaques

Fontes

Receba as Melhores Notícias

Notícias Relacionadas

PicPay turbina personalização com 9 PB de dados e corte de custos

IA no Brasil: A Virada de Chave da Tecnologia para a Estratégia

IA e Computação Quântica: A Cibersegurança não dá conta mais!

Americanas: Fim da Recuperação Judicial e Venda de Marcas Confirmada