O que são TOPS de IA e como eles impactam os computadores com inteligência artificial

Entenda o conceito de TOPS de IA, sua importância para os computadores com inteligência artificial e como isso afeta o desempenho das máquinas.
Atualizado há 1 dia
O que são TOPS de IA e como eles impactam os computadores com inteligência artificial
TOPS em IA é crucial para o desempenho ideal de computadores inteligentes. (Imagem/Reprodução: Tecmundo)
Resumo da notícia
    • TOPS de IA são uma métrica que mede a capacidade de um chip realizar trilhões de operações por segundo em tarefas de inteligência artificial.
    • O objetivo é explicar como os TOPS influenciam o desempenho dos computadores com IA e a importância das NPUs.
    • Isso pode ajudar você a escolher dispositivos mais eficientes para tarefas de IA no dia a dia.
    • A especialização das NPUs resulta em maior desempenho e menor consumo de energia em comparação com CPUs e GPUs.

Você já ouviu falar em TOPS de IA? Se você está ligado nas últimas novidades de tecnologia, com certeza já se deparou com essa sigla ao ler sobre os novos AI PCs. Mas, afinal, o que são esses TOPS e por que eles são tão importantes? Essa métrica é usada para medir quantas operações um chip consegue realizar ao executar tarefas de inteligência artificial. Vamos entender melhor esse conceito e como ele impacta o desempenho dos computadores com IA.

O que são AI PCs e a importância da NPU

Nos últimos anos, as empresas de tecnologia têm falado muito sobre AI PCs, que são computadores projetados para otimizar o uso de inteligência artificial. Para entender os TOPS, primeiro precisamos saber como a IA funciona nesses novos computadores. A grande diferença é a introdução de uma unidade de processamento no chip, chamada de NPU (Unidade de Processamento Neural).

CONTINUA DEPOIS DA PUBLICIDADE

A NPU é um componente especializado em executar tarefas de IA, como as encontradas no ChatGPT, Gemini e Copilot. Essa unidade permite que o computador execute essas tarefas de forma nativa, sem depender dos servidores das grandes empresas de tecnologia.

Yuri Daglian, engenheiro de aplicações da Intel, explica: “Toda a arquitetura da NPU foi projetada, desde o início, para redes neurais. Ela foi feita para oferecer ótima performance, consumindo pouca energia. A grande máxima na computação é que aceleradores específicos, projetos para fins específicos, sempre vão ter mais desempenho e eficiência energética do que unidades de processamento gerais”.

Essa especialização da NPU resulta em maior desempenho e menor consumo de energia ao executar tarefas de inteligência artificial. É por isso que os notebooks mais recentes são chamados de AI PCs, e muitos são certificados como Copilot+PCs.

Leia também:

O que são TOPS de IA

TOPS é a sigla para Trilhões de Operações Por Segundo. Essa unidade de medida indica o desempenho de um chip na inferência de inteligência artificial. Essencialmente, os TOPS mostram a capacidade de um chip realizar um número gigantesco de cálculos em um curto período.

CONTINUA DEPOIS DA PUBLICIDADE

Tanto os computadores quanto as IAs funcionam com base em matemática. Portanto, quanto mais cálculos um chip conseguir realizar em menos tempo, melhor será o seu desempenho. Em teoria, quanto mais TOPS uma NPU tiver, mais rápido e eficiente será o desempenho da máquina em tarefas de IA.

É interessante pensar nos TOPS como uma unidade de medida que nos ajuda a entender a capacidade de processamento de um dispositivo em relação à IA.

Como os TOPS funcionam?

Os TOPS realizam operações matemáticas em uma rede neural. Essa rede neural é um método que usa aprendizado de máquina para ensinar o computador a realizar tarefas de maneira similar ao cérebro humano. A rede neural mais básica é chamada de Perceptron, que nos ajuda a entender como as IAs funcionam.

Em um Perceptron, temos números constantes (XYZ) e pesos (W) atribuídos a eles. A combinação desses números e pesos gera uma saída, que é a resposta para uma pergunta. Por exemplo, ao perguntar a um ChatGPT quanto é 1+1, o sistema testa diversas combinações de pesos até encontrar a resposta correta.

CONTINUA DEPOIS DA PUBLICIDADE

Yuri Daglian explica que as redes neurais são treinadas com uma combinação enorme de números e pesos, repetindo esses processos até chegar no resultado esperado. As operações que uma NPU realiza são, principalmente, multiplicações e adições, e em casos mais complexos, adição e multiplicação de matrizes.

Daglian brinca que os computadores “gostam de calcular matrizes”, pois são contas mais simples para as máquinas. Os PCs calculam essas matrizes em uma escala de bilhões de parâmetros para chegar a uma resposta final. Essas são as operações contidas nos TOPS.

Quando treinamos uma rede neural, estamos rodando bilhões de pesos diferentes em um sistema de tentativa e erro, até que as respostas sejam as mais precisas possíveis. “Inteligência artificial é matemática pura. Ela não é mística. Não tem uma mágica acontecendo. Tem matemática pura”, completa Daglian.

Quantos TOPS são necessários?

Em teoria, quanto mais TOPS uma NPU tiver, maior será a sua capacidade de lidar com tarefas de IA. No entanto, não existe uma resposta exata para a quantidade ideal de TOPS. A necessidade varia muito dependendo da atividade que será realizada.

Para tarefas mais simples, como criar fundos virtuais no Microsoft Teams ou remover ruídos do microfone, 5 TOPS podem ser suficientes. Para rodar um aplicativo com base em um SLM (Pequeno Modelo de Linguagem), algo entre 15 e 20 TOPS já deve ser suficiente. No entanto, para rodar uma LLM (Grande Modelo de Linguagem), que é muito mais pesada e complexa, pode ser necessário mais de 100 TOPS, dependendo da otimização.

Segundo Yuri Daglian, “Eu diria que para ter uma experiência interessante hoje em dia, pelo menos 10 TOPS de NPU para conseguir executar aplicações de forma legal. Agora, se penso para o futuro, aí tenho que mirar em pelo menos 40 TOPS”.

TOPS em CPUs e GPUs

Os TOPS são mais frequentemente associados às Unidades de Processamento Neural (NPUs), mas também estão presentes em processadores tradicionais (CPUs) e placas de vídeo (GPUs). Os processadores Intel Core Ultra Série 2, por exemplo, podem ter até 120 TOPS. Desses, 48 estão na NPU, 5 no processador e 67 na placa de vídeo integrada.

CPUs e GPUs sempre tiveram TOPS, afinal, usamos IA em filtros do Google Meet e outros recursos há anos. As placas de vídeo, especialmente os modelos dedicados, geralmente são os componentes de hardware com mais TOPS. Uma RTX 5090 da Nvidia, por exemplo, pode ter 3.300 TOPS de IA, enquanto uma Intel Arc B580 possui 233 TOPS.

No entanto, Yuri Daglian explica que as GPUs não são projetadas especificamente para executar cargas de trabalho como uma NPU. “A GPU tem uma otimização para cálculos paralelos, então ela tem muitos núcleos que conseguem trabalhar ao mesmo tempo, para fazer uma conta. A CPU é mais sequencial, então faz uma conta primeiro, termina, faz outra, etc”, aponta o especialista.

Apesar de GPUs e CPUs também realizarem esse trabalho, a NPU é sempre mais eficiente, pois consome menos energia ao realizar essas tarefas. Entender o que são TOPS de IA e como eles se distribuem entre os diferentes componentes do computador nos ajuda a escolher o dispositivo mais adequado para nossas necessidades.

Continue acompanhando o TecMundo para mais informações sobre hardware e informática. E se você curte placas de vídeo, não deixe de conferir as últimas novidades sobre a NVIDIA.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via TecMundo

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.