Durante anos, a conversa sobre eficiência em Data Centers esteve centrada numa questão muito concreta: quanta energia se perdia antes de chegar aos sistemas de computação.
Era uma preocupação lógica. No início dos anos 2000, grande parte do consumo energético de um centro de dados destinava-se à refrigeração, distribuição elétrica e sistemas auxiliares. A infraestrutura era complexa, dispendiosa de operar e, acima de tudo, difícil de medir de forma homogénea.
Nesse contexto, o aparecimento do PUE (Power Usage Effectiveness) marcou um antes e um depois para a indústria.
O início de tudo, o PUE
Houve uma época em que a pergunta mais importante de um Data Center era quanta energia se perdia antes de chegar aos servidores.
Era uma pergunta razoável. Os edifícios de infraestrutura digital dos anos noventa e início dos anos 2000 eram enormes máquinas térmicas pesadas e ineficientes: sistemas de refrigeração sobredimensionados, grupos geradores a consumir em vazio, transformadores com perdas que ninguém contabilizava. Por cada watt que chegava a um servidor, outro watt ou mais evaporava-se pelo caminho. Ninguém o media porque ninguém tinha definido como fazê-lo.
Em 2006, o Green Grid, um consórcio de empresas tecnológicas, publicou uma métrica que mudou a conversa. Chamava-se PUE, Power Usage Effectiveness. A fórmula era simples: a energia total que entra no edifício dividida pela energia que chega efetivamente aos equipamentos de IT. Um PUE de 2.0 significava que, por cada watt útil, outro watt era gasto em overhead. Um PUE de 1.0 era o ideal impossível: um edifício sem perdas.

Foi um avanço genuíno. Deu ao setor uma linguagem comum, uma forma de comparar instalações e uma pressão competitiva em direção à eficiência. Os hyperscalers começaram a publicar os seus PUEs como credenciais de engenharia. A Google chegou a 1.08 em alguns dos seus Data Centers. A média global desceu de 2.5 para 1.58 em menos de duas décadas.
O PUE funcionou. E essa é precisamente a razão pela qual já não é suficiente.
Uma métrica que mede o recipiente mas ignora o conteúdo
Para perceber porque é que o PUE envelheceu, é necessário compreender o mundo para o qual foi concebido.
Em 2006, um servidor era apenas um servidor. Executava aplicações empresariais, bases de dados, sistemas de correio eletrónico. Consumiam entre 200 e 400 watts. A carga era relativamente previsível, os racks tinham densidades controláveis e a variação entre cargas de trabalho, em termos energéticos, era modesta. Nesse contexto, a ineficiência do edifício era o problema dominante. Se conseguíssemos fazer chegar mais energia aos servidores, o sistema tornava-se mais eficiente. Lógica direta.
O que o PUE não podia antecipar era a pergunta que ninguém tinha formulado ainda: e o que fazem esses servidores com a energia que recebem?
Durante anos, essa pergunta não importava muito porque a resposta era mais ou menos uniforme. Um servidor a processar faturas e um servidor a enviar emails consumiam energias semelhantes e produziam valor difícil de comparar, mas ninguém tentava medir isso. A eficiência era do edifício, não da carga.
O problema surgiu quando a carga mudou de natureza.
A substituição que muda tudo
A partir de 2016, com a primeira vaga de deep learning, e de forma explosiva desde 2022 com os modelos massivos de linguagem, os Data Centers começaram a alojar uma carga radicalmente diferente. As GPUs substituíram os CPUs como unidade de computação dominante para IA. Um rack que antes consumia 10 quilowatts passou a consumir 40, depois 100 e depois — com a arquitetura Blackwell da NVIDIA em 2025 — 140 quilowatts. A densidade energética multiplicou-se por dez em menos de uma década, acelerando uma transformação que já está a redefinir a evolução dos Data Centers.
Neste novo contexto, um Data Center com um PUE de 1.1 que aloja racks de 140 kW consome quantidades de energia que pareceriam absurdas em 2006. O edifício é eficiente. A escala é outra.
Mas a verdadeira rutura não foi quanto os equipamentos consomem. Foi quanto produzem.
Uma GPU a executar inferência de IA gera um output mensurável: tokens, respostas, inferências concluídas. Esse output tem valor económico direto — é aquilo que o cliente do Data Center está realmente a comprar. E esse output varia enormemente consoante o hardware, o software e a configuração. Duas instalações com PUE idêntico podem produzir quantidades de inteligência radicalmente diferentes com a mesma energia.
O PUE não vê o que é produzido. Para o PUE, um watt que chega ao servidor é um watt bem utilizado, independentemente de produzir algo útil ou não.
A indústria já o identificou e está a nomeá-lo de forma clara
Em dezembro de 2025, a Schneider Electric publicou uma análise que articulou esta limitação com precisão: uma instalação com excelente PUE a executar cargas de IA mal otimizadas desperdiça mais energia por unidade de valor produzido do que uma instalação com PUE mediano a executar cargas eficientes. A métrica do edifício e a métrica do negócio deixaram de estar correlacionadas.
A alternativa que o setor começou a adotar tinha um nome direto: tokens por watt. Quantas unidades de output de IA o sistema produz por cada watt de potência consumida. Não o pico teórico em laboratório. O desempenho real, sob carga real, incluindo todas as ineficiências do percurso.
A métrica tinha a virtude de ser compreensível para pessoas que não são engenheiras. Um token é uma unidade de texto gerado, aproximadamente três quartos de uma palavra em inglês. Tokens por watt é, em essência, quanto pensamento produz cada unidade de energia. Uma fórmula que liga a física à economia sem passos intermédios.
Em março de 2026, Jensen Huang transformou essa métrica no centro da sua keynote no GTC em San José, Califórnia. A fórmula que apresentou a CEOs e investidores foi deliberadamente simples:

Não falou de especificações de hardware. Falou de energia como recurso escasso e de eficiência como multiplicador de receitas. Foi o momento em que uma métrica técnica se transformou em linguagem de negócio.
O timing não foi casual. Em 2026, a energia deixou de ser um custo operacional previsível para se tornar o estrangulamento estratégico do setor, algo que já começa a definir o verdadeiro limite da inteligência artificial.
A procura elétrica dos Data Centers orientados para IA aumentou 50% só em 2025, segundo o relatório Key Questions on Energy and AI da IEA publicado nesse ano. Os transformadores de alta tensão necessários para alimentar novas instalações têm prazos de entrega de dois a três anos. Em várias regiões da Europa e dos Estados Unidos, as utilities suspenderam novas ligações ou condicionaram-nas a anos de espera.
Nesse contexto, a pergunta operacional deixou de ser “como construo mais capacidade?” e passou a ser “como extraio mais valor do orçamento energético que já tenho?”. E essa pergunta só tem uma resposta útil se soubermos medir quanto valor estamos a produzir por watt.
O contraste entre gerações de hardware ilustra a magnitude da mudança. Segundo análises da NVIDIA e da SemiAnalysis com dados reais de benchmarks, as GPUs da arquitetura Blackwell produzem mais de 50 vezes mais tokens por watt do que a geração Hopper de apenas dois anos antes.
Em termos práticos: o mesmo orçamento energético pode hoje alimentar uma capacidade de inferência cinquenta vezes superior à de 2023, se for utilizado o hardware correto.
Para os operadores de Data Centers, isto altera o argumento da renovação tecnológica. Já não se trata apenas de mais capacidade no mesmo espaço. Trata-se de mais inteligência pelo mesmo watt — e num mundo em que os watts são o recurso escasso, essa é a métrica que decide quem pode crescer e quem não pode.
Do edifício à carga: três décadas de aprendizagem
A evolução das métricas de eficiência em infraestrutura digital não é apenas uma história técnica. É uma história sobre as perguntas que uma indústria se atreve a fazer a si própria.
Nos anos noventa, a pergunta era: está ligado? A disponibilidade era o único critério. Um Data Center que funcionava era considerado eficiente, independentemente da energia que consumia.
Nos anos 2000, com o PUE, a pergunta passou a ser: quanto se perde pelo caminho? Foi um progresso real. Colocou o foco na infraestrutura de suporte, refrigeração, distribuição elétrica, sistemas de backup, e gerou duas décadas de melhorias genuínas na eficiência do edifício.
Nos anos 2010, com a pressão da sustentabilidade, a pergunta ampliou-se: de onde vem essa energia? A origem renovável ou não renovável entrou nos relatórios corporativos. Surgiu a métrica de carbono por watt. As empresas começaram a assinar acordos com produtores de energia renovável para reduzir a sua pegada.
Nos anos 2020, com a IA como carga dominante, a pergunta mudou de natureza: o que produz essa energia? Não o edifício, não a fonte, mas o output. Tokens por watt é a resposta do setor a essa pergunta.
Cada transição ampliou o perímetro do que é medido. Cada ampliação revelou que o perímetro anterior era insuficiente. E em cada caso, a indústria demorou entre cinco e dez anos a adotar massivamente a nova métrica — não porque fosse difícil de compreender, mas porque alterava quem tinha de prestar contas sobre o quê.
O PUE colocava a responsabilidade no operador do edifício. Tokens por watt coloca-a no operador da carga.
É uma mudança que tem consequências contratuais, organizacionais e comerciais que o setor ainda está a processar, especialmente em ambientes que evoluem para modelos de operação mais autónomos.
Estes são os movimentos concretos que esse processo implica atualmente:
Incorporar tokens por watt como KPI operacional. Não como uma métrica aspiracional de marketing, mas como um indicador que é medido, reportado e gerido com a mesma seriedade que o PUE ou a disponibilidade.
Separar a conversa do edifício da conversa da carga. O PUE continua a ser válido para medir a eficiência da infraestrutura de suporte. Mas necessita de uma métrica complementar que avalie o que acontece nos servidores.
Rever os acordos comerciais. Se vende ou compra capacidade de inferência, a eficiência por watt deve estar refletida no contrato. É a métrica que liga o desempenho técnico ao custo energético real e ao valor entregue ao cliente.
Avaliar renovações de hardware com a métrica correta. O custo de aquisição por unidade de computação já não é o argumento central. A eficiência real de inferência, medida em tokens por watt, pode justificar renovações que a análise tradicional rejeitaria.
Preparar a conversa com os clientes. Os utilizadores de infraestrutura de IA vão começar a perguntar por esta métrica. Os operadores que a tiverem medida e bem explicada terão vantagem nessa conversa.
Olhar para os agentes como multiplicadores de procura. Os fluxos de IA que encadeiam múltiplos raciocínios geram muito mais operações por consulta do que uma resposta simples. A eficiência por watt torna-se crítica quando o volume de trabalho por utilizador cresce de forma não linear.
Comunicar a métrica aos níveis superiores da organização. Tokens por watt não é apenas um indicador técnico. É um argumento de negócio: quanta produtividade de IA obtemos com o orçamento energético disponível. Essa tradução é responsabilidade de quem opera a infraestrutura.
Conclusão
O PUE foi uma ferramenta honesta para o problema que existia quando foi concebido. Mediu aquilo que precisava de ser medido, gerou as melhorias que podia gerar e serviu a indústria durante vinte anos..
O que mudou não é que o PUE estivesse errado. O que mudou foi o problema.
Quando a energia era abundante e previsível, medir o edifício fazia sentido. Quando a energia se tornou o recurso escasso do setor e a carga de trabalho passou a ser inteligência mensurável por unidade, a pergunta teve de evoluir.
De quanto se perde pelo caminho para quanto se produz no final.
Do edifício para a carga. Do contentor para o conteúdo. Do watt que entra para o pensamento que sai.
Essa é a história de três décadas de métricas em Data Centers. E a métrica que hoje define o setor é, no fundo, a versão mais honesta de uma pergunta que sempre esteve presente: para que serve toda esta energia?