Durante años, la conversación sobre eficiencia en Data Centers estuvo centrada en una pregunta muy concreta: cuánta energía se perdía antes de llegar a los sistemas de computación.
Era una preocupación lógica. A comienzos de los años 2000, gran parte del consumo energético de un centro de datos se destinaba a refrigeración, distribución eléctrica y sistemas auxiliares. La infraestructura era compleja, costosa de operar y, sobre todo, difícil de medir de forma homogénea.
En ese contexto, la aparición del PUE (Power Usage Effectiveness) marcó un antes y un después para la industria.
El inicio de todo, el PUE
Había una época en que la pregunta más importante de un Data Center era cuánta energía se perdía antes de llegar a los servidores.
Era una pregunta razonable. Los edificios de infraestructura digital de los años noventa y principios de los dos mil eran máquinas térmicas enormes y torpes: sistemas de refrigeración sobredimensionados, grupos electrógenos que consumían en vacío, transformadores con pérdidas que nadie contabilizaba. Por cada watio que llegaba a un servidor, otro watio o más se evaporaba en el camino. Nadie lo medía porque nadie había definido cómo hacerlo.
En 2006, el Green Grid, un consorcio de empresas de tecnología, publicó una métrica que cambió la conversación. Se llamaba PUE, Power Usage Effectiveness. La fórmula era simple: la energía total que entra al edificio dividida por la energía que llega efectivamente a los equipos de IT. Un PUE de 2.0 significaba que por cada watio útil se gastaba otro en overhead. Un PUE de 1.0 era el ideal imposible: un edificio sin pérdidas.

Fue un avance genuino. Dio al sector un idioma común, una forma de comparar instalaciones, una presión competitiva hacia la eficiencia. Los hiperscalers empezaron a publicar sus PUEs como credenciales de ingeniería. Google llegó a 1.08 en algunos de sus Data Centers. El promedio global bajó de 2.5 a 1.58 en menos de dos décadas.
El PUE funcionó. Y esa es exactamente la razón por la que ya no es suficiente.
Una métrica que mide el envase pero ignora el contenido no puede decirte si el negocio tiene sentido
Para entender por qué el PUE envejeció, hay que entender qué asumía el mundo en el que fue diseñado.
En 2006, un servidor era un servidor. Corría aplicaciones de negocio, bases de datos, sistemas de correo. Consumía entre 200 y 400 vatios. La carga era relativamente predecible, los racks tenían densidades manejables y la variación entre una carga de trabajo y otra, en términos energéticos, era modesta. En ese contexto, la ineficiencia del edificio era el problema dominante. Si lográs que más energía llegue a los servidores, lográs que el sistema sea más eficiente. Lógica directa.
Lo que el PUE no podía anticipar era la pregunta que nadie había formulado todavía: ¿y qué hacen esos servidores con la energía que reciben?
Durante años, esa pregunta no importaba mucho porque la respuesta era más o menos uniforme. Un servidor procesando facturas y un servidor enviando correos consumían energías parecidas y producían valor difícil de comparar, pero nadie intentaba medir eso. La eficiencia era del edificio, no de la carga.
El problema apareció cuando la carga cambió de naturaleza.
El reemplazo que lo cambia todo
A partir de 2016, con la primera ola de aprendizaje profundo, y de forma explosiva desde 2022 con los modelos de lenguaje masivos, los Data Centers empezaron a alojar una carga radicalmente diferente. Los GPUs reemplazaron a los CPUs como unidad de cómputo dominante para IA. Un rack que antes consumía 10 kilowatios pasó a consumir 40, luego 100, luego, con la arquitectura Blackwell de NVIDIA en 2025, 140 kilowatios. La densidad energética se multiplicó por un factor de diez en menos de una década acelerando una transformación que ya está redefiniendo la evolución de los Data Centers
En ese nuevo contexto, un Data Center con PUE de 1.1 que aloja racks de 140 kW consume cantidades de energía que habrían parecido absurdas en 2006. El edificio es eficiente. La escala es otra.
Pero la ruptura real no fue cuánto consumen los equipos. Fue cuánto producen.
Un GPU corriendo inferencia de IA genera un output medible: tokens, respuestas, inferencias completadas. Ese output tiene valor económico directo — es lo que el cliente del Data Center está comprando. Y ese output varía enormemente según el hardware, el software y la configuración. Dos instalaciones con PUE idéntico pueden producir cantidades de inteligencia radicalmente distintas con la misma energía.
El PUE no ve lo que se produce. Para el PUE, un watio que llega al servidor es un watio bien utilizado, independientemente de si produce algo útil o no.
La industria ya lo ha detectado y lo está nombrando de forma clara
Schneider Electric publicó en diciembre de 2025 un análisis que articuló la limitación con precisión: una instalación con PUE excelente ejecutando cargas de IA mal optimizadas desperdicia más energía por unidad de valor producido que una instalación con PUE mediocre corriendo cargas eficientes. La métrica del edificio y la métrica del negocio habían dejado de correlacionar.
La alternativa que el sector empezó a adoptar tenía un nombre directo: tokens por watio. Cuántas unidades de output de IA produce el sistema por cada watio de potencia consumida. No el pico teórico en condiciones de laboratorio. El rendimiento real, bajo carga real, incluyendo todas las ineficiencias del camino.
La métrica tenía la virtud de ser comprensible para personas que no son ingenieras. Un token es una unidad de texto generado, aproximadamente tres cuartos de una palabra en inglés. Tokens por watio es, en esencia, cuánto pensamiento produce cada unidad de energía. Una fórmula que conecta la física con la economía sin pasos intermedios.
En marzo de 2026, Jensen Huang convirtió esa métrica en el centro de su keynote en el GTC de San José, California. La fórmula que presentó a CEOs e inversores fue deliberadamente simple:

No habló de especificaciones de hardware. Habló de energía como recurso escaso y de eficiencia como multiplicador de ingresos. Fue el momento en que una métrica técnica se convirtió en lenguaje de negocio.
El timing no era casual. Para 2026, la energía había dejado de ser un costo operativo predecible para convertirse en el cuello de botella estratégico del sector, algo que ya empieza a marcar el límite real de la inteligencia artificial
La demanda eléctrica de los Data Centers orientados a IA subió un 50% solo en 2025, según el reporte Key Questions on Energy and AI del IEA publicado ese año. Los transformadores de alta tensión necesarios para alimentar nuevas instalaciones tienen plazos de entrega de dos a tres años. En varias regiones de Europa y Estados Unidos, las utilities han pausado nuevas conexiones o las han condicionado a esperas de años.
En ese contexto, la pregunta operativa dejó de ser "¿cómo construyo más capacidad?" y pasó a ser "¿cómo extraigo más valor del presupuesto energético que ya tengo?" Y esa pregunta solo tiene una respuesta útil si sabés medir cuánto valor estás produciendo por watio.
El contraste entre generaciones de hardware ilustra la magnitud del cambio. Según análisis de NVIDIA y SemiAnalysis con datos de benchmarks reales, las GPUs de la arquitectura Blackwell producen más de 50 veces más tokens por watio que las de la generación Hopper de apenas dos años antes.
En términos prácticos: el mismo presupuesto energético puede alimentar hoy una capacidad de inferencia cincuenta veces mayor que en 2023, si se usa el hardware correcto.
Para los operadores de Data Centers, esto cambia el argumento de renovación de equipos. Ya no se trata solo de más capacidad por el mismo espacio. Se trata de más inteligencia por el mismo watio, y en un mundo donde los vatios son el recurso escaso, esa es la métrica que decide quién puede crecer y quién no.
Del edificio a la carga: tres décadas de aprendizaje
La evolución de las métricas de eficiencia en infraestructura digital no es solo una historia técnica. Es una historia sobre qué preguntas una industria se anima a hacerse.
En los años noventa, la pregunta era: ¿está encendido? La disponibilidad era el único criterio. Un Data Center que funcionaba era un Data Center eficiente, independientemente de cuánta energía consumiera.
En los 2000, con el PUE, la pregunta pasó a ser: ¿cuánto se pierde en el camino? Era progreso real. Puso foco en la infraestructura de soporte, refrigeración, distribución eléctrica, sistemas de respaldo, y generó dos décadas de mejoras genuinas en la eficiencia del edificio.
En los 2010, con la presión de sostenibilidad, la pregunta se amplió: ¿de dónde viene esa energía? El origen renovable o no renovable entró en los reportes corporativos. Apareció la métrica de carbono por watio. Las empresas empezaron a firmar acuerdos con generadores de renovables para limpiar su huella.
En los 2020, con la IA como carga dominante, la pregunta cambió de naturaleza: ¿qué produce esa energía? No el edificio, no la fuente, sino el output. Tokens por watio es la respuesta del sector a esa pregunta.
Cada transición amplió el perímetro de lo que se mide. Cada ampliación reveló que el perímetro anterior era insuficiente. Y en cada caso, la industria tardó entre cinco y diez años en adoptar masivamente la nueva métrica, no porque fuera difícil de entender, sino porque cambiaba quién tenía que rendir cuentas de qué.
El PUE ponía la responsabilidad en el operador del edificio. Tokens por watio la pone en el operador de la carga.
Es un desplazamiento que tiene consecuencias contractuales, organizativas y comerciales que el sector todavía está procesando, especialmente en entornos que avanzan hacia modelos de operación más autónomos.
Estos son los movimientos concretos que ese procesamiento implica hoy:
Incorporar tokens por watio como KPI de operación. No como métrica aspiracional de marketing, sino como indicador que se mide, se reporta y se gestiona con la misma seriedad que el PUE o la disponibilidad.
Separar la conversación del edificio de la conversación de la carga. El PUE sigue siendo válido para medir la eficiencia de la infraestructura de soporte. Pero necesita un par que mida lo que ocurre en los servidores.
Revisar los acuerdos comerciales. Si vendés o comprás capacidad de inferencia, la eficiencia por watio debería estar en el contrato. Es la métrica que conecta el rendimiento técnico con el coste energético real y con el valor entregado al cliente.
Evaluar renovaciones de hardware con la métrica correcta. El coste de adquisición por unidad de cómputo ya no es el argumento central. La eficiencia de inferencia real, medida en tokens por watio, puede justificar renovaciones que el análisis tradicional rechazaría.
Preparar la conversación con clientes. Los usuarios de infraestructura de IA van a empezar a preguntar por esta métrica. Los operadores que la tengan medida y explicada van a tener ventaja en esa conversación.
Mirar los agentes como multiplicador de demanda. Los flujos de IA que encadenan múltiples razonamientos generan muchas más operaciones por consulta que una respuesta simple. La eficiencia por watio se vuelve crítica cuando el volumen de trabajo por usuario crece de forma no lineal.
Comunicar la métrica hacia arriba en la organización. Tokens por watio no es solo un indicador técnico. Es un argumento de negocio: cuánta productividad de IA obtenemos con el presupuesto energético disponible. Esa traducción es responsabilidad de quien opera la infraestructura.
Cierre
El PUE fue una herramienta honesta para el problema que existía cuando fue diseñado. Midió lo que había que medir, generó las mejoras que podía generar, y sirvió a la industria durante veinte años.
Lo que cambió no es que el PUE estuviera mal. Lo que cambió es el problema.
Cuando la energía era abundante y predecible, medir el edificio tenía sentido. Cuando la energía se convirtió en el recurso escaso del sector y la carga de trabajo pasó a ser inteligencia medible por unidad, la pregunta tuvo que evolucionar.
De cuánto se pierde en el camino a cuánto se produce al final.
Del edificio a la carga. Del contenedor al contenido. Del watio que entra al pensamiento que sale.
Esa es la historia de tres décadas de métricas en Data Centers. Y la métrica que hoy define el sector es, en el fondo, la versión más honesta de una pregunta que siempre estuvo ahí ¿para qué es toda esa energía?