Hacia una computación más fresca y más verde: microfluídica y computación termodinámica

En un momento en el que los centros de datos crecen sin parar para alimentar la demanda de inteligencia artificial (IA), dos innovaciones tecnológicas están emergiendo como posibles salvavidas para un futuro más sostenible: la microfluídica para la refrigeración de chips y la computación termodinámica para hacerlos más eficientes desde el punto de vista energético, hay veces que no es la IA o el avance más probable en tecnologías, hay veces que tan solo hay que mirar a la naturaleza, y ver como fluyen los sustentos en el ala de una mariposa o en las hojas de un árbol, para inspirar grandes avances, esto es un ejemplo.

1. Microfluídica: enfriando los chips desde dentro

Una de las grandes limitaciones de los centros de datos modernos es el calor. Los chips de IA son cada vez más potentes, pero también generan más temperatura, y refrigerarlos consume tanto electricidad como agua. Aquí es donde entra en juego la “microfluídica”, una técnica que literalmente introduce líquido refrigerante dentro de los chips.

Microsoft ha dado un paso muy relevante: ha probado con éxito un sistema de microcanales grabados directamente en el silicio del chip, por donde fluye el líquido refrigerante justo donde se produce el calor. Con esto han logrado enfriar hasta 3 veces más eficazmente  que con las placas frías tradicionales (“cold plates”).

Además, usan IA para mapear dónde están los “puntos calientes” del chip y dirigir con precisión el líquido solo a esas zonas. En sus pruebas han reducido el aumento máximo de temperatura en el silicio hasta un 65 %.

¿Por qué es tan importante esto? Porque este método de enfriamiento no solo mejora el rendimiento de los chips (pueden trabajar más intensamente), sino que puede disminuir el consumo, de energía y agua, al requerir líquidos menos fríos (De hecho en las pruebas entra agua a 40ºC y sale a 70ºC) y reducir la infraestructura pesada de enfriamiento. Además, gracias a una mejor gestión térmica, podría facilitar diseños más densos (más chips en menos espacio, un objetivo perseguido que tenía el problema de la disipación de calor) o incluso chips apilados en 3D (sí, hablamos de extender una tercera dimensión los chips gracias a crear capas de microfuidos y no tener la obligación, hasta ahora imposible, de refrigerar esas capas internas por la falta de contacto con las cold plates o piezas disipadoras de calor), lo que abre la puerta a más potencia sin aumentar el tamaño del datacenter.. ..así evitar el uso de millones de litros de agua, un gasto de recursos que no podemos permitirnos. Incluso podemos ver la manera de aprovechar esa energía de calor disipado.

En definitiva: la microfluídica podría reducir sustancialmente el gasto energético y de agua en refrigerar los centros de datos del futuro.

2. Computación termodinámica: usar el “ruido” térmico en vez de combatirlo

La segunda gran innovación viene de la “computación termodinámica”, y en este campo destaca una empresa llamada –Extropic-. Su apuesta es radical: en lugar de hacer cálculos utilizando bits tradicionales que solo pueden estar en 0 o en 1, sus chips usan “p-bits” (bits probabilísticos) que fluctúan entre estos valores de forma natural, aprovechando justamente el ruido térmico que normalmente se considera un problema (esta vez no ha sido echar un vistazo a la naturaleza, o también…porque ese ruido es natural…,  que nos rodea, ha sido invertir los términos de algo que la ingenieria ha tratado siempre de combatir y utilizarlo a nuestro favor de una forma genial y creativa)

Estos p-bits están agrupados en lo que Extropic llama TSU  (Thermodynamic Sampling Unit). La idea es que, en lugar de simular aleatoriedad mediante operaciones complejas en una GPU, el TSU genera directamente muestras (“samples”) a partir de distribuciones probabilísticas, lo que lo hace muchísimo más eficiente. De hecho, según Extropic, sus simulaciones indican que podrían llegar a ser ,hasta 10.000 veces más eficientes energéticamente, (una burrada de avance) que las GPUs convencionales para ciertos modelos de IA generativa.

¿Cómo lo logran? Simplificando: los p-bits son circuitos que cambian entre 0 y 1 de forma aleatoria, pero controlable mediante voltajes. Luego se combinan muchos de esos p-bits para formar modelos más complejos mediante un algoritmo conocido como “Gibbs sampling”. Además, al diseñar los TSU de forma que la comunicación entre los p-bits sea local (solo entre circuitos cercanos), se reduce muchísimo el gasto energético en movimiento de datos. (Hay camino que recorrer, porque esta novedosa técnica nos obliga a programar las cosas de una nueva manera, no nos sirve lo que hoy mueve a las GPUs, o NPUs)

Otro punto a favor: Extropic ha desarrollado también un modelo de IA (Denosing Thermodynamic Model, DTM) hecho a medida para sus TSU, optimizado para consumir muy poca energía mientras genera datos. (Tal vez inspirados por las propias técnicas de generación de imágenes a partir de ruido aleatorio…quien sabe)

Extropic ya en 2024 estaba construyendo una plataforma de hardware completa para aprovechar las fluctuaciones naturales de la materia como recurso informático para la IA generativa. Este nuevo paradigma informático amplía la escala del hardware mucho más allá de las limitaciones de la informática digital. Permite crear aceleradores de IA que son varias veces más rápidos y eficientes energéticamente que los procesadores digitales (CPU/GPU/TPU/FPGA) y desbloquea potentes algoritmos probabilísticos de IA que no son factibles en procesadores digitales.

Infografía MicroFluidíca y Computación Termodinámica

3. ¿Qué implican estos avances para el futuro?

.- Menor consumo energético: si los centros de datos adoptan microfluídica, podría bajar mucho el gasto de energía para refrigeración. Y si los TSU se usan para algunas tareas de IA, el propio cálculo sería mucho más eficiente.

.-Menor consumo de agua: enfriar con microcanales permite usar líquidos menos fríos, lo que podría reducir la necesidad de torres de enfriamiento intensas o evaporativas.

.-Más potencia en espacios más pequeños: gracias a una mejor refrigeración y chips más eficientes, se podrían meter más servidores en menos espacio. (Ley de Moore al cajón del olvido)

.-Sostenibilidad: estos avances podrían hacer que el crecimiento de la IA no tire tanto de recursos como ocurre hoy, contribuyendo a un modelo de computación más responsable.

En conjunto, la microfluídica y la computación termodinámica ofrecen una visión muy prometedora para el futuro de la computación: no solo más potente, sino también más verde. Si logramos llevar estas tecnologías a gran escala, podríamos resolver uno de los grandes dilemas actuales: cómo seguir creciendo en capacidad de cómputo sin que el coste energético y el impacto ambiental se disparen.

En Domodesk, siempre intentamos estar al tanto del estado-del-arte en tecnología, al final la tecnología es la referencia que guía nuestros pasos ;-).

Para saber más (Fuentes)

https://news.microsoft.com/source/features/innovation/microfluidics-liquid-cooling-ai-chips

https://extropic.ai/writing/thermodynamic-computing-from-zero-to-one

https://extropic.ai/writing/tsu-101-an-entirely-new-type-of-computing-hardware

Comments are closed.