¿Cómo se explica esta súbita explosión del consumo de agua de las tecnológicas? ¿Por qué es menor en Meta o Apple que en Microsoft y Google? El 4 de noviembre de 2022 se presentó ChatGPT, el bot conversacional que dio el pistoletazo de salida de la carrera por la inteligencia artificial (IA) generativa. Google ya tenía grandes modelos de lenguaje similares, como LaMDA, en fase experimental, pero no los había abierto al público. Para que estos modelos echen a andar hay que entrenarlos antes. Ese proceso exige que legiones de computadoras de alta potencia (las GPU) procesen cantidades ingentes de datos día y noche durante semanas o hasta meses para encontrar patrones en los textos que sirvan para poder articular luego fragmentos con sentido. En el caso de GPT-4, la versión más avanzada hasta el momento de ChatGPT, ese entrenamiento se realizó en Des Moines, Iowa, algo totalmente desconocido por los vecinos hasta que un alto cargo de Microsoft dijo en un discurso que “se hizo literalmente al lado de campos de maíz de Des Moines”, según reportó The Associated Press.
El esfuerzo adicional por desarrollar grandes modelos de IA puede haber disparado el consumo de agua de Google y Microsoft, las dos tecnológicas que más fuerte han apostado por esta tecnología. Así lo cree el investigador Shaolei Ren, profesor asociado de ingeniería eléctrica y computacional de la Universidad de California, Riverside y especialista en sostenibilidad de la IA. “No lo podemos decir con certeza si las empresas no nos aportan datos concretos, pero el aumento de 2022 fue muy abultado respecto a 2021 y sabemos que en esa época invirtieron muy fuertemente en IA generativa, así como en otros servicios relacionados con la IA”, explica por correo electrónico. “La IA se ha integrado en casi todos los productos de uso diario de Microsoft y Google, incluyendo sus buscadores”.
Las compañías no ofrecen datos sobre cuánta agua y energía de más cuesta entrenar modelos de IA respecto al consumo habitual de los centros de datos. “Lo que sí sabemos, porque así me lo ha confirmado el director de una de estas infraestructuras, es que los chips usados en el entrenamiento de IA consumen mucho más que los de los servidores comunes”, destaca Ana Valdivia, profesora de Inteligencia Artificial, Gobierno y Políticas del Oxford Internet Institute, cuya investigación más reciente se centra en evaluar el impacto ambiental de la IA.
Ren publicará a finales de año junto con otros tres colegas una investigación en la que ofrecen una cifra estimada de cuánta agua cuesta chatear con ChatGPT. Por cada entre 5 y 50 prompts (preguntas o instrucciones), ChatGPT consume medio litro de agua. La horquilla de 5 a 50 está relacionada con la complejidad de los prompts. El cálculo contempla todo el agua usada durante el entrenamiento del modelo, que es el momento de mayor consumo, y la empleada por la máquina para procesar las órdenes que se le dan la herramienta.
Las empresas afectadas ofrecen otros argumentos. Una portavoz de Google dice que el abultado salto en el consumo de agua de 2022 “se corresponde al crecimiento del negocio”. La respuesta de Microsoft es casi calcada.
Otras grandes tecnológicas, como Meta (2,7%) o Apple (8,5%), han tenido un incremento en el consumo de agua, pero significativamente menor que los de Microsoft y Google. Son gigantes empresariales y su actividad ha crecido, pero su apuesta por la IA no es tan alta. Aunque esa tecnología está presente en sus aplicaciones, no tienen grandes modelos similares a ChatGPT (o como Bard, de Google, o Copilot, de Microsoft).
Los centros de datos tienen el aspecto de naves industriales que constan de varias salas. En cada una de ellas hay hileras de racks, o torres de computadoras de la altura de un armario. Estas hileras están dispuestas en pasillos, de modo que los operarios puedan manipular los circuitos de cada máquina.
Los servidores emiten calor cuando funcionan. La concentración de tantas computadoras en un mismo lugar hace que ese efecto sea más intenso. Muchos centros de datos recurren a torres de refrigeración para evitar el sobrecalentamiento, el mismo sistema empleado en otras industrias. Se basa en exponer un caudal de agua a una corriente de aire en un intercambiador de calor, de manera que la evaporación enfríe el circuito.
Este método es más eficiente energéticamente que los enfriadores eléctricos, pero implica que una gran cantidad de agua se evapore (es decir, que no vuelva al circuito). “Esa es el agua que figura como ‘consumida’ en los registros de las tecnológicas. Dependiendo de la temperatura exterior del bulbo húmedo, una torre de refrigeración suele consumir entre uno y cuatro litros de agua (hasta nueve en verano) por cada kWh de energía del servidor”, lee el estudio de Ren.
En torno al 20% del agua utilizada en los sistemas de refrigeración (la que no se evapora) se vierte al final del ciclo en las plantas de aguas residuales. “Esa agua contiene grandes cantidades de minerales y sal, por lo que no puede dedicarse al consumo humano sin ser tratada antes”, ilustra Ren.
Es difícil establecer cuál es el consumo medio de un centro de datos. Los que están en climas más fríos necesitan menos refrigeración que el resto. De la misma manera, la exigencia de agua es distinta en las épocas más calurosas del año que en las más gélidas. Necesitan, eso sí, usar agua limpia y tratada para evitar atascos o el crecimiento de bacterias en las tuberías. Cuando se emplea agua del mar o recuperada, hay que depurarla antes de meterla en los sistemas de refrigeración. En el caso de Google, casi el 90% de su consumo en EE UU procedió de fuentes potables, asegura Ren.
Los centros de datos solían estar en las ciudades, pero las crecientes necesidades energéticas de estas infraestructuras las han expulsado del entorno urbano, incapaz de abastecerlas. “Necesitan también una ubicación segura, que cuente con un suministro estable de electricidad y que no tenga riesgo de catástrofe climática. Por todo eso, en las últimas dos décadas se han ido a la periferia”, explica Lorena Jaume-Palasí, fundadora de Algorithm Watch y The Ethical Tech Society y asesora de ciencia y tecnología del Parlamento Europeo.
“Los centros de datos modernos son muy extensivos. Se suelen ubicar cerca del desierto o en zonas agrarias para poder explayarse en extensión: es habitual que se monten y muevan módulos de servidores según las necesidades”, indica. Un estudio elaborado por investigadores de Virginia Tech estima que una quinta parte de los centros de datos de EE.UU. consumen agua de cuencas con un estrés hídrico moderado o alto, zonas donde suele haber disponiblidad de energía solar o eólica.
Aurora Gómez, del colectivo Tu Nube Seca Mi Río, nacido como reacción al megacentro que Meta construirá en Talavera de la Reina, ve un patrón detrás de estas actuaciones. “Las empresas suelen ir a buscar para sus centros de datos zonas despobladas y con altas tasas de paro para que haya poca contestación social”, reflexiona.
La industria está apostando de manera clara por integrar la IA en cada vez más productos y servicios. ¿Hay forma de entrenar modelos de IA sin gastar grandes cantidades de agua? Ren cree que no. “Se podrían usar secadores eléctricos para refrigerar las computadoras, pero tienen un gran gasto energético, por lo que aumentaría mucho el consumo de agua implicado en la generación de electricidad. Sobre el papel se puede no usar agua en el proceso, pero lo veo muy difícil”, concluye el académico.
Eso es lo que defienden las empresas, inmersas en planes de mejoras de eficiencia de sus sistemas. Según fuentes de Meta, los nuevos centros de datos que planea desarrollar la compañía especialmente enfocados a la IA usarán sistemas de secado eléctricos, que no necesitan agua (más allá de la necesaria para generar electricidad). Un reciente estudio de Javier Farfan y Alena Lohrmann, en el que se tienen en cuenta los datos de consumo actuales y las perspectivas de crecimiento económico, Europa necesitará a partir de 2030 más de 820 millones de metros cúbicos de agua anuales solo para que podamos usar internet.
Algunas voces empiezan a hacer llamamientos para que usemos menos las herramientas digitales. La idea de fondo es la misma que con el transporte o el consumo de carne: la única forma efectiva de revertir la crisis climática es rebajar los niveles de producción y consumo. Eso es lo que sostienen las teorías del decrecimiento.
Valdivia no cree que el decrecimiento digital sea la solución. “Me parece que responsabilizar a la gente de ese consumo es el enfoque erróneo. Por otra parte, los centros de datos son mucho más útiles y necesarios socialmente que, por ejemplo, los coches eléctricos. Hay alternativas a la movilidad: puedes dejar el coche y coger el autobús o el tren. Pero no hay alternativa a los centros de datos”.
EL PAIS
Autor: Manuel G. Pascual
Foto: Google
This Post Has 0 Comments