Las claves:
- China construyó cientos de centros de datos de IA para aprovechar el auge de la IA. Ahora, muchos permanecen sin uso.
- El país invirtió miles de millones en infraestructura de IA, pero la fiebre del oro de los centros de datos se está desmoronando a medida que las inversiones especulativas chocan con una demanda débil y DeepSeek cambia las tendencias de IA.
Hace aproximadamente un año, Xiao Li veía un aluvión de ofertas de chips de Nvidia en WeChat. Un contratista inmobiliario convertido en gerente de proyectos de centros de datos, se había volcado a la infraestructura de IA en 2023, atraído por la promesa del auge de la IA en China.
En aquel entonces, los comerciantes de su círculo se jactaban de conseguir envíos de GPU Nvidia de alto rendimiento sujetas a restricciones de exportación estadounidenses. Muchas se introducían de contrabando a través de canales internacionales hasta Shenzhen. En el punto álgido de la demanda, un solo chip Nvidia H100, esencial para el entrenamiento de modelos de IA, podía venderse por hasta 200.000 yuanes (28.000 dólares) en el mercado negro.
Ahora, su feed de WeChat y los chats grupales del sector cuentan una historia diferente. Los operadores son más discretos en sus transacciones y los precios han vuelto a la normalidad. Mientras tanto, dos proyectos de centros de datos que Li conoce tienen dificultades para conseguir más financiación de inversores que anticipan bajos rendimientos, lo que obliga a los responsables de los proyectos a vender sus GPU sobrantes. «Parece que todos venden, pero pocos compran», afirma.
Hace apenas unos meses, la construcción de centros de datos estaba en su apogeo, impulsada tanto por inversores gubernamentales como privados. Sin embargo, muchas instalaciones de nueva construcción se encuentran ahora vacías. Según personas que hablaron con MIT Technology Review , incluyendo contratistas, un ejecutivo de una empresa de servidores GPU y gerentes de proyecto, la mayoría de las empresas que gestionan estos centros de datos tienen dificultades para mantenerse a flote. Los medios chinos locales Jiazi Guangnian y 36Kr informan que hasta el 80% de los recursos informáticos de nueva construcción de China permanecen sin utilizar.
Alquilar GPU a empresas que las necesitan para entrenar modelos de IA —el principal modelo de negocio de la nueva generación de centros de datos— se consideraba una apuesta segura. Pero con el auge de DeepSeek y un cambio repentino en la economía de la IA, la industria se tambalea.
“El creciente sufrimiento que está atravesando la industria de IA de China es en gran medida el resultado de actores inexpertos (corporaciones y gobiernos locales) que se subieron al tren de la publicidad exagerada y construyeron instalaciones que no son óptimas para las necesidades actuales”, dice Jimmy Goodrich, asesor senior de tecnología de RAND Corporation.
El resultado es que los proyectos están fracasando, se desperdicia energía y los centros de datos se han convertido en “activos en dificultades” cuyos inversores están ansiosos por deshacerse de ellos a precios inferiores a los del mercado. La situación podría eventualmente provocar la intervención del gobierno, afirma: “Es probable que el gobierno chino intervenga, se haga cargo y los ceda a operadores más capaces”.
Un auge caótico de la construcción
Cuando ChatGPT irrumpió en escena a finales de 2022, la respuesta en China fue inmediata. El gobierno central designó la infraestructura de IA como prioridad nacional e instó a los gobiernos locales a acelerar el desarrollo de los llamados centros de computación inteligente, un término acuñado para describir los centros de datos centrados en IA.
En 2023 y 2024, se anunciaron más de 500 nuevos proyectos de centros de datos en todas partes, desde Mongolia Interior hasta Guangdong, según KZ Consulting, una firma de investigación de mercado. Según el Comité de Centros de Datos de la Asociación de la Industria de las Comunicaciones de China, una asociación industrial afiliada al estado, al menos 150 de los nuevos centros de datos estaban terminados y en funcionamiento para finales de 2024. Empresas estatales, empresas que cotizan en bolsa y fondos afiliados al estado hicieron fila para invertir en ellos, con la esperanza de posicionarse como pioneros en IA. Los gobiernos locales los promocionaron intensamente con la esperanza de que estimularan la economía y establecieran su región como un centro clave de IA.
Con un nuevo modelo de razonamiento que coincide con el rendimiento de ChatGPT o1, DeepSeek logró convertir las restricciones en innovación.
Sin embargo, a medida que continúan estos costosos proyectos de construcción, el frenesí chino por los modelos lingüísticos a gran escala está perdiendo impulso. Solo en 2024, más de 144 empresas se registraron ante la Administración del Ciberespacio de China (el regulador central de internet del país) para desarrollar sus propios LLM. Sin embargo, según el Economic Observer , una publicación china, solo alrededor del 10 % de esas empresas seguían invirtiendo activamente en la formación de modelos a gran escala a finales de año.
El sistema político chino está altamente centralizado, y los funcionarios de los gobiernos locales suelen ascender mediante nombramientos regionales. Como resultado, muchos líderes locales priorizan proyectos económicos a corto plazo que demuestran resultados rápidos —a menudo para ganarse el favor de los altos mandos— en lugar del desarrollo a largo plazo. Los grandes proyectos de infraestructura de alto perfil han sido durante mucho tiempo una herramienta para que los funcionarios locales impulsen sus carreras políticas.
La recesión económica pospandémica no hizo más que intensificar esta dinámica. Con el sector inmobiliario chino —antaño la columna vertebral de las economías locales— desplomándose por primera vez en décadas, las autoridades se apresuraron a encontrar motores de crecimiento alternativos. Mientras tanto, la otrora floreciente industria de internet del país también entraba en un período de estancamiento. En este vacío, la infraestructura de IA se convirtió en el nuevo estímulo predilecto.
“La IA fue como una inyección de adrenalina”, dice Li. “Gran parte del dinero que antes se destinaba al sector inmobiliario ahora se destina a centros de datos de IA”.
Para 2023, grandes corporaciones, muchas de ellas con poca experiencia previa en IA, comenzaron a colaborar con los gobiernos locales para capitalizar la tendencia. Algunas vieron la infraestructura de IA como una forma de justificar la expansión empresarial o impulsar el precio de las acciones, afirma Fang Cunbao, gerente de proyectos de centros de datos con sede en Pekín. Entre ellas se encontraban empresas como Lotus, fabricante de glutamato monosódico, y Jinlun Technology, una empresa textil; nombres que difícilmente asociarían con tecnología de IA de vanguardia.
Este enfoque de fiebre del oro significó que el impulso para construir centros de datos de IA se impulsara en gran medida desde arriba, a menudo sin tener en cuenta la demanda real ni la viabilidad técnica, según Fang, Li y varias fuentes locales, quienes solicitaron el anonimato por temor a repercusiones políticas. Muchos proyectos fueron liderados por ejecutivos e inversores con poca experiencia en infraestructura de IA, afirman. En la prisa por mantenerse al día, muchos se construyeron apresuradamente y no cumplieron con los estándares del sector.
“Unir todos estos grandes clústeres de chips es una tarea muy difícil, y muy pocas empresas o personas saben cómo hacerlo a gran escala”, afirma Goodrich. “Se trata de ingeniería informática de vanguardia. Me sorprendería que la mayoría de estas pequeñas empresas supieran hacerlo. Muchos de los centros de datos recién construidos se conectan rápidamente y no ofrecen la estabilidad que una empresa como DeepSeek desearía”.
Para empeorar las cosas, los líderes del proyecto a menudo dependían de intermediarios y corredores, algunos de los cuales exageraban las previsiones de demanda o manipulaban los procesos de adquisición para embolsarse los subsidios gubernamentales, dicen las fuentes.
A finales de 2024, la emoción que rodeó el auge de los centros de datos en China se estaba convirtiendo en decepción. La razón es simple: el alquiler de GPU ya no es un negocio particularmente lucrativo.
El ajuste de cuentas de DeepSeek
El modelo de negocio de los centros de datos es, en teoría, sencillo: se lucran alquilando clústeres de GPU a empresas que necesitan capacidad de procesamiento para el entrenamiento de IA. Sin embargo, en la práctica, conseguir clientes resulta difícil. Solo unas pocas empresas tecnológicas líderes en China utilizan actualmente una gran cantidad de potencia de procesamiento para entrenar sus modelos de IA. Muchas empresas más pequeñas han renunciado al preentrenamiento de sus modelos o han cambiado su estrategia desde el auge de DeepSeek, que revolucionó internet con R1, su modelo de razonamiento de código abierto que iguala el rendimiento de ChatGPT o1, pero se desarrolló a una fracción de su coste.
DeepSeek representa un momento decisivo para la industria china de la IA. La pregunta clave pasó de “¿Quién puede crear el mejor modelo de lenguaje extenso?” a “¿Quién puede utilizarlo mejor?”, afirma Hancheng Cao, profesor adjunto de sistemas de información en la Universidad Emory.
El auge de modelos de razonamiento como R1 de DeepSeek y ChatGPT o1 y o3 de OpenAI también ha transformado las expectativas de las empresas respecto a un centro de datos. Con esta tecnología, la mayoría de las necesidades computacionales se basan en la realización de deducciones lógicas paso a paso en respuesta a las consultas de los usuarios, no en el proceso inicial de entrenamiento y creación del modelo. Este proceso de razonamiento suele producir mejores resultados, pero requiere mucho más tiempo. Por lo tanto, es fundamental contar con hardware con baja latencia (el tiempo que tardan los datos en transferirse de un punto a otro de la red). Los centros de datos deben ubicarse cerca de importantes centros tecnológicos para minimizar los retrasos en la transmisión y garantizar el acceso a personal de operaciones y mantenimiento altamente cualificado.
Este cambio significa que muchos centros de datos construidos en el centro, oeste y zonas rurales de China, donde la electricidad y el terreno son más baratos, están perdiendo su atractivo para las empresas de IA. En Zhengzhou, ciudad de la provincia natal de Li, Henan, un centro de datos recién construido incluso distribuye cupones de computación gratuitos a empresas tecnológicas locales, pero aún tiene dificultades para atraer clientes.
Además, muchos de los nuevos centros de datos que han surgido en los últimos años se optimizaron para cargas de trabajo de preentrenamiento (cálculos grandes y sostenidos ejecutados en conjuntos de datos masivos), en lugar de para la inferencia, el proceso de ejecutar modelos de razonamiento entrenados para responder a las entradas del usuario en tiempo real. El hardware compatible con la inferencia difiere del utilizado tradicionalmente para el entrenamiento de IA a gran escala.
Las GPU como Nvidia H100 y A100 están diseñadas para el procesamiento masivo de datos, priorizando la velocidad y la capacidad de memoria. Pero a medida que la IA avanza hacia el razonamiento en tiempo real, la industria busca chips más eficientes, con mayor capacidad de respuesta y rentables. Incluso un pequeño error de cálculo en las necesidades de infraestructura puede hacer que un centro de datos no sea óptimo para las tareas que requieren los clientes.
En estas circunstancias, el precio del alquiler de GPU ha caído a un mínimo histórico. Un informe reciente del medio de comunicación chino Zhineng Yongxian indicó que un servidor Nvidia H100 configurado con ocho GPU ahora se alquila por 75.000 yuanes al mes, una reducción con respecto a los máximos de alrededor de 180.000. Algunos centros de datos prefieren dejar sus instalaciones vacías antes que arriesgarse a perder aún más dinero debido a su alto coste operativo, afirma Fan: «Los ingresos por tener una pequeña parte del centro de datos en funcionamiento simplemente no cubrirían los gastos de electricidad y mantenimiento».
“Es paradójico: China se enfrenta a los mayores costes de adquisición de chips Nvidia, pero los precios del alquiler de GPU son extraordinariamente bajos”, afirma Li. Existe un exceso de potencia computacional, especialmente en el centro y el oeste de China, pero al mismo tiempo, hay escasez de chips de vanguardia.
Sin embargo, no todos los intermediarios buscaban lucrarse con los centros de datos desde el principio. Muchos, en cambio, siempre estuvieron interesados en aprovecharse de los beneficios gubernamentales. Algunos operadores explotan el sector para obtener electricidad verde subvencionada, obteniendo permisos para generar y vender energía, según Fang y algunos medios de comunicación chinos. En lugar de utilizar la energía para cargas de trabajo de IA, la revenden a la red con un sobreprecio. En otros casos, las empresas adquieren terrenos para el desarrollo de centros de datos con el fin de optar a préstamos y créditos estatales, dejando las instalaciones sin utilizar mientras siguen beneficiándose de la financiación estatal, según el medio de comunicación local Jiazi Guangnian .
“A finales de 2024, ningún contratista ni corredor sensato del mercado entraría en el negocio esperando obtener una rentabilidad directa”, afirma Fang. “Todos los que conocí están aprovechando el acuerdo del centro de datos para obtener algo más que el gobierno podría ofrecer”.
Un mal necesario
A pesar de la infrautilización de los centros de datos, el gobierno central de China sigue impulsando con fuerza la infraestructura de IA. A principios de 2025, convocó un simposio de la industria de la IA, enfatizando la importancia de la autosuficiencia en esta tecnología.
Las principales empresas tecnológicas chinas están tomando nota y realizando inversiones en consonancia con esta prioridad nacional. Alibaba Group anunció planes para invertir más de 50 000 millones de dólares en computación en la nube e infraestructura de hardware de IA durante los próximos tres años, mientras que ByteDance planea invertir alrededor de 20 000 millones de dólares en GPU y centros de datos.
Mientras tanto, las empresas estadounidenses están haciendo lo mismo. Grandes empresas tecnológicas, como OpenAI, Softbank y Oracle, se han unido para comprometerse con la iniciativa Stargate, que prevé invertir hasta 500 000 millones de dólares en los próximos cuatro años para construir centros de datos avanzados e infraestructura informática. Dada la competencia en IA entre ambos países, los expertos afirman que es improbable que China reduzca sus esfuerzos. «Si la IA generativa va a ser la tecnología clave, la infraestructura será el factor determinante del éxito», afirma Goodrich, asesor de políticas tecnológicas de RAND.
El gobierno central chino probablemente considerará [los centros de datos infrautilizados] como un mal necesario para desarrollar una capacidad importante, una especie de problema creciente. Existen proyectos fallidos y activos en dificultades, y el estado los consolidará y saneará. Ven el fin, no los medios, afirma Goodrich.
La demanda de chips Nvidia se mantiene fuerte, especialmente del chip H20, diseñado específicamente para el mercado chino. Una fuente del sector, que solicitó el anonimato debido a la política de su empresa, confirmó que el H20, un modelo más ligero y rápido, optimizado para la inferencia de IA, es actualmente el chip Nvidia más popular, seguido del H100, que continúa llegando a China con un flujo constante a pesar de las restricciones oficiales impuestas por las sanciones estadounidenses. Parte de la nueva demanda se debe a que las empresas están implementando sus propias versiones de los modelos de código abierto de DeepSeek.
Por ahora, muchos centros de datos en China se encuentran en un limbo, construidos para un futuro aún por llegar. Es incierto si encontrarán una segunda vida. Para Fang Cunbao, el éxito de DeepSeek se ha convertido en un momento decisivo, poniendo en duda la suposición de que una expansión incesante de la infraestructura de IA garantiza el progreso.
Ahora se da cuenta de que es solo un mito. A principios de este año, Fang decidió abandonar por completo la industria de los centros de datos. «El mercado es demasiado caótico. Los primeros en adoptarlo se beneficiaron, pero ahora solo hay gente que busca lagunas en las políticas», afirma. Ahora ha decidido dedicarse a la formación en IA.
“Lo que separa ahora de un futuro en el que la IA esté realmente en todas partes”, afirma, “ya no es la infraestructura, sino planes sólidos para implementar la tecnología”.
Fuente: Caiwei Chen- MIT Technology Review
Foto: anne-nygard-unsplash