GLM-4.5: La IA china de código abierto que planta cara a Claude y GPT-4o
Zhipu AI ha lanzado GLM-4.5, un modelo con 355 mil millones de parámetros, licencia MIT y precios más bajos que DeepSeek. Te contamos qué lo hace especial, cómo funciona y qué significa para el futuro de la IA.
La historia detrás: de la universidad a los 34 mil millones
Antes de hablar del modelo, hay que conocer quién lo ha creado. Zhipu AI (también conocida como Z.ai) es una startup china fundada en 2019 por profesores de la Universidad de Tsinghua, la más prestigiosa de China (algo así como el MIT o Stanford de allí).
Lo interesante es que no son recién llegados. Ya en 2022 lanzaron GLM-130B, uno de los primeros modelos grandes chinos de código abierto. Y en 2023 lanzaron ChatGLM, uno de los primeros chatbots chinos. Llevan años construyendo modelos antes de que fuera "lo cool".
¿Cómo de grandes son? 800 empleados, inversiones de Alibaba, Tencent y fondos de Arabia Saudí, y en enero de 2026 salieron a bolsa en Hong Kong con una valoración de 34 mil millones de dólares. Es la startup de IA más grande de China por plantilla.
Qué es GLM-4.5
GLM son las siglas de General Language Model (Modelo de Lenguaje General). La versión 4.5 lleva el subtítulo ARC: Agentic, Reasoning and Coding (Agente, Razonamiento y Código). Eso te dice mucho de para qué está diseñado.
Algunos datos técnicos clave:
¿Qué significa eso de "355 mil millones pero solo activa 32 mil millones"? Ahí está uno de los trucos más interesantes del modelo.
Mixture of Experts: el truco de los especialistas
GLM-4.5 usa una arquitectura llamada Mixture of Experts (Mezcla de Expertos, o MoE). Vamos a explicarlo con una analogía:
Imagina un hospital con 128 médicos especialistas. Cuando llega un paciente, no lo ven los 128 a la vez — eso sería un caos. En su lugar, un sistema inteligente selecciona a los 8 especialistas más relevantes para ese caso concreto, más 1 médico generalista que siempre está presente.
Así funciona GLM-4.5. Tiene 128 "expertos" (bloques de red neuronal especializados), pero para cada pregunta solo activa 8 + 1 compartido. El resultado:
"Más profundo, no más ancho"
Aquí viene algo que diferencia a GLM-4.5 de otros modelos MoE como DeepSeek. Mientras otros modelos añaden más expertos (haciéndolo "más ancho"), Zhipu decidió hacer el modelo más profundo: 46 capas con 96 cabezas de atención.
Es como la diferencia entre un edificio bajo y ancho versus uno alto y estrecho. Descubrieron que la profundidad (más capas) mejora más el razonamiento que la anchura (más expertos). Es una decisión de diseño contra la corriente que les ha dado buenos resultados.
Tres formas de pensar
GLM-4.5 no tiene un solo modo de funcionamiento. Tiene tres, y cada uno sirve para un tipo de tarea diferente:
Modo Thinking (razonamiento profundo)
Para problemas complejos, el modelo se toma su tiempo y razona paso a paso antes de darte la respuesta. Es como cuando alguien dice "déjame pensarlo un momento" antes de contestar. Ideal para matemáticas, lógica y problemas difíciles.
Modo rápido (respuesta directa)
Para preguntas simples, responde al instante sin necesidad de razonar. No tiene sentido que "piense" 30 segundos para decirte qué hora es en Tokio.
Modo agente (acción autónoma)
Este es el más interesante. El modelo no solo responde, sino que actúa: navega por la web, ejecuta código, usa herramientas externas. Le dices "investiga este tema y hazme un informe" y él solo busca, lee, analiza y te entrega el resultado.
Cómo lo entrenaron: el secreto de los tres expertos
El entrenamiento de GLM-4.5 tiene una parte que es genuinamente innovadora y merece la pena entender:
Fase 1: Base general (15 billones de tokens)
Primero le dieron a comer una cantidad enorme de texto general: páginas web, libros, documentos en 24 idiomas. Es como ir a la universidad y estudiar cultura general.
Fase 2: Especialización (7 billones de tokens)
Después lo especializaron con código fuente y contenido matemático/científico. Como hacer un máster en ingeniería después de la carrera general.
Fase 3: Los tres expertos (lo innovador)
Aquí viene lo bueno. En vez de afinar un solo modelo, crearon tres copias del modelo y las entrenaron por separado:
Cada copia se convirtió en la mejor de su campo.
Fase 4: Destilación unificada
Y ahora el truco final: fusionaron los conocimientos de los tres expertos en un solo modelo. Es como si tres profesionales de élite compartieran todo lo que saben para crear un todoterreno que domina las tres disciplinas.
Esta técnica de "entrenar expertos separados y luego destilarlos en uno" es bastante novedosa y es una de las razones por las que GLM-4.5 funciona tan bien en tareas diversas.
¿Cómo se compara con Claude, GPT-4o y DeepSeek?
Ahora la parte que todos quieren saber: ¿es mejor que los modelos que ya conocemos?
Donde GLM-4.5 brilla
Donde le queda camino
El dato global
En promedio de 12 benchmarks, GLM-4.5 queda en 3ª posición entre todos los modelos (abiertos y cerrados). Eso es impresionante para un modelo open source con licencia MIT.
Open source de verdad: licencia MIT
Esto es importante. Hay muchos modelos que se dicen "open source" pero tienen restricciones. GLM-4.5 usa la licencia MIT, que es la más libre que existe:
Los pesos del modelo están disponibles en Hugging Face y GitHub. Cualquiera puede descargarlo, estudiarlo y construir encima. Transparencia total.
Precios: más barato que DeepSeek
Si no quieres descargarte el modelo y ejecutarlo tú mismo (necesitarías bastante hardware), puedes usar su API:
Sí, has leído bien: GLM-4.5-Flash es completamente gratis y sin límite diario. Es una estrategia agresiva para ganar usuarios, y funciona porque el modelo corre en solo 8 GPUs H20, aproximadamente la mitad de lo que necesita DeepSeek. Menos hardware = menos coste = precios más bajos.
También está disponible en plataformas como DeepInfra ($0.40/$1.60), Fireworks y OpenRouter.
Visión: GLM-4.5V
Además del modelo de texto, Zhipu también ha lanzado GLM-4.5V, una versión con capacidades visuales:
Usa una técnica llamada 3D-RoPE (codificación rotacional en 3D) para entender relaciones espaciales en imágenes. Es el modelo de visión open source más potente hasta la fecha.
Qué significa todo esto
1. La competencia es brutal (y eso es bueno para ti)
Cuando China compite con Estados Unidos en IA open source, tú ganas. Más modelos, más baratos, más accesibles. Los precios solo pueden bajar.
2. Open source está ganando la carrera
Hace un año, los modelos cerrados (GPT-4, Claude) estaban muy por delante de los abiertos. Hoy, GLM-4.5, DeepSeek y Llama compiten de tú a tú con los mejores. La diferencia se ha cerrado enormemente.
3. Zhipu no para
Ya han lanzado GLM-4.6, 4.7 y hasta GLM-5 después de este. En menos de un año, cinco versiones. La velocidad de iteración en IA es vertiginosa.
En resumen
GLM-4.5 no es "otro modelo más". Es un modelo con 355 mil millones de parámetros, una arquitectura innovadora de expertos profundos, entrenado con una técnica de tres expertos destilados, que supera a Claude en matemáticas y uso de herramientas, con licencia MIT, más barato que DeepSeek, y con una versión completamente gratis. Todo eso desde una startup nacida en una universidad china que ahora vale 34 mil millones de dólares.
La IA de élite ya no es exclusiva de Silicon Valley. Y eso nos beneficia a todos.