Concepto/09 DE ABRIL DE 2026/12 min de lectura

GLM-4.5: La IA china de código abierto que planta cara a Claude y GPT-4o

Zhipu AI ha lanzado GLM-4.5, un modelo con 355 mil millones de parámetros, licencia MIT y precios más bajos que DeepSeek. Te contamos qué lo hace especial, cómo funciona y qué significa para el futuro de la IA.

/ La historia detrás: de la universidad a los 34 mil millones

Antes de hablar del modelo, hay que conocer quién lo ha creado. Zhipu AI (también conocida como Z.ai) es una startup china fundada en 2019 por profesores de la Universidad de Tsinghua, la más prestigiosa de China (algo así como el MIT o Stanford de allí).

Lo interesante es que no son recién llegados. Ya en 2022 lanzaron GLM-130B, uno de los primeros modelos grandes chinos de código abierto. Y en 2023 lanzaron ChatGLM, uno de los primeros chatbots chinos. Llevan años construyendo modelos antes de que fuera "lo cool".

¿Cómo de grandes son? 800 empleados, inversiones de Alibaba, Tencent y fondos de Arabia Saudí, y en enero de 2026 salieron a bolsa en Hong Kong con una valoración de 34 mil millones de dólares. Es la startup de IA más grande de China por plantilla.

/ Qué es GLM-4.5

GLM son las siglas de General Language Model (Modelo de Lenguaje General). La versión 4.5 lleva el subtítulo ARC: Agentic, Reasoning and Coding (Agente, Razonamiento y Código). Eso te dice mucho de para qué está diseñado.

Algunos datos técnicos clave:

355 mil millones de parámetros en total, pero solo activa 32 mil millones a la vez

Contexto de 128K tokens — puede leer el equivalente a un libro entero de una vez

Entrenado en 23 billones de tokens en más de 24 idiomas

Licencia MIT — la más permisiva que existe, totalmente libre para uso comercial

Se lanzó el 28 de julio de 2025

¿Qué significa eso de "355 mil millones pero solo activa 32 mil millones"? Ahí está uno de los trucos más interesantes del modelo.

/ Mixture of Experts: el truco de los especialistas

GLM-4.5 usa una arquitectura llamada Mixture of Experts (Mezcla de Expertos, o MoE). Vamos a explicarlo con una analogía:

Imagina un hospital con 128 médicos especialistas. Cuando llega un paciente, no lo ven los 128 a la vez — eso sería un caos. En su lugar, un sistema inteligente selecciona a los 8 especialistas más relevantes para ese caso concreto, más 1 médico generalista que siempre está presente.

Así funciona GLM-4.5. Tiene 128 "expertos" (bloques de red neuronal especializados), pero para cada pregunta solo activa 8 + 1 compartido. El resultado:

Es rápido porque solo usa una fracción del modelo

Es barato porque necesita menos potencia de cálculo

Es inteligente porque cada experto se ha especializado en algo diferente

"Más profundo, no más ancho"

Aquí viene algo que diferencia a GLM-4.5 de otros modelos MoE como DeepSeek. Mientras otros modelos añaden más expertos (haciéndolo "más ancho"), Zhipu decidió hacer el modelo más profundo: 46 capas con 96 cabezas de atención.

Es como la diferencia entre un edificio bajo y ancho versus uno alto y estrecho. Descubrieron que la profundidad (más capas) mejora más el razonamiento que la anchura (más expertos). Es una decisión de diseño contra la corriente que les ha dado buenos resultados.

/ Tres formas de pensar

GLM-4.5 no tiene un solo modo de funcionamiento. Tiene tres, y cada uno sirve para un tipo de tarea diferente:

Modo Thinking (razonamiento profundo)

Para problemas complejos, el modelo se toma su tiempo y razona paso a paso antes de darte la respuesta. Es como cuando alguien dice "déjame pensarlo un momento" antes de contestar. Ideal para matemáticas, lógica y problemas difíciles.

Modo rápido (respuesta directa)

Para preguntas simples, responde al instante sin necesidad de razonar. No tiene sentido que "piense" 30 segundos para decirte qué hora es en Tokio.

Modo agente (acción autónoma)

Este es el más interesante. El modelo no solo responde, sino que actúa: navega por la web, ejecuta código, usa herramientas externas. Le dices "investiga este tema y hazme un informe" y él solo busca, lee, analiza y te entrega el resultado.

/ Cómo lo entrenaron: el secreto de los tres expertos

El entrenamiento de GLM-4.5 tiene una parte que es genuinamente innovadora y merece la pena entender:

Fase 1: Base general (15 billones de tokens)

Primero le dieron a comer una cantidad enorme de texto general: páginas web, libros, documentos en 24 idiomas. Es como ir a la universidad y estudiar cultura general.

Fase 2: Especialización (7 billones de tokens)

Después lo especializaron con código fuente y contenido matemático/científico. Como hacer un máster en ingeniería después de la carrera general.

Fase 3: Los tres expertos (lo innovador)

Aquí viene lo bueno. En vez de afinar un solo modelo, crearon tres copias del modelo y las entrenaron por separado:

Experto en razonamiento — Entrenado con problemas de competiciones matemáticas y ejercicios de lógica cada vez más difíciles

Experto en agente — Entrenado para usar herramientas, navegar la web y ejecutar código

Experto en conversación — Entrenado para ser útil, seguro y bueno siguiendo instrucciones

Cada copia se convirtió en la mejor de su campo.

Fase 4: Destilación unificada

Y ahora el truco final: fusionaron los conocimientos de los tres expertos en un solo modelo. Es como si tres profesionales de élite compartieran todo lo que saben para crear un todoterreno que domina las tres disciplinas.

Esta técnica de "entrenar expertos separados y luego destilarlos en uno" es bastante novedosa y es una de las razones por las que GLM-4.5 funciona tan bien en tareas diversas.

/ ¿Cómo se compara con Claude, GPT-4o y DeepSeek?

Ahora la parte que todos quieren saber: ¿es mejor que los modelos que ya conocemos?

Donde GLM-4.5 brilla

Matemáticas (AIME 2024): 91% — supera ampliamente a Claude Opus 4 (75.7%). Y su versión pequeña, GLM-4.5-Air, saca un 89.4%. Brutal.

Uso de herramientas: 90.6% de precisión — supera a Claude Sonnet 4 (89.5%) y a Kimi K2 (86.2%)

Navegación web (BrowseComp): 26.4% vs Claude Opus 4 (18.8%). Mejor buscando y extrayendo información de la web.

Function calling: Puesto 1º en BFCL-v3. Nadie llama a funciones externas mejor que él.

Donde le queda camino

Código (SWE-bench Verified): 64.2% vs Claude Sonnet 4 (70.4%). Para resolver bugs en repositorios reales, Claude sigue por delante.

Conocimiento general (MMLU-Pro): Puesto 14º. No es su fuerte.

LiveCodeBench: Puesto 14º también. En código competitivo, otros modelos van más adelantados.

El dato global

En promedio de 12 benchmarks, GLM-4.5 queda en 3ª posición entre todos los modelos (abiertos y cerrados). Eso es impresionante para un modelo open source con licencia MIT.

/ Open source de verdad: licencia MIT

Esto es importante. Hay muchos modelos que se dicen "open source" pero tienen restricciones. GLM-4.5 usa la licencia MIT, que es la más libre que existe:

Puedes usarlo gratis

Puedes modificarlo

Puedes venderlo

Puedes integrarlo en tus productos

Sin restricciones de uso comercial

Los pesos del modelo están disponibles en Hugging Face y GitHub. Cualquiera puede descargarlo, estudiarlo y construir encima. Transparencia total.

/ Precios: más barato que DeepSeek

Si no quieres descargarte el modelo y ejecutarlo tú mismo (necesitarías bastante hardware), puedes usar su API:

ModeloEntrada (por millón de tokens)Salida (por millón de tokens) **GLM-4.5**$0.60$2.20 **GLM-4.5-Air**$0.20$1.10 **GLM-4.5-Flash****Gratis****Gratis** DeepSeek R1 (referencia)$0.14 (entrada)$2.19 (salida)

Sí, has leído bien: GLM-4.5-Flash es completamente gratis y sin límite diario. Es una estrategia agresiva para ganar usuarios, y funciona porque el modelo corre en solo 8 GPUs H20, aproximadamente la mitad de lo que necesita DeepSeek. Menos hardware = menos coste = precios más bajos.

También está disponible en plataformas como DeepInfra ($0.40/$1.60), Fireworks y OpenRouter.

/ Visión: GLM-4.5V

Además del modelo de texto, Zhipu también ha lanzado GLM-4.5V, una versión con capacidades visuales:

Entiende imágenes: le envías una foto y la analiza

Entiende vídeo: puede analizar vídeos largos

GUI: puede "leer" pantallas y ayudarte a interactuar con aplicaciones

Documentos: analiza gráficos, tablas y documentos complejos

Usa una técnica llamada 3D-RoPE (codificación rotacional en 3D) para entender relaciones espaciales en imágenes. Es el modelo de visión open source más potente hasta la fecha.

/ Qué significa todo esto

1. La competencia es brutal (y eso es bueno para ti)

Cuando China compite con Estados Unidos en IA open source, tú ganas. Más modelos, más baratos, más accesibles. Los precios solo pueden bajar.

2. Open source está ganando la carrera

Hace un año, los modelos cerrados (GPT-4, Claude) estaban muy por delante de los abiertos. Hoy, GLM-4.5, DeepSeek y Llama compiten de tú a tú con los mejores. La diferencia se ha cerrado enormemente.

3. Zhipu no para

Ya han lanzado GLM-4.6, 4.7 y hasta GLM-5 después de este. En menos de un año, cinco versiones. La velocidad de iteración en IA es vertiginosa.

/ En resumen

GLM-4.5 no es "otro modelo más". Es un modelo con 355 mil millones de parámetros, una arquitectura innovadora de expertos profundos, entrenado con una técnica de tres expertos destilados, que supera a Claude en matemáticas y uso de herramientas, con licencia MIT, más barato que DeepSeek, y con una versión completamente gratis. Todo eso desde una startup nacida en una universidad china que ahora vale 34 mil millones de dólares.

La IA de élite ya no es exclusiva de Silicon Valley. Y eso nos beneficia a todos.

GLM-4.5Zhipu AIOpen SourceIA ChinaModelos de lenguaje

Cada semana, en tu feed

Aprende IA
viendo vídeos

Comparativas, lanzamientos y tutoriales de 3 minutos. Sin spam, sin tecnicismos.

Suscríbete ↗

← Volver al blog