Tel. 55 9462 9908

Baidu toma la delantera en la carrera de las IA y supera a GPT-5 y Gemini 2.5 Pro

Baidu toma la delantera en la carrera de las IA y supera a GPT-5 y Gemini 2.5 Pro


Baidu presentó este pasado 11 de noviembre su modelo de IA multimodal de código abierto ERNIE-4.5-VL-28B-A3B-Thinking, el gigante tecnológico chino está orgulloso de afirmar que su modelo supera a GPT-5 de OpenAI y a Gemini 2.5 Pro de Google en múltiples pruebas comparativas. El lanzamiento representa un “golpe sobre la mesa” en la carrera por el dominio en el campo de la inteligencia artificial entre empresas tecnológicas chinas y occidentales.​

El modelo, publicado bajo la licencia Apache 2.0, emplea una arquitectura de Mezcla de Expertos (Mixture-of-Experts) con 28 mil millones de parámetros totales, pero activa solo 3 mil millones por inferencia, disminuyendo en gran medida los costos computacionales mientras mantiene un alto rendimiento. Según el anuncio de Baidu, el modelo supera a Gemini 2.5 Pro en las evaluaciones VQA, MMBench y SEED-Bench en comprensión de documentos y gráficos.

La eficiencia se encuentra en el rendimiento

El diseño ligero permite que ERNIE (así le diremos de cariño) ofrezca velocidades de inferencia de dos a tres veces más rápidas que modelos comparables de parámetros completos, al tiempo que requiere mucha menos memoria. Lo que más llamó mi atención de este modelo, es que integra una característica innovadora de "Pensamiento con Imágenes" que le permite hacer zoom en regiones de una imagen, razonar sobre vistas recortadas e integrar observaciones locales en respuestas completas.​

El modelo al emplear estrategias avanzadas de aprendizaje por refuerzo sobresale en tópicos como el razonamiento visual, resolución de problemas STEM, anclaje visual, utilización de herramientas y comprensión de video. ¡Es una locura!

Impulso estratégico de código abierto

El lanzamiento se produce mientras China intensifica su estrategia de IA de código abierto para competir con empresas estadounidenses. Según análisis recientes, China ha superado a Estados Unidos en descargas de IA de código abierto, con empresas como DeepSeek, Alibaba y Baidu, con esto queda claro que pueden producir modelos de alto rendimiento más rápido y más barato que sus contrapartes occidentales.

​Esta clase de lanzamientos ejerce presión sobre los proveedores de código cerrado como OpenAI y Anthropic, que dependen de APIs propietarias y precios premium.​

Baidu presentará la línea ERNIE y avances adicionales en IA en su conferencia Baidu World 2025 el 13 de noviembre en Beijing, mientras la compañía busca consolidar su lugar como líder en el competitivo panorama de IA de China.

¡Mantente alerta a sus próximas novedades siguiendo nuestra sección de noticias!


Referencias:
Baidu Launches New Generation Multimodal AI Model ERNIE-4.5-VL | aibase
A new addition to the ERNIE open-source model family is here! | Baidu en X
2025 Complete Guide: In-Depth Analysis of ERNIE-4.5-VL-28B-A3B-Thinking Multimodal AI Model | Promptbase
China now leads the U.S. in this key part of the AI race | The Washington Post

         Compartir

Autor Autor Desconocido

Acerca del autor

Autor Desconocido

Descripción no disponible.