HomeAndroidQwen3-Max-Thinking se posiciona como rival directo de Gemini 3 Pro de Google:...

Qwen3-Max-Thinking se posiciona como rival directo de Gemini 3 Pro de Google: la clave está en lo que no se está analizando

Desde que ChatGPT revolucionó el campo de la inteligencia artificial en 2022, la competencia por crear modelos cada vez más avanzados no ha parado, con lanzamientos frecuentes que intentan llevar más lejos la capacidad de razonamiento, comprensión y uso de herramientas complejas. En ese contexto, Qwen3-Max-Thinking, un modelo desarrollado por Alibaba, ha llamado la atención por competir de tú a tú con Gemini 3 Pro, el modelo de IA de Google.

Hecho por: Daniel Ruiz

La propuesta de Alibaba no es simplemente añadir potencia, sino enfocarse en una forma de “pensar mejor”. Esto incluye no solo el acceso a grandes cantidades de datos y entrenamiento, sino también mejoras en cómo sigue instrucciones, razona en varios pasos y se adapta a tareas complejas para alinearse con lo que esperan los usuarios y las necesidades de aplicaciones avanzadas.

Para evaluar cómo se comparan estos dos modelos, se analizaron resultados en 19 pruebas (benchmarks) que miden cosas como conocimiento general, razonamiento matemático y análisis de contexto largo. En esas pruebas, Gemini 3 Pro lidera en 11 categorías, mientras que Qwen3-Max-Thinking lo supera en 8, especialmente en tareas que requieren seguir instrucciones humanamente ambiguas o interpretar intenciones complejas. Estos resultados no determinan claramente quién es “mejor”, pero sí muestran que el nuevo modelo de Alibaba puede competir fuertemente en ciertas áreas.

Un ejemplo claro es el benchmark de instrucciones “Arena-Hard v2”, donde Qwen obtuvo 90,2 puntos frente a los 81,7 de Gemini, lo que sugiere que, cuando las indicaciones son menos precisas, el modelo de Alibaba tiende a responder de forma más útil o natural.

Además de las comparaciones de puntuación, el artículo destaca una tendencia importante en la IA moderna: no se trata solo de responder texto, sino de integrar herramientas útiles dentro de la conversación. Qwen3-Max-Thinking incorpora la capacidad de usar búsquedas web, memoria y ejecución de código durante una sesión, lo que le permite obtener datos recientes o realizar cálculos complejos sin depender solo de lo que aprendió durante su entrenamiento.

Otra parte importante de la discusión gira en torno al costo de utilizar estos modelos. En precios típicos por 1 millón de tokens, Qwen3-Max-Thinking suele ser más económico que Gemini 3 Pro, tanto en la entrada como en la salida de tokens —una parte clave del costo cuando se usan modelos de razonamiento intensivo, lo que puede hacer que sea más atractivo para empresas y desarrolladores con presupuestos ajustados.

Finalmente, hay también diferencias en cómo se gestionan los datos de los usuarios. En el caso de Qwen, algunas versiones ponen condiciones sobre el uso y almacenamiento de datos para entrenar futuros modelos o mejorar servicios, sin opciones claras para desactivar ese uso en todos los casos. En cambio, con los servicios de Google en pago, los datos de prompts y respuestas se tratan como confidenciales y no se usan para entrenar nuevos sistemas. Además, surgen preocupaciones de privacidad por las leyes de datos y jurisdicciones internacionales que afectan la adopción en ciertos mercados.

RELATED ARTICLES

Most Popular

Recent Comments