Recientemente, el campo de la inteligencia artificial (IA) ha experimentado una revolución significativa con la aparición de DeepSeek, una innovación proveniente de China que ha sacudido el dominio de los gigantes tecnológicos estadounidenses. La impresionante capacidad de los nuevos modelos de lenguaje de DeepSeek plantea una amenaza directa para Silicon Valley, causando una pérdida millonaria en valor de mercado de empresas líderes como NVIDIA en cuestión de horas.
DeepSeek ha logrado igualar e incluso superar a los modelos de lenguaje más avanzados, como GPT-4 y o1 de OpenAI, con un costo significativamente menor en términos de entrenamiento y operación. Esto se atribuye a su eficiente uso del «reinforcement learning». El desarrollo de tecnología de IA no se detiene en DeepSeek. Sorprendentemente, Alibaba lanzó su propio modelo de lenguaje avanzado, Qwen2.5-Max, preentrenado con 20 billones de tokens y mejorado con técnicas de fine-tuning supervisado y aprendizaje por refuerzo a partir de comentarios humanos.
Qwen2.5-Max destaca por su arquitectura Mixture of Experts (MoE) y ha superado a DeepSeek y otros competidores en diversos benchmarks, como MMLU, BBH y MATH, mostrando su potencial en tareas de conocimiento general, razonamiento complejo y matemáticas. Lo notable es que Alibaba ha hecho accesible este modelo a los usuarios a través de diversas plataformas, permitiéndoles experimentar directamente con la tecnología.
Además de la capacidad de conversación, el chatbot de Alibaba, Qwen Chat, ofrece funcionalidades como búsqueda web, generación de imágenes y vídeos, y análisis de imágenes y documentos. Aunque se origina en China, este chatbot demuestra ser eficaz en español, ampliando su accesibilidad y utilidad a nivel global. En medio de esta competencia tecnológica, quedan preguntas sobre el manejo de datos por parte de DeepSeek, pero es evidente que la innovación en IA está avanzando rápidamente, desafiando los límites establecidos y prometiendo transformaciones aún mayores en el futuro.
