La startup francesa Mistral AI se distingue en el ámbito de la inteligencia artificial con su lanzamiento de Mistral Small 4, abogando por la eficiencia en lugar de simplemente acumular la mayor cantidad de funciones o liderar benchmarks. Este modelo busca unificar diversas capacidades avanzadas en una única herramienta, ofreciendo un enfoque integrado que antes requería múltiples sistemas especializados.
Small 4, presentado como una evolución significativa dentro de la serie Mistral Small, combina funciones previamente repartidas entre sus líneas Magistral, Pixtral, Devstral y Small, con el objetivo de manejar tareas variadas como conversación, análisis de información compleja, trabajo con imágenes y asistencia en la programación. Se basa en una arquitectura de Mixture of Experts, contando con 128 expertos, de los cuales solo cuatro actúan en cada token generado. Destaca por su gran cantidad de 119B parámetros totales, 6B activos por token, y una ventana de contexto de hasta 256k.
En cuanto a su mercado objetivo, Mistral AI ve a Small 4 siendo útil para desarrolladores, empresas e investigadores, dada su capacidad para adaptarse a diversas necesidades sin cambiar de sistema. La compañía subraya la eficiencia de Small 4 mediante gráficos que lo comparan con otros modelos en benchmarks, mostrando cómo logra resultados competitivos con menos texto, lo que implica menos latencia y coste de inferencia.
Finalmente, Small 4 se hace accesible a través de la API y AI Studio de Mistral, y al ser publicado bajo la licencia Apache 2.0, permite su descarga y adaptación para implementaciones propias. Mistral AI ofrece la posibilidad de probar el modelo gratuitamente a través de build.nvidia.com, y ofrece soporte para su uso en producción con NVIDIA NIM.
