Al principio, los errores de ChatGPT, como confundir finales de series o errar en cálculos básicos, no se tomaban en serio debido a su reciente introducción. Sin embargo, a medida que la tecnología de IA generativa encontró aplicaciones más críticas, como en estudios académicos y programación, donde aproximadamente el 52% de las respuestas de ChatGPT pueden contener errores, la preocupación creció significativamente. La urgencia de Big Tech por liderar este ámbito resultó en incidentes notorios con chatbots como el de Microsoft y Bard de Google, evidenciando graves fallos que hicieron que la percepción de fiabilidad hacia estas herramientas comenzara a tambalearse.
La reputación de compañías como Google, que durante un cuarto de siglo fue sinónimo de búsquedas confiables, está ahora bajo escrutinio debido a fallas de sus asistentes de IA, lo que resalta la creciente desconfianza en chatbots como Gemini, ChatGPT y Copilot. Ante esta situación, se reconoce que es crucial mejorar la precisión de los modelos de IA generativa para recuperar y aumentar la confianza de los usuarios.
Entre las respuestas de diversas compañías a estos desafíos, Apple optó por una estrategia de menor riesgo con el lanzamiento de Image Playground, enfocado en generar emojis e imágenes lejos del fotorrealismo, una decisión que, aunque limita las posibilidades creativas, esquiva problemas mayores como los enfrentados por modelos de IA generativos de imágenes que producen resultados aberrantes. Por otro lado, Microsoft ha decidido postergar el lanzamiento de funciones como Recall ante preocupaciones de privacidad y ciberseguridad, priorizando una introducción más cautelosa.
En resumen, las empresas de tecnología empiezan a reconocer la importancia de avanzar con cuidado en el desarrollo de IA generativa, buscando un balance entre innovación y fiabilidad para evitar errores costosos y salvaguardar su credibilidad. Este cambio de enfoque sugiere el inicio de una nueva etapa en la evolución de los chatbots y la inteligencia artificial donde la calidad podrá tener tanto o más valor que la velocidad de lanzamiento al mercado.
