Ya tenemos definición para lo que es una «IA Open Source». Y como era de esperar, a Meta no le gusta demasiado

La distinción entre la inteligencia artificial (IA) de código abierto y la que no lo es ha permanecido ambigua hasta la reciente intervención de la Open Source Initiative (OSI). Tras un trabajo exhaustivo, la OSI ha introducido la versión 1.0 de la Open Source AI Definition (OSAID). Esta definición parte de la colaboración entre sectores de la industria, la academia y reguladores, marcando un hito en el establecimiento de estándares claros para la IA de código abierto.

La esencia de la OSAID se centra en la capacidad de recrear un modelo de IA a partir de la información proporcionada por su creador. Esto implica detalles completos sobre el conjunto de datos de entrenamiento, su procedencia, el tratamiento de los datos, y cómo se pueden adquirir o licenciar. Además, como es característico del software de código abierto, un modelo de IA debe ser libremente utilizado, modificado y compartido sin restricciones.

No obstante, esta definición ha encontrado oposición en empresas como Meta, que argumentan contra la aplicabilidad de una definición única de IA de código abierto, señalando las complejidades únicas de los modelos de IA y su evolución rápida. Meta defiende el modelo de su IA, Llama, como «libre y disponible abiertamente», a pesar de las críticas sobre la falta de transparencia, especialmente en lo que respecta al origen de los datos de entrenamiento.

Esta definición 1.0 de OSAID también ha suscitado debates al permitir que los datos sensibles y protegidos sean excluidos del conjunto de entrenamiento para preservar la privacidad y los derechos de autor. Aunque el intento de OSI por establecer una base sólida es claro, la organización reconoce que esta versión inicial evolucionará con el tiempo para mejor reflejar la complejidad y las particularidades de la IA de código abierto, indicando que aún queda mucho por debatir y ajustar, especialmente en temas sensibles como los derechos de autor y la transparencia en el uso de los datos.