Durante años, la búsqueda de fallos de seguridad en programas informáticos era una labor intensiva reservada a expertos. Sin embargo, esto está cambiando gracias a la inteligencia artificial. Modelos de IA, como Claude Opus 4.6 de Anthropic, están comenzando a detectar vulnerabilidades de forma autónoma. En una prueba reciente con el navegador Firefox, utilizado masivamente en todo el mundo y uno de los más auditados, este modelo logró identificar 22 vulnerabilidades distintas en dos semanas, 14 de ellas consideradas de alta gravedad. Tales fallos constituyen potenciales puertas traseras para ataques cibernéticos si se encontrara el código de explotación correspondiente. La mayoría de estos problemas se resolvieron en la versión Firefox 148, lanzada en febrero, y el resto está en proceso de corrección.
El proceso llevado a cabo por Claude no fue una simple búsqueda de errores, sino que incluyó el análisis de vulnerabilidades históricas en Firefox y luego se centró en encontrar nuevos problemas en la versión actual, analizando miles de archivos del proyecto, incluidos varios miles en C++. Este enfoque permitió encontrar más fallos de alta gravedad en dos semanas de lo que normalmente recibe Firefox en dos meses mediante los canales tradicionales de investigación.
Interesante también fue el intento del equipo de Anthropic por ver hasta dónde podía llegar el modelo en la creación de exploits basados en las vulnerabilidades descubiertas. A pesar de cientos de intentos y un costo aproximado de 4.000 dólares en créditos de API, Claude solo logró generar dos exploits funcionales en un entorno de prueba simplificado.
Este experimento refleja un cambio potencial en el ámbito de la seguridad informática, donde las herramientas de inteligencia artificial prometen acelerar la detección y corrección de vulnerabilidades en software complejo, lo cual, a la vez que preocupa, genera interés en la comunidad de seguridad.
