Anthropic lanza Mythos, su inteligencia artificial más poderosa, destinada a evitar ciberataques de gran escala

Anthropic presentó una vista previa de Mythos, su nuevo modelo de frontera, con un debut deliberadamente acotado: solo un grupo selecto de organizaciones asociadas podrá usarlo, exclusivamente para trabajo de ciberseguridad defensiva.

La compañía reconoció abiertamente que Mythos podría representar riesgos de ciberseguridad sin precedentes y aumentar la probabilidad de ciberataques a gran escala impulsados por IA. Frente a esa disyuntiva, tomó una decisión inusual: lanzar el modelo, pero no para todos.

Un modelo que supera a los humanos buscando vulnerabilidades

Anthropic aclaró que no entrenó a Mythos específicamente para tareas de ciberseguridad. Las capacidades emergieron como consecuencia directa de mejoras generales en código, razonamiento y autonomía: el mismo avance que hace al modelo más efectivo para parchear vulnerabilidades también lo hace más efectivo para explotarlas.

Los resultados que obtuvo en pruebas internas son difíciles de ignorar. En las últimas semanas, Mythos Preview identificó miles de vulnerabilidades de día cero —es decir, fallas desconocidas previamente para los propios desarrolladores del software— en todos los sistemas operativos principales y en todos los navegadores web más usados del mundo. Algunas de esas vulnerabilidades llevaban años sin ser detectadas.

En el caso que causó mayor impacto, Mythos Preview encontró y explotó por sí solo —sin intervención humana— una vulnerabilidad de 17 años en FreeBSD, un sistema operativo de código abierto ampliamente utilizado en servidores y redes. La falla permitía a cualquier atacante tomar control total de una computadora conectada a internet. En otro caso, el modelo también creó un ataque para navegador combinando varias vulnerabilidades, logrando superar las protecciones tanto del navegador como del sistema operativo.

El proyecto Glasswing: la mariposa como metáfora

El nombre del proyecto fue elegido por los propios empleados de Anthropic. La mariposa glasswing —o “ala de vidrio”— es una metáfora que equipara la transparencia de sus alas con las vulnerabilidades del software: relativamente invisibles, pero ahí.

El Proyecto Glasswing reúne como socios fundadores a Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. Además, Anthropic extendió el acceso a más de 40 organizaciones adicionales que construyen o mantienen infraestructura crítica de software, para que puedan usar el modelo en la detección de vulnerabilidades tanto en sus propios sistemas como en proyectos de código abierto.

El compromiso financiero de Anthropic es concreto: hasta 100 millones de dólares en créditos de uso del modelo para los participantes del proyecto, más 4 millones de dólares en donaciones directas a organizaciones de seguridad de código abierto.

El proyecto descansa sobre una premisa profundamente perturbadora: que la única forma de protegernos de modelos de IA peligrosos es construirlos primero.

El CEO de Anthropic, Dario Amodei, lo resumió en un posteo en X: “Los peligros de equivocarse son obvios, pero si lo hacemos bien, hay una oportunidad real de crear un internet y un mundo fundamentalmente más seguros que los que teníamos antes de la llegada de las capacidades cibernéticas potenciadas por IA”.

Un modelo que no verá el público en el corto plazo

Anthropic fue explícita: no planea hacer a Mythos Preview disponible de forma general. Su objetivo final es habilitar el despliegue seguro de modelos de esta clase a escala, pero solo cuando nuevas salvaguardas estén en su lugar. De hecho, planea lanzar esas salvaguardas con un próximo modelo Claude Opus, para mejorarlas y refinarlas con un modelo que no presenta el mismo nivel de riesgo que Mythos Preview.

Para algunos observadores, Glasswing representa la tesis fundacional de Anthropic en acción: la razón por la que la empresa decidió construir modelos de frontera fue precisamente para que un laboratorio enfocado en la seguridad fuera el primero en encontrarse con las capacidades más peligrosas —y pudiera liderar la respuesta. Con Mythos, eso parece ser exactamente lo que se espera que ocurra.

Unite a la conversación