¡Hackeada! Anthropic presumía a "Claude Fable 5" como la IA más segura del planeta; y un hacker la destruyó en dos días

El modelo de inteligencia artificial Claude Fable 5, desarrollado por Anthropic y presentado como uno de los sistemas de IA más seguros y avanzados del mundo, fue vulnerado en menos de 48 horas después de su lanzamiento oficial el 9 de junio de 2026. El responsable fue un investigador conocido en el mundo de la ciberseguridad bajo el alias de “Pliny the Liberator”, quien logró evadir todas las capas de protección del modelo mediante una sofisticada técnica de ataque.

La metodología utilizada consistió en desplegar múltiples agentes de IA trabajando en conjunto, dividiendo las solicitudes peligrosas en fragmentos pequeños e inocuos que no activaban los clasificadores de seguridad del sistema. De esta forma, el investigador logró extraer el prompt de sistema interno del modelo, un documento de aproximadamente 120,000 caracteres que contiene las instrucciones confidenciales que definen el comportamiento de Fable 5.

MIRA TAMBIEN

¿Por qué Google frenó en seco su nueva IA de Google Earth, 24 horas después de lanzarla?

¡OpenAI rompe otro récord! ChatGPT ya supera los 1,000 millones de usuarios activos en el mundo

¡Google acelera la carrera por los robots inteligentes! Presenta Gemini Robotics ER 2 con razonamiento avanzado

El hallazgo resultó especialmente llamativo considerando que Anthropic había invertido más de 1,000 horas en pruebas de seguridad previas al lanzamiento, incluyendo programas de recompensas para cazadores de vulnerabilidades. A pesar de ello, ninguno de estos esfuerzos logró anticipar el tipo de ataque coordinado que finalmente comprometió al modelo en tiempo récord.

El incidente reabre el debate sobre la solidez de los sistemas de seguridad en modelos de inteligencia artificial de última generación, evidenciando que incluso las arquitecturas más blindadas pueden tener grietas de diseño estructural. Expertos en ciberseguridad señalan que el caso de Fable 5 demuestra que dividir una solicitud maliciosa en partes aparentemente inofensivas sigue siendo una vulnerabilidad que la industria aún no ha resuelto.

¡Hackeada! Anthropic presumía a “Claude Fable 5” como la IA más segura del planeta; y un hacker la destruyó en dos días

¿Por qué Google frenó en seco su nueva IA de Google Earth, 24 horas después de lanzarla?

¡OpenAI rompe otro récord! ChatGPT ya supera los 1,000 millones de usuarios activos en el mundo

¡Google acelera la carrera por los robots inteligentes! Presenta Gemini Robotics ER 2 con razonamiento avanzado

Relacionado Posts

¿Por qué Google frenó en seco su nueva IA de Google Earth, 24 horas después de lanzarla?

¡OpenAI rompe otro récord! ChatGPT ya supera los 1,000 millones de usuarios activos en el mundo

¡Google acelera la carrera por los robots inteligentes! Presenta Gemini Robotics ER 2 con razonamiento avanzado

¡Trágico desenlace! Encuentran muerto a docente que había desaparecido desde la tarde de ayer en Jutiapa, Atlántida

Una persona fallecida tras estrellarse en una vivienda en la colonia Villa Nueva

Hallan sin vida a un hombre en una acera del barrio Medina; presuntamente falleció por intoxicación alcohólica

¡Lamentable! Motociclista pierde la vida tras sufrir un aparatoso accidente vial en Yoro

¡Siguen y suman! De varios impactos de bala le arrebatan la vida a dos hombres en Catacamas, Olancho

¡Fatal decisión! Encuentran sin vida dentro de su habitación a miembro de las Fuerzas Armadas en Yamaranguila, Intibucá

El impactante aumento de sueldo que habría recibido Gianni Infantino si se aprobaba el proyecto fallido de la FIFA

La avioneta que se accidentó en Perú, con 13 muertos, reportó problemas mecánicos en vuelo a Nazca

Capturan a presunto distribuidor de droga durante retén policial en Omoa, Cortés

¡Trágico desenlace! Encuentran muerto a docente que había desaparecido desde la tarde de ayer en Jutiapa, Atlántida

Dos fallecidos y más de 2,000 personas aisladas por el nuevo temporal en Chile

Israel incrementa sus ataques y mata al menos a 18 gazatíes, pese al anuncio de Trump