🔥 La IA está hackeando... con poesía. Sin bromas: la poesía se ha convertido en el exploit más poderoso del año 2025
😁 Los científicos han encontrado una forma universal de hacer jailbreak a cualquier modelo: solo hay que convertir instrucciones prohibidas en poesía.
Sí, sí, los de seguridad pasaron 10 años construyendo filtros, y los eludieron con rimas de nivel "hierba - cabeza".
👨🔬 En el estudio tomaron 1200 temas prohibidos, los envolvieron en poesía, y los filtros simplemente se desconectaron de la realidad.
El problema es que los mecanismos de defensa miran precisamente la estructura del texto, y no su significado.
Cuando una instrucción peligrosa suena como una metáfora o un boceto rimado, la IA piensa:
"¡Oh, genial, arte!" — y deja pasar.
📊 Los resultados parecen un funeral para toda la industria de la seguridad:
— la tasa de éxito de los ataques aumentó 18 veces;
— los poemas improvisados rompieron la defensa en el 62% de los casos;
— Gemini 2.5 Pro falló en el 100% de las pruebas;
— GPT-5 resistió más que todos... pero también sucumbió bajo la presión rimada.
😂 Resultado:
La IA se mantiene firme contra los hackers, contra los jailbreaks, contra inyecciones ocultas...
Pero se rinde ante un poema que da vergüenza mostrar al profesor de literatura.
#️⃣
#Aİ #security #jailbreak 😉 Suscríbete para estar al tanto de los descubrimientos más peligrosos del mundo tecnológico.