El agujero de seguridad que preocupa el sector tecnológico mundial

25 de Mayo de 2026

La ciberseguridad ha sido siempre una disciplina llena de instrucciones analógicas: No dejes la puerta abierta a los ciberdelincuentes, no pegues la contraseña en un post-it en el escritorio, no hagas clic en un enlace de un correo que promete herencias de un príncipe nigeriano… Y ahora, en 2026, hemos añadido una nueva norma básica: no le cuentes a nadie tu “system prompt”.

Las últimas semanas han sido especialmente delirantes dentro del mundo de la IA generativa. Investigadores, hackers, red teamers y simples usuarios con demasiado tiempo libre están consiguiendo extraer instrucciones internas de modelos comerciales, manipular agentes autónomos y saltarse limitaciones de un sistema que puede tener mal las bases, y que ahora mismo nos están vendiendo como el futuro de todos y todas.

Hace años que el sector tecnológico vive atrapado en el mantra del move fast and break things, que se le atribuye a Mark Zuckerberg y sus primeros años de Facebook. Y bien, han roto cosas, como por ejemplo la confianza de los usuarios en las grandes empresas tecnológicas. El problema es que ahora las cosas que se rompen no son solo aplicaciones para compartir selfies con muchos filtros. Ahora se rompen sistemas que procesan datos sensibles, automatizan decisiones empresariales o tienen acceso directo a correos, archivos y herramientas internas. Según una investigación publicada este mismo mes, se han detectado más de un millón de servicios de IA expuestos con configuraciones inseguras o vulnerables. Un millón, donde dentro de cada millón de servicios hay miles de usuarios. Hagan las cuentas.

"Hace años que el sector tecnológico vive atrapado en el mantra del 'move fast and break things'"

En cualquier otro sector esto provocaría comparecencias parlamentarias, dimisiones y algún documental del Sense Ficció con drones sobrevolando centros de datos bajo la lluvia y la voz de Carles Porta. Pero en la IA todavía hay quien la ve como “los inevitables problemas de la innovación”.

Un golpe duro y directo a la realidad del sistema: muchos sistemas de IA son frágiles porque se han construido demasiado rápido y con prisas por salir al mercado antes que la competencia.

El prompt leakage es un concepto que describe la filtración de las instrucciones internas que controlan una inteligencia artificial, y ahora mismo es un término de moda. El sector sabe que estas herramientas ignoran qué significa información confidencial. Para ellos todo es información. Solo predicen la siguiente palabra estadísticamente plausible. Y esto convierte la seguridad en un problema que va más allá de las matemáticas y la ciberseguridad.

Una IA no sabe nada. Una IA no sabe que no debería revelar su prompt interno. Quizás tiene unas instrucciones de no revelarlo, pero si lo tiene escrito en algún sitio, hay maneras de hacerlo salir, ya que una IA siempre intenta ser útil. Y aquí quizás está la brecha del sistema, porque hemos construido sistemas extraordinariamente convincentes para ser nuestros amigos y complacernos, antes de saber cómo controlarlos.

No sé si lleváis equipos de personas, pero imaginad tener una persona en el equipo brillante, que trabaja como una mula, que no dice nunca que no, que resuelve de manera magistral, pero que si le tiras de la lengua te explica todos los planes corporativos de aquí a cinco años a todo el mundo que pasa por delante. ¡No, hombre no! ¡Así no!

Los investigadores están observando técnicas mucho más sofisticadas para la nueva generación de ataques cibernéticos: inyecciones indirectas escondidas en documentos, webs o correos, manipulación de agentes autónomos, prompts largos con estructuras narrativas, o jailbreaks emocionales que explotan patrones psicológicos aprendidos por los modelos. Es fascinante y terrorífico al mismo tiempo.

Especialmente porque el ecosistema está evolucionando más deprisa que las prácticas de seguridad. Mientras algunas empresas todavía están descubriendo qué es exactamente un modelo de lenguaje, otras ya conectan agentes de IA a sistemas internos, CRM, repositorios de código y herramientas financieras. Todo automatizado. Todo “inteligente”. Todo perfectamente capaz de convertir un error lingüístico en una incidencia corporativa de primer nivel. Después de décadas repitiendo que “el usuario es el eslabón más débil de la cadena”, ahora resulta que el sistema también lo es.

"Menos demos espectaculares con música épica en LinkedIn y más auditoría interna"

Precisamente porque estos problemas existen, ahora tenemos una oportunidad extraordinaria para hacer las cosas mejor. El hecho de que se detecten vulnerabilidades, que existan jailbreakers profesionales o que aparezcan estudios académicos cuestionando la robustez de los modelos es, en realidad, un síntoma de madurez tecnológica. ¡Ahora pensamos en ello! La ciberseguridad clásica también nació así, de acuerdo con desastres y mucha humildad. La diferencia es que ahora estamos intentando poner normas a sistemas probabilísticos que funcionan como una especie de subconsciente estadístico.

Menos demos espectaculares con música épica en LinkedIn y más auditoría interna, amigos. Menos obsesionarse con quién tiene el modelo más listo y simpático y más preguntarse quién tiene el modelo más gobernable y transparente. Porque la IA útil será la que podrá convivir con humanos y sus derechos digitales.

Al final, el problema del prompt leakage es que nosotros aún confundimos fluidez con fiabilidad, y la fluidez debe ir acompañada de robustez, criterio y confianza. Y esta es, probablemente, la gran carrera tecnológica de nuestra década.

Añadir VIA Empresa como fuente preferida de Google de forma gratuita

Mantente informado con las últimas noticias de actualidad

Activar ahora