RAMPART y Clarity: nuevas herramientas open source de Microsoft para probar la seguridad de agentes de IA

Foto del autor

CyberSecureFox Editorial Team

Microsoft ha presentado dos herramientas abiertas — RAMPART y Clarity — diseñadas para probar la seguridad de agentes de IA directamente en el proceso de desarrollo. RAMPART permite a los ingenieros escribir y ejecutar tests sobre la resiliencia de los agentes frente a ataques como las inyecciones entre prompts y las fugas de datos, mientras que Clarity ayuda a los equipos a identificar riesgos de diseño incluso antes de escribir código. Ambas herramientas están disponibles en GitHub y se orientan a desarrolladores que crean sistemas de IA autónomos.

Qué es RAMPART

RAMPART (Risk Assessment and Measurement Platform for Agentic Red Teaming) es un framework de pruebas de seguridad basado en Pytest. Permite a los desarrolladores crear escenarios de prueba que simulan ataques contra agentes de IA y evaluar los resultados. Entre las categorías de prueba declaradas se incluyen:

  • Inyecciones entre prompts (cross-prompt injections): situaciones en las que datos no confiables llegan al sistema de IA de forma indirecta, a través de fuentes que procesa, como correo electrónico, archivos o páginas web;
  • Regresiones de comportamiento no intencionadas: casos en los que el agente empieza a comportarse de manera distinta a la prevista;
  • Fuga de datos (data exfiltration): salida no autorizada de información desde el sistema.

Para conectar el agente que se va a probar con el framework se necesita un adaptador. RAMPART evalúa los resultados de las pruebas y genera un informe, cubriendo tanto escenarios competitivos (adversarial) como operativos normales.

Es fundamental su posicionamiento respecto a su predecesor — PyRIT (Python Risk Identification Tool), que Microsoft lanzó hace más de dos años. Según la compañía, PyRIT está optimizado para investigar mediante caja negra sistemas ya construidos, mientras que RAMPART está diseñado para ingenieros que trabajan en el sistema durante su creación. En la práctica, RAMPART se construye sobre PyRIT, convirtiendo los resultados del red teaming de investigación en pruebas de ingeniería reproducibles.

El papel de Clarity en el ciclo de vida de desarrollo

Clarity resuelve otra tarea: es una herramienta para el análisis estructurado de las decisiones de diseño en las primeras fases. Microsoft lo describe como «un socio de pensamiento basado en IA que discrepa» — guía al equipo a través de la clarificación del problema, la exploración de opciones de solución, el análisis de posibles fallos y la documentación de las decisiones tomadas.

La idea es dejar constancia de por qué se tomó una decisión concreta — por ejemplo, qué acceso a herramientas recibe el agente — antes de que el sistema se construya. Como se señala en el anuncio, el objetivo es dar a los product managers y a los ingenieros la posibilidad de comprobar sus supuestos al inicio del proyecto, cuando cambiar de rumbo resulta barato.

Contexto estratégico: de las comprobaciones puntuales a un proceso continuo

La idea clave detrás de ambas herramientas es pasar de auditorías de seguridad de IA puntuales a un conjunto de «artefactos vivos» que acompañen al sistema durante todo su ciclo de vida. Microsoft declara su intención de hacer que los incidentes sean reproducibles y que las medidas para resolverlos sean verificables, escalando el conocimiento obtenido en el red teaming a activos de ingeniería ejecutables.

Esto refleja una tendencia más amplia: a medida que los agentes de IA obtienen acceso a herramientas y datos reales, los enfoques tradicionales de seguridad — la verificación en la fase final — dejan de ser suficientes. Las amenazas específicas de los agentes, como las inyecciones entre prompts, no quedan cubiertas por los medios estándar de pruebas de seguridad de aplicaciones.

Recomendaciones prácticas

  • Para equipos que desarrollan agentes de IA: evalúen la aplicabilidad de RAMPART para integrarlo en el pipeline de CI/CD existente. El framework basado en Pytest reduce la barrera de entrada para los equipos que ya utilizan el ecosistema de Python.
  • En la fase de diseño: usen Clarity para documentar los supuestos de seguridad antes de comenzar la implementación, especialmente los relativos al acceso de los agentes a herramientas externas y fuentes de datos.
  • Para usuarios actuales de PyRIT: RAMPART complementa, y no sustituye, a PyRIT. Consideren la combinación: PyRIT para el descubrimiento de vulnerabilidades en investigación y RAMPART para las pruebas de regresión de los problemas detectados.

Debe tenerse en cuenta que las capacidades declaradas de ambas herramientas se basan únicamente en la descripción de Microsoft: en el momento de la publicación no existe una evaluación independiente de su eficacia. A los equipos que planean su adopción se les recomienda empezar con un piloto sobre agentes no críticos, evaluar la calidad de la detección en sus propios escenarios y solo después escalar su uso a sistemas en producción.


CyberSecureFox Editorial Team

El equipo editorial de CyberSecureFox cubre noticias de ciberseguridad, vulnerabilidades, campañas de malware, actividad de ransomware, AI security, cloud security y security advisories de proveedores. Los materiales se preparan a partir de official advisories, datos de CVE/NVD, alertas de CISA, publicaciones de proveedores e informes públicos de investigadores. Los artículos se revisan antes de su publicación y se actualizan cuando aparece nueva información.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.