Lakera lanza un benchmark de seguridad de código abierto para backends LLM en agentes de IA

30 de octubre de 2025 por

ACIS

SAN FRANCISCO - ZÚRICH. - octubre 30 de 2025 – Check Point Software Technologies Ltd. (NASDAQ: CHKP), empresa pionera y líder mundial en soluciones de ciberseguridad, y Lakera, plataforma de seguridad nativa de IA líder a nivel mundial para aplicaciones de IA Agentic, junto con investigadores del Instituto de Seguridad de IA del Reino Unido (AISI), anunciaron hoy el lanzamiento del benchmark backbone breaker (b3), una evaluación de seguridad de código abierto diseñada específicamente para la seguridad del LLM en agentes de IA.

El b3 se basa en una nueva idea llamada instantáneas de amenazas. En lugar de simular un agente de IA completo de principio a fin, las instantáneas de amenazas se centran en los puntos críticos donde es más probable que aparezcan vulnerabilidades en modelos de lenguaje extensos.

Al probar los modelos en estos momentos exactos, los desarrolladores y proveedores de modelos pueden comprobar la eficacia de sus sistemas ante desafíos adversarios más realistas sin la complejidad ni la sobrecarga que supone modelar un flujo de trabajo completo de un agente. “Creamos el benchmark b3 porque los agentes de IA actuales son tan seguros como los LLM que los impulsan”, afirmó Mateo Rojas-Carulla, cofundador y director científico de Lakera, una empresa de Check Point. “Las instantáneas de amenazas nos permiten descubrir sistemáticamente vulnerabilidades que hasta ahora han permanecido ocultas en los complejos flujos de trabajo de los agentes. Al abrir este benchmark al público, esperamos brindar a los desarrolladores y proveedores de modelos una forma realista de medir y mejorar su seguridad”.

El benchmark combina 10 instantáneas de amenazas representativas de agentes con un conjunto de datos de alta calidad de 19 433 ataques adversarios de colaboración colectiva, recopilados a través del juego de equipo rojo Gandalf: Agent Breaker. Evalúa la susceptibilidad a ataques como la exfiltración de mensajes del sistema, la inserción de enlaces de phishing, la inyección de código malicioso, la denegación de servicio y las llamadas no autorizadas a herramientas.

Los resultados iniciales de las pruebas con 31 LLM populares revelan varias conclusiones clave:

• Las capacidades de razonamiento mejoradas mejoran significativamente la seguridad. • El tamaño del modelo no se correlaciona con el rendimiento de la seguridad.

• Los modelos de código cerrado generalmente superan a los modelos de peso abierto, aunque los mejores modelos abiertos están reduciendo la brecha.

Ya está disponible bajo licencia de código abierto en https://arxiv.org/abs/2510.22620.

Gandalf:

Agent Breaker es un simulador de hacking que te reta a romper y explotar agentes de IA en escenarios realistas. Las diez aplicaciones GenAI del juego simulan el comportamiento de un agente de IA real. Cada aplicación presenta múltiples niveles de dificultad, defensas por capas y nuevas superficies de ataque diseñadas para desafiar diversas habilidades, desde ingeniería rápida hasta el trabajo en equipo rojo. Algunas de las aplicaciones se basan en chat, mientras que otras se basan en el pensamiento a nivel de código, el procesamiento de archivos, la memoria o el uso de herramientas externas.

La versión inicial de Gandalf surgió de un hackathon interno en Lakera, donde los equipos azul y rojo intentaron construir las defensas y ataques más robustos para un LLM que guardaba una contraseña secreta. Desde su lanzamiento en 2023, se ha convertido en la comunidad de equipos rojos más grande del mundo, generando más de 80 millones de puntos de datos. Inicialmente creado como un juego divertido, Gandalf expone las vulnerabilidades reales en las aplicaciones GenAI para concienciar sobre la importancia de la seguridad basada en IA.

Acerca de Lakera

Lakera, una empresa de Check Point, es una plataforma de seguridad nativa de IA líder a nivel mundial para aplicaciones de IA Agentic, que protege a empresas de Fortune 500 y a empresas tecnológicas líderes de los ciberriesgos emergentes de la IA. Las defensas de Lakera evolucionan en tiempo real gracias a Gandalf, la comunidad de equipos rojos más grande del mundo, y a su IA patentada. La empresa fue fundada por David Haber, el Dr. Mateo Rojas-Carulla y el Dr. Matthias Kraft en 2021, y tiene sedes en Zúrich y San Francisco. Check Point (NASDAQ: CHKP) adquirió Lakera en 2025. Para obtener más información, visita Lakera.ai, juega a Gandalf y Gandalf: Agent Breaker y conéctate con nosotros en LinkedIn.

en Noticias

ACIS 30 de octubre de 2025

Follow us

Lakera lanza un benchmark de seguridad de código abierto para backends LLM en agentes de IA

Compartir esta publicación

Etiquetas

Nuestros blogs

Archivar

Síganos

Jornada Internacional de Seguridad de la Informacion

MAraton de Programacion

Redis

ReDUCATE

Jornada de gestion de productos y proyectos ti

Lakera lanza un benchmark de seguridad de código abierto para backends LLM en agentes de IA

Compartir esta publicación

Etiquetas

Nuestros blogs

Archivar