OpenAI afirma que los navegadores IA siempre serán vulnerables a ataques de inyección de prompts

OpenAI ha reconocido que su navegador con IA, ChatGPT Atlas, y en general los navegadores impulsados por agentes de IA, probablemente nunca estarán completamente libres de vulnerabilidades a ataques de inyección de prompts. Estos ataques consisten en instrucciones ocultas dentro de páginas web, correos o contenidos que el navegador con IA interpreta como comandos, pudiendo manipular su comportamiento.

La empresa admitió que, aunque trabaja para reforzar la seguridad de Atlas, el riesgo persiste debido a la naturaleza misma de cómo los agentes de IA procesan instrucciones y datos. OpenAI explicó que funciones como “agent mode”, que automatizan acciones en nombre del usuario, amplían la superficie de ataque y hacen que la mitigación completa sea muy difícil.

Como parte de su enfoque defensivo, OpenAI ha desarrollado un “atacante automatizado basado en LLM” (un agente que actúa como hacker en simulaciones) para descubrir técnicas de inyección antes de que sean explotadas legítimamente. También está implementando ciclos de respuesta rápidos con parches y pruebas internas continuas para fortalecer sus defensas.

Expertos externos señalan que la combinación de moderada autonomía del agente y acceso profundo a datos sensibles hace que estos navegadores sean un objetivo atractivo para ataques. OpenAI recomienda a los usuarios limitar permisos, requerir confirmaciones antes de acciones críticas y dar instrucciones específicas y controladas a los agentes para reducir riesgos prácticos, aunque la amenaza estructural sigue ahí.

Vía – Techcrunch