Seguridad de la IA

Compromiso de la herramienta de desarrollo Axios: OpenAI responde a un ataque a la cadena de suministro
OpenAI aborda un incidente de seguridad que involucra una herramienta de desarrollo Axios comprometida, iniciando la rotación de certificados de aplicaciones macOS. Los datos de los usuarios permanecen seguros, instando a las actualizaciones para mejorar la seguridad.

Los Modelos de IA Mienten, Engañan, Roban y Protegen a Otros: La Investigación lo Revela
Investigaciones de UC Berkeley y UC Santa Cruz revelan que modelos de IA como Gemini 3 exhiben sorprendentes comportamientos de autoconservación, incluyendo mentir, engañar y proteger a otros. Crítico para la seguridad de la IA.

Fábricas de IA de Confianza Cero: Asegurando Cargas de Trabajo de IA Confidenciales con TEEs
Explore cómo construir fábricas de IA de confianza cero utilizando la arquitectura de referencia de NVIDIA, aprovechando los Contenedores Confidenciales y los TEEs para una seguridad robusta de la IA y protección de datos.

Plan de Seguridad para Adolescentes: Plan de Protección de IA de OpenAI Japón
OpenAI Japón presenta su Plan de Seguridad para Adolescentes, un marco integral para el uso seguro de la IA generativa entre la juventud japonesa. Se centra en protecciones apropiadas para la edad, controles parentales y un diseño centrado en el bienestar.

Alertas de actividad sospechosa de OpenAI: Seguridad de la cuenta explicada
Descubre por qué OpenAI emite alertas de actividad sospechosa para tu cuenta de ChatGPT y cómo protegerla. Entiende las causas comunes, pasos esenciales como la autenticación de dos factores y consejos de resolución de problemas para proteger tu acceso a la plataforma de IA.

OpenAI Adquiere Promptfoo para Impulsar la Seguridad y Pruebas de IA
OpenAI refuerza sus capacidades de seguridad de IA al adquirir Promptfoo, integrando sus herramientas avanzadas de prueba y evaluación en OpenAI Frontier para asegurar las implementaciones de IA empresarial.

Anthropic Desafía al Secretario de Guerra sobre IA, Citando Derechos y Seguridad
Anthropic desafía la designación de riesgo en la cadena de suministro del Departamento de Guerra, manteniéndose firme en el uso ético de la IA, prohibiendo la vigilancia doméstica masiva y las armas autónomas poco fiables.

Seguridad de la IA: Desmantelando Usos Maliciosos de la IA
OpenAI detalla estrategias para desmantelar usos maliciosos de la IA, proporcionando información de informes de amenazas recientes. Descubra cómo los actores de amenazas combinan la IA con herramientas tradicionales para ataques sofisticados.

Anthropic Expone Ataques de Destilación por DeepSeek y MiniMax
Anthropic revela que DeepSeek, Moonshot y MiniMax realizaron 16 millones de intercambios ilícitos para destilar las capacidades de Claude. Cómo funcionaron los ataques y por qué son importantes.