Siguria e AI

Agjentët e AI: Rezistenca ndaj Injektimit të Prompt-it me Inxhinieri Sociale
Mësoni se si OpenAI projekton agjentë të AI për t'i rezistuar sulmeve të avancuara të injektimit të prompt-it duke shfrytëzuar strategji mbrojtëse të inxhinierisë sociale, duke siguruar siguri të fortë të AI dhe privatësi të të dhënave.

OpenAI Blen Promptfoo për të Përmirësuar Sigurinë dhe Testimin e AI
OpenAI forcon aftësitë e saj të sigurisë së AI duke blerë Promptfoo, duke integruar mjetet e saj të avancuara të testimit dhe vlerësimit në OpenAI Frontier për të siguruar vendosjen e AI në shkallë ndërmarrjeje.

Marrëveshja e OpenAI me Departamentin e Luftës: Sigurimi i Masave Mbrojtëse të Sigurisë së AI
OpenAI detajon marrëveshjen e saj historike me Departamentin e Luftës, duke vendosur masa mbrojtëse të fuqishme për sigurinë e AI kundër mbikëqyrjes së brendshme dhe armëve autonome, duke vendosur një standard të ri për teknologjinë e mbrojtjes.

Anthropic ekspozon sulmet e distilimit nga DeepSeek dhe MiniMax
Anthropic zbulon se DeepSeek, Moonshot dhe MiniMax kryen 16 milionë shkëmbime të paligjshme për të distiluar aftësitë e Claude. Si funksionuan sulmet dhe pse janë të rëndësishme.