AI saugumas

OpenAI įsigyja Promptfoo, kad sustiprintų AI saugumą ir testavimą
OpenAI stiprina savo AI saugumo galimybes įsigydama Promptfoo, integruodama pažangius testavimo ir vertinimo įrankius į „OpenAI Frontier“ platformą, siekiant užtikrinti įmonių AI diegimo saugumą.

OpenAI privatumo portalas: supaprastintas vartotojo duomenų valdymas
Naujasis OpenAI privatumo portalas suteikia vartotojams patikimą duomenų valdymą, leidžiantį tvarkyti asmeninius duomenis, paskyros nustatymus, modelių mokymo nuostatas ir pašalinti informaciją iš ChatGPT atsakymų.

OpenAI Karo departamento susitarimas: dirbtinio intelekto saugumo gairių užtikrinimas
OpenAI išsamiai aprašo savo istorinį susitarimą su Karo departamentu, kuriuo nustatomos tvirtos dirbtinio intelekto saugumo gairės, apsaugančios nuo vidaus stebėjimo ir autonominių ginklų, nustatant naują standartą gynybos technologijoms.

AI saugumas: kenkėjiško AI panaudojimo sutrikdymas
OpenAI išsamiai aprašo strategijas, skirtas kenkėjiškam AI naudojimui sutrikdyti, pateikdama įžvalgas iš naujausių grėsmių ataskaitų. Sužinokite, kaip grėsmę keliantys veikėjai derina AI su tradicinėmis priemonėmis sudėtingiems išpuoliams.

Anthropic atskleidžia DeepSeek ir MiniMax distiliavimo atakas
Anthropic atskleidžia, kad DeepSeek, Moonshot ir MiniMax vykdė 16 mln. neteisėtų mainų, siekdami distiliuoti Claude galimybes. Kaip veikė atakos ir kodėl jos svarbios.