Bezpečnost AI

OpenAI získává Promptfoo pro posílení bezpečnosti a testování AI
OpenAI posiluje své schopnosti v oblasti bezpečnosti AI akvizicí Promptfoo, integruje jeho pokročilé nástroje pro testování a hodnocení do platformy OpenAI Frontier, aby zabezpečila nasazení podnikové AI.

Dohoda OpenAI s Ministerstvem války: Zajištění ochranných bariér bezpečnosti AI
OpenAI podrobně popisuje svou přelomovou dohodu s Ministerstvem války, která zavádí robustní ochranné bariéry pro bezpečnost AI proti domácímu sledování a autonomním zbraním, čímž stanovuje nový standard pro obranné technologie.

Anthropic vzdoruje ministru války ohledně AI, odvolává se na práva a bezpečnost
Anthropic vzdoruje označení Ministerstva války za riziko dodavatelského řetězce, trvá na etickém použití AI, zakazuje masové domácí sledování a nespolehlivé autonomní zbraně.

Bezpečnost AI: Narušování škodlivého využití AI
OpenAI podrobně popisuje strategie pro narušování škodlivého využívání AI a poskytuje poznatky z nedávných zpráv o hrozbách. Zjistěte, jak aktéři hrozeb kombinují AI s tradičními nástroji pro sofistikované útoky.

Anthropic odhaluje destilační útoky ze strany DeepSeek a MiniMax
Anthropic odhaluje, že DeepSeek, Moonshot a MiniMax provedly 16 milionů nezákonných výměn s cílem destilovat schopnosti Claude. Jak útoky fungovaly a proč jsou důležité.