Code Velocity
Süni İntellekt Təhlükəsizliyi

Anthropic DeepSeek və MiniMax-ın Distillə Hücumlarını İfşa Edir

·4 dəq oxunma·Anthropic, DeepSeek, Moonshot AI, MiniMax·Orijinal mənbə
Paylaş
Qabaqcıl süni intellekt modelindən qanunsuz kopyalara saxta hesab şəbəkələri vasitəsilə distillə hücumunun axınını göstərən diaqram

Anthropic Sənaye Miqyaslı Distillə Kampaniyalarını Aşkarladı

Anthropic, üç Süni İntellekt laboratoriyasının — DeepSeek, Moonshot AI və MiniMax-ın — Claude-un imkanlarını qanunsuz distillə yolu ilə çıxarmaq üçün koordinasiyalı kampaniyalar apardığına dair sübutlar dərc edib. Kampaniyalar Anthropic-in xidmət şərtlərini və regional giriş məhdudiyyətlərini pozaraq, təxminən 24,000 saxta hesab vasitəsilə Claude ilə 16 milyondan çox mübadilə yaratmışdır.

Distillə, daha kiçik bir modelin daha güclü bir modelin çıxışları üzərində öyrədildiyi qanuni bir texnikadır. Qabaqcıl laboratoriyalar daha ucuz versiyalar yaratmaq üçün öz modellərini müntəzəm olaraq distillə edirlər. Lakin rəqiblər icazəsiz distillə istifadə etdikdə, müstəqil inkişaf üçün lazım olan xərclərin və vaxtın cüzi bir hissəsinə güclü imkanlar əldə edirlər.

Hücumlar Claude-un ən fərqləndirici xüsusiyyətlərini hədəf alırdı: agent tipli mühakimə yürütmə, alət istifadəsi və kodlaşdırma — Claude Opus 4.6Claude Sonnet 4.6 modellərini gücləndirən eyni imkanlar.

Hər Kampaniyanın Miqyası və Hədəfləri

LaboratoriyaMübadilələrƏsas Hədəflər
DeepSeek150,000+Mühakimə yürütmə, mükafat-model qiymətləndirməsi, senzura yan keçmələri
Moonshot AI3.4 milyon+Agent tipli mühakimə yürütmə, alət istifadəsi, kompüter görmə
MiniMax13 milyon+Agent tipli kodlaşdırma, alətlərin koordinasiyası

DeepSeek diqqətəlayiq bir texnikadan istifadə etdi: Claude-dan daxili düşüncəsini addım-addım ifadə etməsini istəyən sorğular, effektiv şəkildə geniş miqyasda düşüncə zənciri təlim məlumatları yaradırdı. Onlar həmçinin Claude-dan siyasi cəhətdən həssas sorğulara senzurasız alternativlər yaratmaq üçün istifadə etdilər — ehtimal ki, öz modellərini söhbətləri senzuralı mövzulardan uzaqlaşdırmağa öyrətmək üçün. Anthropic bu hesabları laboratoriyadakı konkret tədqiqatçılara qədər izlədi.

Moonshot AI (Kimi modelləri) birdən çox giriş yolu vasitəsilə yüzlərlə saxta hesabdan istifadə etdi. Sonrakı mərhələdə Moonshot daha hədəfli bir yanaşmaya keçərək Claude-un düşüncə izlərini çıxarmağa və yenidən qurmağa cəhd etdi.

MiniMax 13 milyondan çox mübadilə ilə ən böyük kampaniyanı həyata keçirdi. Anthropic bu kampaniyanı hələ aktiv ikən — MiniMax təlim keçdiyi modeli buraxmadan əvvəl aşkarladı. Anthropic aktiv kampaniya zamanı yeni bir model buraxdığında, MiniMax 24 saat ərzində dönüş edərək, trafikinin demək olar ki, yarısını ən son imkanları ələ keçirmək üçün yönəltdi.

Distillə Edənlər Giriş Məhdudiyyətlərini Necə Yan Keçir

Anthropic milli təhlükəsizlik səbəbiylə Çində kommersiya Claude girişini təklif etmir. Laboratoriyalar qabaqcıl modelə girişi geniş miqyasda yenidən satan kommersiya proksi xidmətləri vasitəsilə bunu yan keçdilər.

Bu xidmətlər Anthropic-in "hidra klaster" arxitekturaları adlandırdığı sistemləri işə salır: API və üçüncü tərəf bulud platformaları arasında trafiki paylayan geniş saxta hesab şəbəkələri. Bir hesab qadağan edildikdə, onu yenisi əvəz edir. Bir proksi şəbəkə eyni vaxtda 20,000-dən çox saxta hesabı idarə edir, aşkarlanmanı çətinləşdirmək üçün distillə trafikini əlaqəsiz müştəri sorğuları ilə qarışdırırdı.

Distilləni normal istifadədən fərqləndirən nümunədir. Tək bir sorğu zərərsiz görünə bilər, lakin eyni dar imkanı hədəf alan yüzlərlə koordinasiyalı hesabdan on minlərlə dəfə variantlar gəldikdə, nümunə aydın olur.

Milli Təhlükəsizlik İmkanları

Qanunsuz yolla distillə edilmiş modellərdə ABŞ şirkətlərinin qabaqcıl sistemlərə daxil etdiyi təhlükəsizlik qoruyucuları yoxdur. Bu qoruyucular Süni İntellektin bioloji silahların hazırlanması, hücumçu kiber əməliyyatlar həyata keçirilməsi və ya kütləvi nəzarətin mümkün edilməsinin qarşısını alır.

Qanunsuz distillə yolu ilə qurulan modellərin bu qoruyucu mexanizmləri saxlaması ehtimalı azdır. Xarici laboratoriyalar mühafizə olunmamış imkanları hərbi, kəşfiyyat və nəzarət sistemlərinə daxil edə bilər. Əgər distillə edilmiş modellər açıq mənbəli olarsa, təhlükəli imkanlar hər hansı bir hökumətin nəzarətindən kənara sərbəst şəkildə yayılır.

Distillə hücumları həmçinin ABŞ-ın ixrac nəzarətlərini zəiflədir. Bu hücumlar haqqında məlumat olmadan, bu laboratoriyaların görünən sürətli irəliləyişləri ixrac nəzarətlərinin təsirsiz olduğuna dair səhv dəlil kimi şərh edilə bilər. Həqiqətdə isə, irəliləyişlər Amerika modellərindən çıxarılan imkanlardan asılıdır və geniş miqyasda çıxarmaq üçün ixrac nəzarətlərinin məhdudlaşdırmağa yönəldiyi qabaqcıl çiplər tələb olunur.

Anthropic-in Əks Tədbirləri

Anthropic distillə hücumlarına qarşı bir neçə müdafiə tədbiri tətbiq edir:

  • Aşkarlama təsnifatçıları: API trafikində distillə nümunələrini, o cümlədən düşüncə zənciri təlim məlumatlarını qurmaq üçün istifadə edilən düşüncə zənciri stimullaşdırılmasını müəyyən edən davranışsal barmaq izi sistemləri
  • Kəşfiyyat mübadiləsi: Distillə mənzərəsinin vahid bir mənzərəsini əldə etmək üçün digər Süni İntellekt laboratoriyaları, bulud təminatçıları və müvafiq orqanlarla paylaşdığı texniki göstəricilər
  • Giriş nəzarətləri: Təhsil hesabları, təhlükəsizlik tədqiqat proqramları və startap təşkilatları üçün gücləndirilmiş doğrulama — ən çox istifadə edilən yollar
  • Model səviyyəli qoruyucu mexanizmlər: Qanuni istifadəni pisləşdirmədən qanunsuz distillə üçün çıxış effektivliyini azaltmaq üçün nəzərdə tutulmuş məhsul, API və model səviyyəli əks tədbirlər

Anthropic bu nəticələri əvvəlki dəstəyinə, yəni qabaqcıl Süni İntellekt imkanlarının qorunmasını təmin etmək üçün geniş strategiyanın bir hissəsi olan müdafiəçilər üçün Claude Code Security imkanlarına bağlamışdır.

Sənaye Miqyasında Cavab Lazımdır

Anthropic vurğulayır ki, heç bir tək şirkət distillə hücumlarını təkbaşına həll edə bilməz. Kampaniyalar kommersiya proksi xidmətlərindən, üçüncü tərəf bulud platformalarından və bütün Süni İntellekt ekosistemini əhatə edən hesab doğrulamasındakı boşluqlardan istifadə edir.

Bu kampaniyaların artan intensivliyi və mürəkkəbliyi hərəkət etmək üçün pəncərəni daraldır. Anthropic distillə edənlərin sürətlə adaptasiya olduğunu müşahidə edib: yeni modellər buraxıldıqda, çıxarma səyləri bir neçə saat ərzində dəyişir. Hesablar qadağan edildikdə, proksi şəbəkələr onları heç bir tək uğursuzluq nöqtəsi olmayan hidra klaster arxitekturaları vasitəsilə dərhal əvəz edir.

Təhdidə cavab vermək Süni İntellekt şirkətləri, bulud təminatçıları və siyasətçilər arasında koordinasiyalı hərəkət tələb edir. Anthropic qabaqcıl Süni İntellekt imkanlarının icazəsiz çıxarılmasından qorunmasında maraqlı olan hər kəsə sübutları təqdim etmək üçün öz nəticələrini dərc edib. Şirkət hesab doğrulamasında sənaye miqyasında standartlar, paylaşılan təhdid kəşfiyyatı çərçivələri və geniş miqyasda qanunsuz distilləyə qarşı mübarizə üçün siyasət dəstəyi tələb edir.

Tez-tez Verilən Suallar

Süni İntellekt distillə hücumları nədir?
Süni İntellekt distillə hücumları icazəsiz olaraq daha güclü bir modelin çıxışları üzərində daha az qabiliyyətli bir modelin öyrədilməsini əhatə edir. Rəqiblər qabaqcıl bir modeldən xüsusi imkanları çıxarmaq üçün kütləvi həcmdə diqqətlə hazırlanmış sorğular yaradır, sonra isə cavablardan öz sistemlərini öyrətmək üçün istifadə edirlər. Anthropic, DeepSeek, Moonshot və MiniMax tərəfindən Claude-un imkanlarını çıxarmaq üçün istifadə edilən təxminən 24,000 saxta hesab vasitəsilə 16 milyondan çox qanunsuz mübadilə müəyyən etdi.
Hansı şirkətlər Claude-un imkanlarını distillə etdi?
Anthropic sənaye miqyaslı distillə kampaniyaları aparan üç Çin Süni İntellekt laboratoriyasını müəyyən etdi: DeepSeek (mühakimə yürütmə və senzura işini hədəf alan 150,000-dən çox mübadilə), Moonshot AI (agent tipli mühakimə yürütmə və alət istifadəsini hədəf alan 3.4 milyondan çox mübadilə) və MiniMax (agent tipli kodlaşdırma və alətlərin koordinasiyasını hədəf alan 13 milyondan çox mübadilə).
Niyə distillə hücumları milli təhlükəsizlik riski daşıyır?
Qanunsuz yolla distillə edilmiş modellərdə Anthropic kimi ABŞ şirkətlərinin öz sistemlərinə daxil etdiyi təhlükəsizlik qoruyucuları yoxdur. Bu mühafizə olunmamış modellər hücumçu kiber əməliyyatlar, dezinformasiya kampaniyaları, kütləvi nəzarət və hətta bioloji silahların hazırlanmasına dəstək üçün istifadə edilə bilər. Əgər distillə edilmiş modellər açıq mənbəli olarsa, təhlükəli imkanlar hər hansı bir hökumətin nəzarətindən kənara yayılır və Amerikanın Süni İntellekt üstünlüyünü qorumaq üçün nəzərdə tutulmuş ixrac nəzarətlərini zəiflədir.
DeepSeek, Moonshot və MiniMax Claude-a necə daxil oldu?
Laboratoriyalar Claude API girişini geniş miqyasda yenidən satan kommersiya proksi xidmətlərindən istifadə edərək Anthropic-in regional giriş məhdudiyyətlərini yan keçdilər. Bu xidmətlər Anthropic-in API və üçüncü tərəf bulud platformalarında yayılmış saxta hesablardan ibarət geniş şəbəkələrlə hidra klaster arxitekturalarını idarə edir. Bir proksi şəbəkə eyni vaxtda 20,000-dən çox saxta hesabı idarə edir, aşkarlanmamaq üçün distillə trafikini qanuni sorğularla qarışdırırdı.
Anthropic distillə hücumlarına necə cavab verir?
Anthropic bir neçə əks tədbir tətbiq edir: API trafikində distillə nümunələrini aşkarlamaq üçün davranışsal barmaq izi təsnifatçıları, digər Süni İntellekt laboratoriyaları və bulud təminatçıları ilə kəşfiyyat mübadiləsi, gücləndirilmiş hesab doğrulaması və qanuni istifadəçilər üçün xidməti pisləşdirmədən qanunsuz distillə üçün çıxış effektivliyini azaldan model səviyyəli qoruyucu mexanizmlər. Anthropic həmçinin koordinasiyalı sənaye və siyasət cavabları üçün çağırış edir.
DeepSeek Claude-dan konkret olaraq nə çıxardı?
DeepSeek Claude-un mühakimə yürütmə bacarıqlarını, rubrikaya əsaslanan qiymətləndirmə tapşırıqlarını (Claude-u gücləndirici öyrənmə üçün mükafat modeli kimi fəaliyyət göstərməsini təmin edir) və siyasi cəhətdən həssas sorğulara senzurasız alternativləri hədəf aldı. Onlar Claude-dan daxili düşüncəsini addım-addım ifadə etməsini istəyən üsullardan istifadə edərək, geniş miqyasda düşüncə zənciri təlim məlumatları yaratdılar. Anthropic bu hesabları DeepSeek-dəki konkret tədqiqatçılara qədər izlədi.

Xəbərdar olun

Ən son AI xəbərlərini e-poçtunuza alın.

Paylaş