Code Velocity
Süni İntellekt Tədqiqatı

Süni İntellekt Səlisliyi İndeksi: İnsan-Süni İntellekt Əməkdaşlığı Bacarıqlarını Ölçmək

·7 dəq oxunma·Anthropic·Orijinal mənbə
Paylaş
Süni İntellekt səlisliyi və insan-Süni İntellekt əməkdaşlığı konsepsiyasını məlumat nöqtələri ilə təsvir edən qrafik.

Səlislik Öndə: Anthropic-in Bacarıqlı Əməkdaşlıq üçün Süni İntellekt İndeksi

Süni İntellekt alətlərinin gündəlik işlərə sürətlə inteqrasiyası heyrətamiz səviyyədə olmuşdur. Lakin Süni İntellekt hər yerdə mövcud olduqca, kritik bir sual yaranır: istifadəçilər sadəcə bu alətləri mənimsəyirlər, yoxsa onlardan effektiv şəkildə istifadə etmək üçün lazımi bacarıqları inkişaf etdirirlər? Məsuliyyətli Süni İntellekt inkişafında lider olan Anthropic, insan-Süni İntellekt əməkdaşlığı bacarıqlarının inkişafını ölçmək və izləmək üçün hazırlanmış yeni bir hesabat olan qabaqcıl Süni İntellekt Səlisliyi İndeksi ilə buna cavab verməyi hədəfləyir.

Əvvəlki Anthropic Təhsil Hesabatları, universitet tələbələrinin və pedaqoqların Claude kimi qabaqcıl modellərdən hesabat hazırlanmasından dərs planlamasına qədər müxtəlif tapşırıqlar üçün necə istifadə etdiyinə dair məlumat verdi. Lakin bu tədqiqatlar əsasən istifadəçilərin nə etdiklərinə fokuslanırdı. Süni İntellekt Səlisliyi İndeksi daha dərindən araşdırır, fərdlərin Süni İntellektlə nə dərəcədə yaxşı əlaqə qurduqlarını öyrənir və bu çevirici texnologiya ilə "səlisliyi" anlamaq üçün bir çərçivə təqdim edir.

Süni İntellekt Səlisliyini Anlamaq: 4D Çərçivəsi

Süni İntellekt səlisliyini kəmiyyətcə ölçmək üçün Anthropic, Professorlar Rick Dakan və Joseph Feller ilə əməkdaşlıq edərək 4D Süni İntellekt Səlisliyi Çərçivəsini inkişaf etdirdi. Bu hərtərəfli çərçivə, təhlükəsiz və effektiv insan-Süni İntellekt əməkdaşlığını nümunə götürən 24 xüsusi davranışı müəyyən edir. Bu ilkin tədqiqatın məqsədləri üçün Anthropic, Claude.ai söhbət interfeysində birbaşa müşahidə edilə bilən 11 davranışa diqqət yetirdi. Süni İntellektin işdəki rolu haqqında dürüst olmaq və ya Süni İntellekt tərəfindən yaradılan nəticələrin nəticələrini nəzərə almaq kimi kritik aspektləri əhatə edən qalan 13 davranış söhbətdən kənarda baş verir və gələcək keyfiyyət tədqiqatlarında qiymətləndiriləcəkdir.

Məxfiliyi qoruyan bir təhlil alətindən istifadə edərək, tədqiqat qrupu 2026-cı ilin yanvarında 7 günlük müddət ərzində Claude.ai saytında 9,830 çoxnövbəli söhbəti diqqətlə araşdırdı. Bu geniş məlumat toplusu, 11 müşahidə edilə bilən səlislik davranışının mövcudluğunu və ya yoxluğunu ölçmək üçün möhkəm bir baza təmin etdi və Süni İntellekt Səlisliyi İndeksinin yaradılmasına gətirib çıxardı. İndeks, cari əməkdaşlıq nümunələrinin ani görünüşünü və Süni İntellekt modelləri inkişaf etdikcə onların təkamülünü izləmək üçün bir əsas təklif edir.

Süni İntellekt Qarşılıqlı Əlaqəsində Təkrarlama və Təkmilləşdirmənin Gücü

Süni İntellekt Səlisliyi İndeksinin ən cəlbedici nəticələrindən biri təkrarlama və təkmilləşdirmə ilə demək olar ki, digər bütün Süni İntellekt səlisliyi davranışları arasında güclü korrelyasiyadır. Tədqiqat göstərdi ki, söhbətlərin 85.7%-i istifadəçilərin ilkin cavabı sadəcə qəbul etmək əvəzinə, işlərini təkmilləşdirmək üçün əvvəlki mübadilələrə əsaslanaraq baş tutmuşdur. Bu təkrarlanan söhbətlər, digər səlislik davranışlarının əhəmiyyətli dərəcədə yüksək nisbətlərini göstərdi və sürətli, qarşılıqlı söhbətlərdə görünən bacarığı effektiv şəkildə ikiqat artırdı.

Təkrarlamanın Süni İntellekt Səlisliyi Davranışlarına Təsiri

Behavioral IndicatorConversations with Iteration & Refinement (n=8,424)Conversations without Iteration & Refinement (n=1,406)Increase Factor (Iterative vs. Non-Iterative)
Questioning Claude's ReasoningYüksəkAşağı5.6x
Identifying Missing ContextYüksəkAşağı4x
Clarifying GoalYüksəkOrta~2x
Specifying FormatYüksəkOrta~2x
Providing ExamplesYüksəkOrta~2x
Average Additional Fluency Behaviors2.671.332x

Cədvəl: Təkrarlama və təkmilləşdirmə ilə olan söhbətlərdə səlislik davranışlarının artan yayılmasını təsvir edir.

Bu 'təkrarlama və təkmilləşdirmə effekti' Süni İntellektə sadə bir tapşırıq icraçısı kimi deyil, bir düşüncə ortağı kimi yanaşmağın vacibliyini vurğulayır. Dialoqa aktiv şəkildə qoşulan, etiraz edən və sorğularını təkmilləşdirən istifadəçilər Süni İntellekt nəticələrini tənqidi şəkildə qiymətləndirməyə, onun mühakiməsini şübhə altına almağa və kritik çatışmayan konteksti müəyyən etməyə əhəmiyyətli dərəcədə daha çox meyllidirlər. Bu, insan nəzarətinin və təkrarlanan rəylərin daha yaxşı nəticələr verdiyi agent iş axınları konsepsiyası ilə üst-üstə düşür ki, bu da GitHub Agent İş Axınları kimi platformalar ətrafındakı müzakirələrdə araşdırılır.

Süni İntellekt Artefaktının Yaradılmasının İkiüzlü Qılıncı

Təkrarlama ümumi səlisliyi artırsa da, hesabat istifadəçilərin Süni İntellektə kod, sənədlər və ya interaktiv alətlər kimi artefaktlar yaratmasını təklif etdikdə incə bir nümunə ortaya qoydu. Nümunənin 12.3%-ni təşkil edən bu söhbətlər, istifadəçilərin daha direktiv olduqlarını, lakin təəccüblü şəkildə daha az qiymətləndirici olduqlarını göstərdi.

Artefaktlar yaradarkən, istifadəçilər öz məqsədlərini aydınlaşdırmağa (+14.7 faiz bəndi), formatları müəyyən etməyə (+14.5pp) və nümunələr təqdim etməyə (+13.4pp) daha çox meylli idilər. Lakin, bu artan direktivlik daha böyük fərq qoyma qabiliyyətinə çevrilmədi. Əslində, istifadəçilər çatışmayan konteksti müəyyən etməyə (-5.2pp), faktları yoxlamağa (-3.7pp) və ya modelin mühakiməsini şübhə altına almağa (-3.1pp) daha az meylli idilər. Bu tendensiya xüsusilə narahat edicidir, çünki artefakt yaradılması ilə tez-tez əlaqəli olan mürəkkəb tapşırıqlar, Claude Opus 4.6 kimi Süni İntellekt modellərinin və ya hətta GPT-5 kimi qabaqcıl modellərin (əgər reallıqda mövcud olsaydı da, keçid gələcək və ya hipotetik bir versiyaya işarə edir) çətinliklərlə qarşılaşma ehtimalı ən yüksək olduğu yerlərdir.

Bu fenomen Süni İntellektin tez-tez yaratdığı cilalanmış, funksional görünüşlü nəticələrlə əlaqələndirilə bilər ki, bu da istifadəçiləri yanlış bir tamamlama hissinə sala bilər. İstər bir UI dizayn etmək, istərsə də hüquqi bir təhlil hazırlamaq olsun, Süni İntellektin çıxışını tənqidi şəkildə yoxlamaq qabiliyyəti əsas olaraq qalır. Süni İntellekt modelləri daha mürəkkəbləşdikcə, zahirən mükəmməl nəticələrin tənqidsiz qəbul edilməsi riski artır və bu, qiymətləndirmə bacarıqlarını hər zamankından daha dəyərli edir.

Öz Süni İntellekt Səlisliyinizi İnkişaf Etdirmək

Yaxşı xəbər budur ki, Süni İntellekt səlisliyi, hər hansı bir bacarıq kimi, inkişaf etdirilə bilər. Tapıntılarına əsaslanaraq, Anthropic, insan-Süni İntellekt əməkdaşlığını gücləndirmək istəyən istifadəçilər üçün praktik məsləhətlər təqdim edir:

  1. Söhbətdə Qalmaq: Süni İntellektin ilkin cavablarını başlanğıc nöqtəsi kimi qəbul edin. Əlavə suallar verin, fərziyyələrə etiraz edin və sorğularınızı təkrarlayaraq təkmilləşdirin. Bu aktiv cəlbətmə, digər səlislik davranışlarının ən güclü göstəricisidir.
  2. Cilalanmış Nəticələri Şübhə Altına Almaq: Bir Süni İntellekt modeli tam və dəqiq görünən bir şey istehsal etdikdə, dayanın və tənqidi düşüncəni tətbiq edin. Soruşun: Bu həqiqətən dəqiqdirmi? Bir şey çatışmırmı? Mühakimə etibarlıdır? Vizual cilalanmanın tənqidi qiymətləndirməni üstələməsinə icazə verməyin.
  3. Əməkdaşlığın Şərtlərini Müəyyən Etmək: Süni İntellektin sizinlə necə qarşılıqlı əlaqə quracağını proaktiv şəkildə müəyyənləşdirin. 'Fərziyyələrim yanlışdırsa etiraz et', 'Mühakimənizi mənə izah edin' və ya 'Nədən əmin olmadığınızı mənə deyin' kimi açıq təlimatlar dinamikanı əsaslı şəkildə dəyişdirə bilər, daha şəffaf və möhkəm əməkdaşlığı təşviq edə bilər.

Gələcək Süni İntellekt Bacarıqlarının İnkişafı üçün Bir Baza

Bu ilkin tədqiqatın məhdudiyyətlərini qəbul etmək vacibdir. 2026-cı ilin əvvəllərindən çoxnövbəli Claude.ai istifadəçilərindən ibarət nümunə, böyük ehtimalla Süni İntellektlə artıq rahat olan erkən istifadəçilərə doğru meylli ola bilər, geniş əhalini deyil. Tədqiqat həmçinin yalnız söhbət interfeysində müşahidə edilə bilən davranışlara fokuslanır, xaricdə baş verən kritik etik və məsuliyyətli istifadə davranışlarını kənarda qoyur. Bu qeydlər o deməkdir ki, Süni İntellekt Səlisliyi İndeksi bu xüsusi əhali üçün bir baza və daha dərin, uzunmüddətli tədqiqatlar üçün bir başlanğıc nöqtəsi təmin edir.

Bu məhdudiyyətlərə baxmayaraq, Süni İntellekt Səlisliyi İndeksi effektiv insan-Süni İntellekt əməkdaşlığını anlamağa və inkişaf etdirməyə doğru əhəmiyyətli bir addımdır. Süni İntellekt alətləri inkişaf etməyə davam etdikcə, istifadəçiləri tənqidi, təkrarlanan və məsuliyyətli şəkildə iştirak etmək bacarıqları ilə təmin etmək, bu texnologiyanın tam potensialını reallaşdırmaqla yanaşı, risklərini azaltmaq üçün mərkəzi rol oynayacaq. Bu ilkin hesabat, həm istifadəçiləri, həm də tərtibatçıları daha səlis və faydalı Süni İntellektlə idarə olunan gələcəyi qurmaqda istiqamətləndirmək vəd edən gələcək araşdırmalar üçün zəmin yaradır.

Tez-tez Verilən Suallar

What is the Anthropic AI Fluency Index?
The Anthropic AI Fluency Index is a new metric developed by Anthropic to assess how well individuals are developing skills to effectively use AI tools. Moving beyond mere adoption, the index tracks 11 directly observable behaviors that represent safe and effective human-AI collaboration, based on the 4D AI Fluency Framework. It aims to provide a baseline measurement of user proficiency, helping to understand how these critical skills evolve as AI technology becomes more integrated into daily life. The initial study analyzed nearly 10,000 conversations on Claude.ai to identify key patterns in user interaction and skill development.
How is AI fluency measured by Anthropic?
AI fluency is measured by tracking the presence or absence of 11 specific behavioral indicators during user interactions with Claude on Claude.ai. These indicators are derived from the broader 4D AI Fluency Framework, which defines 24 behaviors of safe and effective human-AI collaboration. For the initial study, Anthropic utilized a privacy-preserving analysis tool to examine 9,830 multi-turn conversations over a 7-day period. Behaviors like 'iteration and refinement,' 'questioning reasoning,' and 'identifying missing context' were observed and classified as present or absent within each conversation, providing a quantitative baseline for AI proficiency.
What is the 'iteration and refinement effect' in AI fluency?
The 'iteration and refinement effect' refers to the strong correlation found between users who build on previous exchanges to refine their work with AI, and the display of other key AI fluency behaviors. Conversations exhibiting iteration and refinement—meaning users don't just accept the first AI response but actively engage in follow-up questions, pushbacks, and adjustments—showed significantly higher rates of other fluency indicators. For instance, these iterative conversations were 5.6 times more likely to involve users questioning Claude's reasoning and 4 times more likely to identify missing context, underscoring the importance of sustained, dynamic engagement for developing AI proficiency.
Why do users become less evaluative when creating artifacts with AI?
Anthropic's research found that when users engage AI to create artifacts such as code, documents, or interactive tools, they tend to become more directive but paradoxically less evaluative. This means users are more likely to clarify goals and provide examples, but less likely to question the model's reasoning, identify missing context, or check facts. Possible explanations include the polished appearance of AI-generated outputs, which might lead users to prematurely trust the results, or the nature of certain tasks where functional aesthetics might outweigh factual precision. Regardless, this pattern highlights a critical area for improvement in human-AI collaboration, emphasizing the need for continued critical assessment even with seemingly complete outputs.
How can individuals improve their AI fluency according to Anthropic?
Anthropic suggests three key areas for individuals to enhance their AI fluency. First, 'staying in the conversation' means treating initial AI responses as starting points, asking follow-up questions, and actively refining outputs. Second, 'questioning polished outputs' involves critically evaluating AI-generated artifacts for accuracy, completeness, and logical soundness, even if they appear perfect. Third, 'setting the terms of the collaboration' encourages users to explicitly instruct AI on how to interact, for example, by asking it to explain its reasoning or push back on assumptions. These practices aim to foster deeper engagement and critical thinking in human-AI interactions.
What are the limitations of the AI Fluency Index study?
The initial AI Fluency Index study has several important limitations. The sample is restricted to Claude.ai users engaging in multi-turn conversations during a single week in January 2026, which likely skews towards early adopters and may not represent the broader population. The study also only assesses 11 out of 24 behaviors from the 4D AI Fluency Framework, focusing solely on directly observable interactions within the chat interface, thus missing crucial ethical and responsible use behaviors that occur externally. Furthermore, the binary classification of behaviors might overlook nuanced demonstrations, and it cannot account for 'implicit behaviors' where users might mentally evaluate AI outputs without verbalizing their critical assessment in the chat.

Xəbərdar olun

Ən son AI xəbərlərini e-poçtunuza alın.

Paylaş