Logo
    main-post-cover

    Anthropic AI səbəbindən işə qəbul testlərini daim dəyişir

        Technote.az “TechCrunch” platformasına istinadən bildirir ki, Anthropic süni intellekt alətlərinin sürətlə inkişaf etməsi səbəbindən texniki işə qəbul testlərini davamlı olaraq yeniləmək məcburiyyətində qalıb. Şirkətin performans optimallaşdırma komandası 2024-cü ildən etibarən namizədlərə evdən yerinə yetirilən (take-home) texniki tapşırıq təqdim edirdi. Məqsəd real bilik və bacarıqları ölçmək olsa da, AI kodlama alətləri gücləndikcə bu testlər getdikcə etibarlılığını itirməyə başlayıb.
    Anthropic is expanding to Europe and raising more money | TechCrunch
        Komanda rəhbəri Tristan Hume bu prosesin tarixçəsini çərşənbə günü dərc olunan bloq yazısında izah edib. Onun sözlərinə görə, hər yeni Claude modeli testin yenidən dizayn edilməsini zəruri edib. “Eyni vaxt limiti ilə Claude Opus 4 əksər insan namizədlərdən daha yaxşı nəticə göstərirdi. Bu hələ ən güclü namizədləri ayırd etməyə imkan verirdi. Amma Opus 4.5 artıq onlarla da eyni səviyyəyə çatdı,” – deyə Hume qeyd edib.
        Bu isə ciddi bir qiymətləndirmə problemi yaradıb. Nəzarət altında imtahan olmadığı halda namizədin süni intellektdən istifadə edib-etmədiyini müəyyənləşdirmək mümkün deyil. Əgər namizəd AI-dan istifadə edərsə, avtomatik olaraq ən yaxşı nəticə göstərənlər sırasına yüksəlir. Hume-un fikrincə, mövcud test formatında artıq ən güclü namizədlərlə Anthropic-in ən qabiliyyətli modelinin nəticələri arasında fərq qoymaq mümkün olmayıb.
        Bu problem artıq məktəb və universitetlərdə də geniş yayılıb və maraqlıdır ki, indi eyni çətinliklə birbaşa AI laboratoriyalarının özü üzləşir. Lakin Anthropic bu vəziyyəti həll etmək üçün fərqli yanaşma seçib. Yeni hazırlanmış test daha az dərəcədə hardware optimallaşdırmasına fokuslanır və daha yaradıcı, qeyri-standart düşüncə tələb edir ki, bu da mövcud AI modellərini çətin vəziyyətə salır.
    Paylaş