Logo
    main-post-cover

    Süni zəkanı tamamilə pulsuz kontentlər vasitəsilə yaratmaq mümkündür

    Süni İntellekt
    10.06.2025
    Emil
         Süni zəka sahəsində ixtisaslaşmış şirkətlər iddia edirlər ki, onların layihələrini müəllif hüquqları ilə qorunan materiallar olmadan yaratmaq mümkün olmazdı. Lakin ABŞ və digər ölkələrdən olan bir qrup alim sübut edib ki, belə şəraitdə də süni zəkanın hazırlanması mümkündür, baxmayaraq ki, bu proses daha çətindir. Onlar yalnız ictimaiyyətə açıq məzmun və açıq lisenziyalı materiallar əsasında öyrədilmiş bir model yaradıblar. Layihə Massaçusets Texnologiya İnstitutu, Karnegi Mellon UniversitetiToronto Universiteti də daxil olmaqla 14 qurumun əməkdaşlığı nəticəsində həyata keçirilib. Tədqiqatçılar yalnız etik mənbələrdən toplanmış məlumatlardan ibarət təlim bazası hazırlayıblar. Bu bazanın həcmi 8 TB-a (terabayt) çatıb.
         Bazaya xüsusilə ABŞ Konqres Kitabxanasından götürülmüş 130 000 kitab daxil edilib. Bu materiallar əsasında tədqiqatçılar 7 milyard parametrə malik böyük dil modeli hazırlayıblar. Model, təxminən, Meta-nın 2023-cü ildə təqdim etdiyi eyniölçülü Llama 2-7B modeli səviyyəsində fəaliyyət göstərir. Lakin tədqiqat müəllifləri modelin performansını aparıcı sənaye layihələri ilə müqayisə edən test nəticələrini paylaşmayıblar. Sistemin 2 il əvvəlki model səviyyəsində işləməsi yeganə çatışmazlıq deyil. Təlim üçün nəzərdə tutulan məlumat bazasının uyğun formata çevrilməsi prosesi də olduqca yorucu olub. Məlumatların böyük bir hissəsi rəqəmsal sistemlər tərəfindən oxunaqlı deyildi, buna görə də insanların bu prosesə birbaşa cəlb olunması zəruri idi.
         “Avtomatlaşdırma vasitələrindən istifadə etdik, amma günün sonunda bütün materiallarımız əl ilə annotasiya olunurdu və insanlar tərəfindən yoxlanılırdı. Bu isə olduqca çətin bir proses idi” - deyə layihənin iştirakçılarından biri bildirib. Alimlər həmçinin hər bir skan edilmiş sayt üçün hansı lisenziyanın qüvvədə olduğunu müəyyənləşdirməli olublar. 2024-cü ildə OpenAI Britaniya parlamentinin komitələrindən birinə bildirib ki, müasir qabaqcıl süni zəka modellərini müəllif hüquqları ilə qorunan materiallardan istifadə etmədən öyrətmək mümkün deyil. Ötən il Anthropic şirkətindən bir ekspert də bu fikirlə razılaşaraq demişdi: “Əgər süni zəka sahəsində ixtisaslaşmış şirkətlər təlim məlumatlarında istifadə etdikləri əsərləri lisenziyalaşdırmağa məcbur olsaydılar, böyük dil modelləri yəqin ki, mövcud olmazdı”. İndi isə bu 2 iddianın həqiqətə uyğun olmadığını sübut edən bir araşdırma mövcuddur. Hərçənd bu tədqiqat sənayedə ciddi dəyişiklik yaratmayacaq, lakin süni zəka yaradıcılarının tez-tez irəli sürdükləri əsas arqumentlərdən biri artıq əsassız sayılır.
    Paylaş