Logo
    main-post-cover

    Yeni üsul sadəcə 78 məlumat nümunəsi sayəsində süni intellekt agentini yaratmağa imkan verir

         Çinli alimlərin yeni araşdırması göstərir ki, böyük dil modellərini (LLM) mürəkkəb və müstəqil tapşırıqları yerinə yetirməyə öyrətmək üçün mütləq nəhəng məlumat toplusuna ehtiyac yoxdur. Böyük dil modellərinin öyrənilməsinin digər sahələrində aparılan oxşar işlərə əsaslanaraq, onlar belə bir nəticəyə gələn bir framework hazırlayıblar: “Bu cür sistemlərin müstəqilliyi məlumat bolluğundan deyil, agentlər üçün yüksək keyfiyyətli nümunələrin strateji seçilməsindən yaranır”. Başqa sözlə, burada əsas olan məlumatın miqdarı deyil, onun keyfiyyətidir. Müasir öyrənmə sistemləri adətən belə düşünür: süni intellekt agentindən nə qədər yüksək intellektual səviyyə tələb olunursa, onu öyrətmək üçün bir o qədər çox məlumat lazımdır. Lakin tədqiqatçılar bildirirlər ki, bu yanaşma təlim prosesini daha da mürəkkəbləşdirir və resurs baxımından çox baha başa gəlir.
         Üstəlik, bir çox sahələrdə məlumat məhduddur, əldə olunması çətindir və toplanması çox bahalıdır. Digər sahələrdə aparılan tədqiqatlar bunun mütləq belə olmadığını göstərir. Məsələn, 2023-cü ildə dərc olunmuş bir məqalədə göstərilib ki, model cəmi 1000 diqqətlə seçilmiş nümunə üzərində öyrədilsə belə, yüksək səmərəlilik göstərə bilər. Komandanın hazırladığı LIMI (Less Is More for Intelligent Agency - “intellektual agentlər üçün az çox deməkdir”) adlı framework də eyni prinsipi əsas götürür. Təcrübələr zamanı tədqiqatçılar müəyyən ediblər ki, cəmi 78 diqqətlə seçilmiş nümunədən ibarət kiçik, lakin keyfiyyətli məlumat toplusu ilə onlar minlərlə nümunə üzərində öyrədilmiş modelləri əsas göstəricilər üzrə xeyli qabaqlayan böyük dil modelləri əldə edə biliblər. Framework-un əsas elementi agent tapşırıqları üçün yüksək keyfiyyətli nümunələrin toplanmasını təmin edən xüsusi bir “boru xəttidir”.
         Hər bir nümunə iki hissədən ibarətdir: sorğu və trayektoriya. Sorğu - istifadəçinin təbii dildə verdiyi tapşırıqdır, məsələn, proqram təminatının hazırlanması ilə bağlı tələb və ya elmi tədqiqat məqsədi. Trayektoriya isə süni intellektin bu sorğunu yerinə yetirmək üçün atdığı addımlar ardıcıllığıdır. Buraya daxili düşünmə prosesi, xarici alətlərdən istifadə üçün edilən sorğular və mühitdə aparılan müşahidələr daxildir. Trayektoriya planlaşdırma, icra və refleksiya mərhələlərinin bir neçə iterasiyasını əhatə edə bilər - arzu olunan nəticə əldə olunana qədər. Tədqiqatçılar yazırlar: “Bu yanaşma təmin edir ki, modellərimiz yalnız uğurlu nəticələrdən deyil, həm də problemlərin həlli prosesinin bütün mərhələlərindən öyrənirlər - strategiyaları necə uyğunlaşdırmaq və icra zamanı baş verən uğursuzluqlardan necə bərpa olmaq daxil olmaqla”. Araşdırmada təqdim olunan bu metod məlumatın az olduğu və ya toplanmasının çox baha başa gəldiyi hallarda tətbiqlər yaratmaq üçün faydalı ola bilər.
    Paylaş