
OpenAI açıq mənbəli iki süni intellekt modelini təqdim edib
Süni İntellekt
06.08.2025
Emil
OpenAI açıq mənbəli iki süni intellekt modelini təqdim edib - şirkətin bildirdiyinə görə, bu modellər onun “o” seriyasına daxil olan modellərlə oxşar imkanlara malikdirlər. Hər iki yeni açıq mənbəli süni intellekt modeli Hugging Face platformasında əlçatandır. Şirkət iki fərqli model təqdim edib: daha güclü olan gpt-oss-120b modeli işləmək üçün NVIDIA videokartı tələb edir, daha yüngül gpt-oss-20b modeli isə cəmi 16 GB RAM-a malik adi bir noutbukda işləyə bilir. OpenAI sonuncu dəfə açıq mənbəli koda sahib layihəni 5 ildən çox əvvəl - GPT-2 modeli ilə təqdim etmişdi. Şirkətin məlumatına görə, yeni modellər hər hansı mürəkkəb sorğunun öhdəsindən gələ bilmədikdə, onu buludda çalışan sistemlərə yönləndirmək imkanına da malikdirlər. Süni intellekt sahəsində dünya lideri kimi tanınan OpenAI, təqdim etdiyi açıq mənbəli modelləri mövcud analoqlarla müqayisədə daha güclü etmək məqsədi güdüb və şirkətin bildirdiyinə görə, buna nail olub.

Codeforces platformasında proqram kodu yazmaq üzrə keçirilən testlərdə gpt-oss-120b modeli 2622, gpt-oss-20b modeli isə 2516 xal toplayaraq DeepSeek R1 modelini geridə qoyub, lakin o3 və o4-mini modellərindən geri qalıb. Humanity’s Last Exam (HLE) adlı digər bir testdə gpt-oss-120b modeli 19%, gpt-oss-20b modeli isə 17.3% nəticə göstərib. Bu göstəricilər o3 modelindən aşağı olsa da, DeepSeek və Alibaba Qwen kimi aparıcı açıq mənbəli modelləri üstələyib. Qeyd olunur ki, OpenAI-nin yeni açıq mənbəli süni intellekt modellərində halüsinasiyalar - yəni əminliklə verilən, lakin reallığa uyğun olmayan cavablar - o3 və o4-mini kimi qapalı modellərlə müqayisədə daha tez-tez baş verir. Şirkət bu nəticəni gözlənilən adlandırıb, çünki kiçik ölçülü modellər, böyük və qabaqcıl modellərlə müqayisədə dünyaya dair daha az biliyə malik olur və buna görə daha çox halüsinasiyaya meyllidirlər.

PersonQA testində gpt-oss-120b modeli cavabların 49%-ində, gpt-oss-20b modeli isə 53%-ində halüsinasiyaya yol verib. Müqayisə üçün, o3 modelində bu göstərici 16%, o4-mini modelində isə 36% olub. OpenAI açıq mənbəli modelləri təlim etdirərkən, qapalı modellərin təlimində istifadə olunan eyni proseslərdən yararlanıb - hər iki halda MoE (Mixture-of-Experts) metodu tətbiq olunub. Bu metod suallara cavab verilərkən daha az parametrin aktivləşməsinə imkan verir. Məsələn, gpt-oss-120b modelində ümumilikdə 177 milyard parametr mövcuddur, lakin bir token üçün cəmi 5.1 milyard parametr aktivləşir ki, bu da səmərəliliyin artmasına səbəb olur. Modelin hazırlanmasında yüksək hesablama gücünə malik möhkəmləndirici öyrənmə (high-compute reinforcement learning) üsulu tətbiq olunub.

Bu metod modelləşdirilən mühitlərdə düzgünlə səhv olanı ayırd etməyə kömək edir və "o" seriyalı modellərin təlimində də istifadə olunur. Açıq mənbəli modellər, həmçinin, cavabların emalı üçün əlavə vaxt və resursların ayrılmasını nəzərdə tutan oxşar cavab formalaşdırma prosesindən istifadə edir. OpenAI-nin bildirdiyinə görə, açıq mənbəli modellər süni intellekt agentlərinin tərkibində işləməyə uyğundur - onlar veb axtarışa və Python kodunun icra vasitələrinə müraciət edə bilirlər. Bununla belə, qeyd olunur ki, bu modellər multimodal deyil, yəni yalnız mətnlə işləmək üçün nəzərdə tutulub və nə şəkil, nə də səs yarada və ya emal edə bilmirlər.

Modellər Apache 2.0 lisenziyası altında təqdim olunur - bu lisenziya ən liberal və açıq lisenziyalardan biri hesab olunur. Bununla yanaşı, şirkət onların təlimində hansı məlumatlardan istifadə olunduğunu açıqlamaqdan imtina edib. OpenAI əlavə olaraq bu modellərin potensial olaraq kiberhücumlar, bioloji və ya kimyəvi silahların hazırlanması üçün istifadə oluna biləcəyini araşdıran ayrıca bir tədqiqat da aparıb. Kənar ekspertlərin iştirakı ilə aparılmış bu araşdırma nəticəsində müəyyən olunub ki, bu modellər bioloji elmlər sahəsində cüzi kömək göstərə bilərlər, lakin incə tənzimləmədən sonra belə onların təhlükəli imkan həddini keçdiyinə dair heç bir sübut aşkarlanmayıb.
Paylaş