
ChatGPT-nin tərtib etdiyi cavabların keyfiyyətləri həqiqətən də aşağı düşüb
Dünən məlum oldu ki, ChatGPT istifadəçiləri çat-botdan şikayətlənməyə başlayıblar. Belə ki, onlar çat-botun çalışma performansının aşağı düşməsindən narazıdırlar. İstifadəçilərin sözlərinə əsasən bu problem hətta aylıq ödənişli ChatGPT Plus-da da müşahidə edilir. Məlumata əsasən ChatGPT tərəfindən təqdim edilən cavabların keyfiyyətləri olduqca aşağı düşüb. Stenford Universitetinin mütəxəssisləri isə bütün bunları yoxlamaq qərarına gəliblər. Onlar ChatGPT-nin hal hazırda aktual olan versiyasının imkanlarını çat-botun daha öncəki nəticələri ilə müqayisə edərək ciddi araşdırma aparıblar. Nəticədə məlum olub ki, ChatGPT-nin çalışma performansı son 3 ay ərzində sözün əsl mənasında aşağı düşüb.
Aparılmış araşdırmaların nəticələrinə əsasən bu ilin mart ayından iyun ayına kimi ChatGPT-nin əsasında olan GPT-4 adlı böyük dil modeli əsasən daha aşağı dəqiqliyə sahib cavabları tərtib edib. Məsələn çat-bota 17 077-nin sadə ədəd olub-olmaması sualı verilib. Bununla belə bu sorğuya “Ardıcıllıqla fiklirləş” cümləsi əlavə edilib. Mütəxəssislərin fikirlərinə əsasən “Ardıcıllıqla fiklirləş” cümləsi süni zəka əsaslı çat-bot üçün bir ipucu rolunu oynamalı və süni zəka sistemini bu sualı mərhələləri şəkildə həll etməsinə məcbur etməli idi. Nəticədə çat-botun təqdim etmiş olduğu cavab səhv olub və bununla yanaşı heç bir izahedici qeydə sahib olmayıb.
Mütəxəssislərin sözlərinə əsasən keçən ay GPT-4-ün bəzi sahələrdə cavablarının dəqiqliyi 2.4% aşağı düşüb. Müqayisə üçün qeyd etmək lazımdır ki, mart ayında bu göstərici 97.5% təşkil edirdi. Proqram təminatı kodunun tərtib edilməsi zamanı çat-bot yalnız 10% düzgün olan nəticələri sərgiləyir. Mart ayında isə bu göstərici 52% təşkil edirdi. Maraqlısı ondadır ki, ChatGPT-nin pulsuz versiyasının əsasında olan GPT-3.5 adlı böyük dil modelinin tərtib etdiyi cavabların dəqiqlikləri əksinə yüksəlib. Məsələn GPT-3.5 iyun ayında ona ünvanlamış sualların 8%-nə düzgün cavab verib. Mart ayında bu göstərici 2% təşkil edirdi. Mütəxəssislər bildirblər ki, öz işlərində GPT-3.5 və ya GPT-4-ə əsaslanan insanlar onlar tərəfindən tərtib edilən hər bir cavabı yoxlamalıdırlar.
Paylaş
Bənzər xəbərlər