
GPT-5-in təlimatlandırılması mövzusunda məlumat çatışmazlığı problemi yaşanır
Süni İntellekt
03.04.2024
Emil
Yaxın zamanda neyron şəbəkələrinin sürətli inkişaf tempinin ləngimə ehtimalı var. The Wall Street Journal-ın hesabatına əsasən böyük dil modellərinin təkmilləşdirilməsi üçün OpenAI və Google kimi şirkətlərə böyük həcmli məlumatlar lazımdır. Lakin məsələ burasındadır ki, internetdə keyfiyyətli məlumatların sayı azdır. Süni zəka sahəsində fəaliyyət göstərən mütəxəssis Pablo Villalobos-un sözlərinə əsasən GPT-4 dil modeli 12 trilyon məlumat tokeni əsasında təlimatlandırılıb və OpenAI şirkətinin növbəti böyük dil modelinin təlimatlandırılması üçün 60-100 trilyon məlumat tokeni lazımdır.
Hal-hazırda internetdə açıq mənbə şəklində isə 10-20 milyard token məlumat çatışmır. Məlumata əsasən internetdə mövcud olan məlumatların əksəriyyəti böyük dil modellərinin təlimatlandırılmalarına yaramır. Belə ki, həmin məlumatlar ya əlaqəsiz mətnlərdən təşkil edilib ya da onlar artıq süni zəkaya məlumdurlar. Xəbər agentlikləri və sosial şəbəkələr kimi böyük platformaların öz məlumatlarını paylaşmaqdan imtina etmələri isə bu vəziyyəti daha da qəlizləşdirir.
Paylaş
Ən çox oxunanlar

REDMI Turbo 4 Pro subflaqman smartfonu təqdim olunub - QİYMƏTİ
