Logo
    main-post-cover

    GPT-5-in təlimatlandırılması mövzusunda məlumat çatışmazlığı problemi yaşanır

    Süni İntellekt
    03.04.2024
    Emil
         Yaxın zamanda neyron şəbəkələrinin sürətli inkişaf tempinin ləngimə ehtimalı var. The Wall Street Journal-ın hesabatına əsasən böyük dil modellərinin təkmilləşdirilməsi üçün OpenAI Google kimi şirkətlərə böyük həcmli məlumatlar lazımdır. Lakin məsələ burasındadır ki, internetdə keyfiyyətli məlumatların sayı azdır. Süni zəka sahəsində fəaliyyət göstərən mütəxəssis Pablo Villalobos-un sözlərinə əsasən GPT-4 dil modeli 12 trilyon məlumat tokeni əsasında təlimatlandırılıb və OpenAI şirkətinin növbəti böyük dil modelinin təlimatlandırılması üçün 60-100 trilyon məlumat tokeni lazımdır.
         Hal-hazırda internetdə açıq mənbə şəklində isə 10-20 milyard token məlumat çatışmır. Məlumata əsasən internetdə mövcud olan məlumatların əksəriyyəti böyük dil modellərinin təlimatlandırılmalarına yaramır. Belə ki, həmin məlumatlar ya əlaqəsiz mətnlərdən təşkil edilib ya da onlar artıq süni zəkaya məlumdurlar. Xəbər agentlikləri və sosial şəbəkələr kimi böyük platformaların öz məlumatlarını paylaşmaqdan imtina etmələri isə bu vəziyyəti daha da qəlizləşdirir.
    Paylaş