Logo
    main-post-cover

    DeepSeek R1 süni intellekt modelinin təlimi üçün sərf edilmiş məbləği açıqlayıb

         Çin şirkəti DeepSeek bildirib ki, onun R1 süni intellekt modelinin öyrədilməsi üçün 294 000$ xərclənib ki, bu da ABŞ rəqiblərinin oxşar xərclərindən kəskin şəkildə azdır. Bu məlumat akademik Nature jurnalında dərc olunub. Analitiklər gözləyirlər ki, məqalənin dərc olunması Çinin süni intellektin inkişafı uğrunda yarışdakı mövqeyi barədə müzakirələri yenidən alovlandıracaq. DeepSeek şirkətinin yanvarda nisbətən ucuz süni intellekt sistemlərini buraxması dünya investorlarını texnologiya şirkətlərinin səhmlərini satmağa sövq etmişdi, çünki onların dəyərinin kəskin düşəcəyi qorxusu yaranmışdı. O vaxtdan bəri DeepSeek və onun təsisçisi Liang Wenfeng demək olar ki, ictimaiyyətin diqqətindən itib, yalnız bir neçə məhsulun yenilənməsi elanları istisna olmaqla. Dünən Nature jurnalı Liang-ın həmmüəlliflərindən biri olduğu məqaləni dərc edib. O, ilk dəfə olaraq R1 modelinin öyrədilməsi üçün xərclərin həcmini, eləcə də istifadə olunmuş süni intellekt sürətləndiricilərinin modelini və sayını rəsmi şəkildə açıqlayıb.
         Böyük dil modellərinin öyrədilməsi üçün çəkilən xərclər süni intellektli çat-botların əsasını təşkil edir və bunlar nəhəng mətn və kod həcmlərinin həftələr və ya aylarla güclü hesablama sistemlərində emalı ilə bağlı xərclərə aiddir. Məqalədə qeyd olunur ki, R1 məntiqi modelinin öyrədilməsi 294 000$-a başa gəlib və 512 ədəd NVIDIA H800 sürətləndiricisi tələb edib. ABŞ-ın süni intellekt sahəsində lideri olan OpenAI şirkətinin rəhbəri Sam Altman isə 2023-cü ildə bildirmişdi ki, əsas modelin öyrədilməsi 100 milyon dollardan çox baha başa gəlib, baxmayaraq ki, şirkət bu xərclərin strukturu barədə ətraflı hesabat təqdim etməyib. Əgər bu rəqəmləri birbaşa müqayisə etsək, süni intellekt modellərinin öyrədilməsinə çəkilən xərclər arasında 340 qat fərq yaranır. DeepSeek-in inkişaf xərcləri və istifadə olunan texnologiyalar barədə bəzi açıqlamaları ABŞ şirkətləri və rəsmiləri tərəfindən şübhə altına alınıb. H800 sürətləndiriciləri NVIDIA tərəfindən Çin bazarı üçün hazırlanmışdı, çünki ABŞ 2022-ci ilin oktyabrında şirkətə daha güclü H100 A100 həllərinin Çinə ixracını qadağan etmişdi.
         İyun ayında ABŞ rəsmiləri bəyan ediblər ki, DeepSeek ixrac nəzarəti tətbiq edildikdən sonra alınmış çoxlu sayda H100 qurğusuna çıxış əldə edib. NVIDIA isə bu iddianı təkzib edib və bildirib ki, DeepSeek qanuni yolla əldə etdiyi H800 çiplərindən istifadə edib, H100-dən yox. İndi isə Nature jurnalındakı məqaləyə əlavə olunmuş məlumat sənədində DeepSeek şirkəti A100 sürətləndiricilərinə sahib olduğunu etiraf edib və onların hazırlıq mərhələlərində istifadə olunduğunu bildirib. “Tədqiqatımız DeepSeek-R1 ilə bağlı olaraq, biz kiçik model üzərində aparılmış təcrübələrə hazırlıq üçün A100 qrafik prosessorlarından istifadə etdik” - deyə tədqiqatçılar yazıblar. Onların sözlərinə görə, bu ilkin mərhələdən sonra R1 modeli ümumilikdə 80 saat ərzində 512 H800 sürətləndiricisindən ibarət klasterdə öyrədilib. Bundan əvvəl Reuters agentliyi xəbər vermişdi ki, DeepSeek-in süni intellekt sahəsində ən yaxşı mütəxəssisləri cəlb edə bilməsinin səbəblərindən biri də onun A100 superkompüter klasterindən istifadə edən azsaylı Çin şirkətlərindən biri olmasıdır.
    Paylaş