Logo
    main-post-cover

    Alibaba Qwen3-Next süni intellekt modelini təqdim edib

         Alibaba yeni Qwen3-Next arxitekturasında ilk açıq süni intellekt modelini təqdim edib. Bu yeni süni intellekt modeli öz sələfindən 10 dəfə daha sürətlidir, amma onun hazırlanması 10 dəfə daha ucuz başa gəlib. Cavabların keyfiyyəti və dəqiqliyinə görə isə əvvəlki nəslin flaqmanı ilə müqayisə oluna bilər. Alibaba Qwen3-Next-80B-A3B modeli 80 milyard parametrə malikdir və təlim üçün sələfi Qwen3-32B ilə müqayisədə təxminən 10 dəfə az xərc tələb etsə də, yeni model bəzi tapşırıqları on dəfə daha sürətli yerinə yetirir. Cavabların dəqiqliyi və keyfiyyətinə görə isə o, flaqman Qwen3-235B-A22B səviyyəsində işləyir.
    Alibaba bildirib ki, yeni nəsil modellər effektiv yerləşdirmə və hətta istehlakçı avadanlıqlarında işləmək üçün optimallaşdırılıb. Şirkət həmçinin eyni arxitektura üzərində əsaslanan məntiqi (reasoning) versiyasını da təqdim edib. “Alibaba Qwen3-Next-80B-A3B-Thinking modeli öz sələfi Qwen3-32B-Thinking və Google Gemini-2.5-Flash-Thinking-i bir sıra parametrlər üzrə geridə qoyub” - deyə şirkətin nümayəndəsi üçüncü tərəf testlərinə istinadla bildirib. Şirkət yeni modelin səmərəliliyini bir sıra metodların birləşməsi hesabına artırıb.
    Xüsusilə, giriş mətn məlumatlarının emalını sadələşdirməyə kömək edən “hibrit diqqət” mexanizmi və “yüksək seyrək ekspertlər qarışığı” (MoE) arxitekturası istifadə olunub - bu arxitektura modeli müxtəlif giriş məlumat altqrupları üzrə ixtisaslaşan subşəbəkələrə bölərək tapşırıqları birgə həll etməyə imkan verir. Digər bir yenilik “çoxtokenli proqnozlaşdırma” strategiyası olub, həmçinin modelin öyrədilməsi prosesində sabitliyi artırmağa yönəlmiş bir sıra tədbirlər tətbiq edilib. Qwen3-Next-80B-A3B modeli artıq API vasitəsilə işləmək üçün Alibaba Cloud infrastrukturunda əlçatandır. Ondan Hugging Face və ModelScope platformalarında da istifadə etmək mümkündür.
    Paylaş