
Meta Llama 4 süni zəka modellərini istifadəyə verib
Süni İntellekt
07.04.2025
Emil
Meta Platforms açıq mənbə koduna sahib süni zəka əsaslı modellərindən ibarət Llama 4 ailəsinin istifadəyə verildiyini elan edib. Bu ailəyə Llama 4 Scout, Maverick və Behemoth modelləri daxildir və onlar multimodal qarşılıqlı əlaqə imkanı təqdim edirlər. Yəni yalnız mətn sorğularına deyil, həm də şəkil, video və digər məlumat növlərinə cavab verə bilirlər. Bu modellər “çoxlu miqdarda nişanlanmamış mətn, qrafik və video məlumatlar” üzərində öyrədilib ki, bu da onlara “geniş vizual qavrayış qabiliyyəti” qazandırıb. Çin şirkəti DeepSeek-in süni zəka modellərinin uğuru - bu modellər əvvəlki nəsil Llama flaqman alqoritməri ilə eyni səviyyədə işləyir və ya onları üstələyir - Meta-nı bu istiqamətdə inkişaf prosesini sürətləndirməyə vadar edib.

Məlumata görə, şirkət əməkdaşları DeepSeek-in R1 və V3 kimi süni zəka modellərinin hazırlanma və işə salınma xərclərini necə azaltdığını anlamaq üçün ciddi səylər göstərirlər. Llama 4 Scout alqoritmi 17 milyard aktiv parametrə, 16 “ekspertə” və ümumilikdə 109 milyard parametrə malikdir. Meta-nın məlumatına görə, bu süni zəka modeli müxtəlif tapşırıqları yerinə yetirməkdə Gemma 3, Gemini 2.0 Flash-Lite və Mistral 3.1 modellərini üstələyir. Modelin əsas üstünlüklərindən biri isə 10 milyon tokenlik kontekst pəncərəsini dəstəkləməsidir. Llama 4 Maverick modeli 17 milyard aktiv parametrə və 128 “ekspertə” malikdir (ümumilikdə 400 milyard parametr).
Tərtibatçıların məlumatına görə, bu model müxtəlif bənçmark testlərində GPT-4o və Gemini 2.0 Flash-dan daha yaxşı nəticələr göstərir, həmçinin düşünmə qabiliyyəti və proqram təminatı kodunun yazılması prosesində DeepSeek V3 ilə müqayisə oluna biləcək səviyyədə çıxış edir. Scout modeli bir ədəd NVIDIA H100 qrafik sürətləndiricisində işləyə bilir, Maverick isə NVIDIA H100 DGX sistemi və ya onun ekvivalentinə ehtiyac duyur. Llama 4 Behemoth modeli 288 milyard aktiv parametrə və 16 “ekspertə” malikdir (ümumilikdə təxminən 2 trilyon parametr) və müxtəlif bənçmark testlərində GPT-4.5, Claude Sonnet 3.7 və Gemini 2.0 Pro alqoritmlərindən üstün nəticələr göstərir. Llama 4 Behemoth modeli hələ də öyrədilmə mərhələsindədir, buna görə də ictimai istifadəyə açıq deyil.

Bu vaxt Scout və Maverick modelləri artıq Llama.com saytında və Hugging Face platformasında əlçatandır. Bundan əlavə, Meta-nın WhatsApp, Messenger və Instagram kimi tətbiqlərində istifadə olunan rəsmi süni zəka köməkçisi Meta AI artıq 40 ölkədə Llama 4 ilə işləyir. Multimodal sorğuların işlənməsi imkanı hələlik yalnız ingilis dili ilə məhdudlaşır və yalnız ABŞ-da aktivdir. “Llama 4 modelləri Llama ekosistemində yeni bir dövrün başlanğıcını simvolizə edir. Bu, Llama 4 ailəsi üçün sadəcə başlanğıcdır” - deyə Meta-nın bloq yazısında bildirilib.
Şirkət iddia edir ki, Llama 4 süni zəka modelləri arasında “ekspertlərin qarışığı” (MoE - Mixture of Experts) arxitekturasından istifadə edən ilk model qrupudur və bu yanaşma həm öyrədilmə, həm də nəticə çıxarma (inferens) prosesində daha səmərəlidir. MoE arxitekturası alqoritmə tapşırıqları alt-tapşırıqlara bölmək və onları daha kiçik və ixtisaslaşmış “ekspert” modellərə həvalə etmək imkanı verir. Qeyd etmək lazımdır ki, Llama 4 modellərinin heç biri OpenAI-nin GPT-o1 və ya GPT-o3-mini modelləri kimi əsl “məntiq yürüdə bilən” model deyil. Məntiq yürüdən modellər cavablarının doğruluğunu yoxlayır və adətən onların cavabları daha etibarlı olur, lakin belə cavabların əldə olunması ənənəvi “məntiq yürütməyən” modellərlə müqayisədə daha çox vaxt tələb edir.
Mənbə: Techcrunch
Paylaş
Ən çox oxunanlar

ABŞ ordusu zirehli texnika əvəzinə dronlara üstünlük verəcək
