
Google Gemini süni zəka modellərindən birinin təhlükəsizlik baxımından zəif olduğu məlum olub
Süni İntellekt
05.05.2025
Emil
Google-un daxili qiymətləndirmələrinə əsasən, bir neçə müddət öncə təqdim edilmiş süni zəka modeli bəzi təhlükəsizlik testlərində əvvəlki versiyadan daha zəif nəticə göstərib. Keçən həftə yayımlanmış texniki hesabatda Google bildirib ki, Gemini 2.5 Flash modeli, təhlükəsizlik qaydalarını pozan mətni yaratmaq ehtimalı baxımından Gemini 2.0 Flash modelindən daha risklidir. İki göstərici üzrə - “mətn-mətn təhlükəsizliyi” və “şəkil-mətn təhlükəsizliyi” - Gemini 2.5 Flash müvafiq olaraq 4.1% və 9.6% geriləmə göstərib. Mətn-mətn təhlükəsizliyi modelin verilən sual əsasında Google-un qaydalarını pozma tezliyini ölçür, şəkil-mətn təhlükəsizliyi isə görüntü əsasında verilən göstərişlərə modelin nə dərəcədə uyğun cavab verdiyini qiymətləndirir. Hər iki test avtomatlaşdırılıb və insan nəzarəti olmadan aparılır.

Google-un sözçüsü elektron poçtla verdiyi açıqlamada təsdiqləyib ki, Gemini 2.5 Flash modeli mətn-mətn və şəkil-mətn təhlükəsizliyi baxımından daha zəif nəticə göstərir. Bu təəccüblü test nəticələri süni zəka şirkətlərinin modellərini daha çox icazəverici etməyə çalışdığı bir vaxtda ortaya çıxır - yəni, mübahisəli və ya həssas mövzulara cavab verməkdən imtina etmə ehtimalını azaltmaq istiqamətində. Meta, Llama modellərinin son versiyalarında onların “bəzi fikirləri digərləri üzərində üstün tutmaması” və daha çox “müzakirə olunan” siyasi suallara cavab verməsi üçün tənzimləndiyini bildirib. OpenAI isə bu ilin əvvəlində açıqlayıb ki, gələcək modellər redaksiya mövqeyi tutmamalı və mübahisəli mövzularda müxtəlif baxış bucaqları təqdim etməlidir. Lakin bu icazəvericilik səyləri bəzən əks-təsir doğurub.
TechCrunch xəbər verib ki, OpenAI-nin ChatGPT xidmətini idarə edən əsas model, azyaşlı istifadəçilərin erotik söhbətlər yaratmasına imkan verib. OpenAI bu davranışı “səhv” (bug) ilə izah edib. Google-un texniki hesabatına görə, hələlik sınaq mərhələsində olan Gemini 2.5 Flash modeli, problemli sərhədləri aşan göstərişlər daxil olmaqla, təlimatlara Gemini 2.0 Flash-dan daha dəqiq şəkildə əməl edir. Şirkət bu geriləməni qismən yanlış pozitivlərlə izah edir, lakin eyni zamanda etiraf edir ki, Gemini 2.5 Flash bəzi hallarda açıq şəkildə soruşulduqda “qaydaları pozan məzmun” yarada bilər. Hesabatda qeyd olunur: “Təbii olaraq, həssas mövzularda təlimatlara əməl etməklə təhlükəsizlik siyasətinin pozulması arasında gərginlik var və bu, qiymətləndirmələrimizdə də əksini tapır”.

SpeechMap adlı test göstəriciləri - modellərin həssas və mübahisəli mövzulara necə cavab verdiyini qiymətləndirən bir meyar - həmçinin göstərir ki, Gemini 2.5 Flash modeli Gemini 2.0 Flash ilə müqayisədə mübahisəli suallara cavab verməkdən imtina etməyə xeyli az meyillidir. TechCrunch-ın OpenRouter süni zəka platforması üzərindən apardığı testlər göstərib ki, bu model heç bir etiraz etmədən insan hakimlərin süni zəka ilə əvəz olunmasını, ABŞ-da hüquqi təminatların zəiflədilməsini və genişmiqyaslı order olmadan dövlət nəzarəti proqramlarının tətbiqini dəstəkləyən esse yaza bilir. Secure AI Project-in həmtəsisçisi Thomas Woodside bildirib ki, Google-un texniki hesabatda təqdim etdiyi məhdud detallar model testlərində daha çox şəffaflığa ehtiyac olduğunu göstərir.
“Burada təlimatlara əməl etməklə siyasət qaydalarına riayət etmə arasında ziddiyyət var, çünki bəzi istifadəçilər qaydaları pozan məzmun tələb edə bilər” - deyə Woodside bildirib. “Bu halda, Google-un son Flash modeli təlimatlara daha çox əməl edir, lakin eyni zamanda siyasət qaydalarını da daha çox pozur. Google qaydaların pozulduğu konkret hallarla bağlı ətraflı məlumat vermir, baxmayaraq ki, bu hallar ağır pozuntu kimi qiymətləndirilmir. Ətraflı məlumat olmadan müstəqil analitiklərin problemin olub-olmadığını müəyyənləşdirməsi çətindir”. Google daha öncə də modellərin təhlükəsizliyi üzrə hesabat təcrübəsinə görə tənqid olunub. Şirkət ən güclü modeli olan Gemini 2.5 Pro üçün texniki hesabatı dərc etmək üçün həftələrlə vaxt sərf etmişdi. Hesabat nəhayət dərc edildikdə, ilkin versiyada əsas təhlükəsizlik testləri ilə bağlı vacib detallar yer almamışdı.
Mənbə: Techcrunch
Paylaş
Ən çox oxunanlar

Samsung qlobal smartfon bazarındakı liderliyini geri qaytarıb
