
GPT-5 süni intellekt modeli 24 saat ərzində sındırılıb
Təhlükəsizlik
11.08.2025
Emil
İki müstəqil tədqiqat şirkəti yeni təqdim edilmiş GPT-5 neyron şəbəkəsini sınaqdan keçirib və onun təhlükəsizlik sistemində kritik boşluqlar aşkar ediblər. NeuralTrust modeli cəmi 1 gün ərzində GPT-5-i sındıraraq onu məişət şəraitində alışdırıcı qarışığın hazırlanması üzrə təlimat yaratmağa məcbur edib. SPLX şirkəti isə sorğuların obfuskasiya (qarışdırma) üsulu ilə edilən hücumlara qarşı boşluqları aşkar edib. Grok-4 2 gün ərzində sındırıldıqdan sonra, GPT-5 həmin tədqiqatçılar tərəfindən cəmi 24 saata sındırılıb. NeuralTrust mütəxəssisləri özlərinə məxsus EchoChamber metodunu və storytelling texnikasını - yəni süni intellekti açıq şəkildə qadağan olunmuş ifadələr işlətmədən, maraqlı hekayələr və ardıcıl dəqiqləşdirici sorğular vasitəsilə lazım olan cavaba doğru yönləndirmə üsulunu - birləşdiriblər.

Nəticədə, OpenAI-nin daxili qoruma mexanizmlərinə baxmayaraq, GPT-5 kustar üsulla silah hazırlanması üzrə ətraflı təlimat verib. NeuralTrust-ın izahına görə, problem ondadır ki, GPT-5-in təhlükəsizlik sistemi hər bir sorğunu ayrıca təhlil edir, lakin çoxmərhələli dialoqun yığıcı təsirini nəzərə almır. Hücum edənlər lazım olan konteksti tədricən möhkəmləndirir, açar sözləri zərərsiz ifadələrə yerləşdirir və sonra modeli təhlükəli məzmun yaratmağa yumşaq şəkildə yönləndirirlər. SPLX komandası isə öz testlərini apararaq StringJoin Obfuscation adlanan hücum üsulunu uğurla tətbiq edib. Bu üsulda mətnə müəyyən simvollar əlavə edilir və bununla da zərərli sorğu maskalanır.

Məsələn, bir sıra istiqamətləndirici suallardan sonra model, sistem qadağasına baxmayaraq, qadağan olunmuş maddənin hazırlanma prosesini ətraflı şəkildə təsvir etməyə razılaşıb. Bundan əlavə, GPT-4o ilə aparılan müqayisəli təhlil zamanı SPLX mütəxəssisləri əvvəlki modelin bu cür hücumlara qarşı davamlılıq baxımından daha etibarlı olduğu qənaətinə gəliblər. NeuralTrust və SPLX şirkətləri “xam” GPT-5 versiyasının biznes mühitində istifadəsində ehtiyatlı olmağa çağırıblar. Xüsusilə, biznesin əlaqələndirilməsi sahəsində - yəni müəssisənin bütün bölmələri ümumi məqsədlərə çatmaq üçün koordinasiyalı strategiyalar, proseslər və resurslardan istifadə etdikdə. SPLX-də bildiriblər: “Xam GPT-5 modelini korporativ tətbiqlərdə demək olar ki, birbaşa istifadə etmək mümkün deyil. Hətta OpenAI-nin daxili səviyyədə verdiyi təlimatlar belə, xüsusilə biznesin əlaqələndirilməsi sahəsində, nəzərəçarpacaq boşluqlar buraxır”.
Paylaş