
Süni zəka proqram təminatı kodundakı səhvləri hələ lazımi səviyyədə aradan qaldıra bilmir
Süni İntellekt
11.04.2025
Emil
Microsoft Research bölməsinin yeni araşdırması göstərib ki, süni zəka proqramçılara kod yazmaqda kömək etsə də, OpenAI-nin və Anthropic-in qabaqcıl süni zəka modelləri belə səhvləri düzəltmək tapşırıqlarının yalnız yarısında uğur qazana bilirlər. Testlər süni zəka sistemlərinin proqram kodu yaratma qabiliyyətini ölçən ən yaxşı göstəricilərdən biri olan SWE-bench əsasında aparılıb. Təcrübə zamanı süni zəka agentləri 300 kod səhvini aradan qaldırmaq üzrə tapşırıq yerinə yetirməyə çalışıblar. Nəticələr belə olub:
- 1-ci yer: Claude 3.7 Sonnet - 48.4% uğur,
- 2-ci yer: OpenAI o1 - 30.2% uğur,
- 3-cü yer: OpenAI o3-mini - 22.1% uğur.

Lakin görünən odur ki, bu nəticələr hələ də təcrübəli insan proqramçılardan gözlənilən səviyyədən xeyli aşağıdır. TechCrunch izah edir ki, əsas problem süni zəkanın hələ də mövcud alətlərdən düzgün istifadə etməyi və səhvləri düzgün şərh etməyi tam bacarmamasıdır. Tədqiqat müəlliflərinin fikrincə, modellərin inkişafı qarşısında əsas maneə hələ də öyrənmə üçün məlumat çatışmazlığıdır. “Biz qəti əminik ki, təlim və ya təkrar təlim prosesi onları daha yaxşı interaktiv sazlayıcıya çevirə bilər. Lakin bunun üçün ixtisaslaşdırılmış məlumatlar lazımdır, məsələn, insanların süni zəka sazlayıcıları ilə bütün qarşılıqlı əlaqə proseslərini əks etdirən məlumat zəncirləri”.

Hazırda belə məlumatlar yetərli deyil, bu da modellərin imkanlarını məhdudlaşdırır. Məsələn, Cognition Labs startapının məşhur aləti Devin, məhz bu səbəbdən kodlaşdırma üzrə 20 testdən yalnız 3-nü uğurla yerinə yetirə bilib. Baxmayaraq ki, süni zəka bu gün artıq Google kimi şirkətlərdə fəal istifadə olunur, CEO Sundar Pichai-nin sözlərinə görə, süni zəka ilə yaradılmış kodun təxminən 25%-i əksinə, yeni səhvlər də əlavə edə bilər. Texnologiya sahəsinin liderləri proqramçılıq peşəsinin tam avtomatlaşdırılmasına skeptik yanaşırlar. Bill Gates əmindir ki, proqramlaşdırma bir peşə olaraq heç yerə yox olmayacaq.
Eyni fikri Replit şirkətinin baş direktoru Amjad Masad, Okta şirkətinin rəhbəri Todd Mckinnon və IBM-in başçısı Arvind Krishna da bölüşürlər. Açıq-aşkar problemlərə baxmayaraq, proqram təminatının hazırlanması üçün süni zəka alətlərinə maraq artmaqda davam edir. İnvestorlar bu alətlərdə səmərəliliyin artırılması baxımından böyük potensial görürlər. Lakin tanınmış proqramçılar hesab edirlər ki, hələlik süni zəkaya tam etibar etmək üçün tezdir.
Mənbə: Techcrunch
Paylaş
Bənzər xəbərlər

Süni İntellekt
OpenAI GPT-4.1-i istifadəyə verməyə hazırlaşır
OpenAI yaxın zamanda bir neçə yeni süni zəka modelini təqdim etməyi planlaşdırır. Bunlar arasında GPT-4-ün təkmilləşdirilmiş versiyası olan GPT-4.1 də yer alır.

Süni İntellekt
Google məntiq yürüdə bilən Gemini 2.5 Flash süni zəka modelini təqdim edib
Google yüksək məhsuldarlıq və səmərəliliyə fokuslanan yeni süni zəka modelini təqdim edib. Bu model Gemini 2.5 Flash adlanır və tezliklə süni zəka modellərinin yerləşdirilməsi və idarə olunması üçün nəzərdə tutulmuş Google Cloud-un Vertex AI platformasında əlçatan olacaq.

Süni İntellekt
Avropa "süni zəka qitəsi"nə çevrilməyi planlaşdırır
Avropa Birliyi rəsmiləri yerli süni zəka sektorunu təşviq etmək və onu ABŞ və Çinlə sərt rəqabət şəraitində gücləndirmək məqsədilə bir plan təqdim ediblər. Bu addım, regionda süni zəka ilə bağlı mövcud qaydaları tənqid edən yerli inkişaf etdiricilərin çıxışlarından sonra atılıb.

Süni İntellekt
Çin süni zəka yarışında ABŞ-dan geriliyini azaldıb
Çin süni zəka yarışında ABŞ-ı yaxalamaqdadır. Stenford Süni Zəka İnstitutunun son hesabatına görə, əsas testlər üzrə Çin və ABŞ modelləri arasındakı nəticə fərqi 2023-cü ildəki iki rəqəmli göstəricilərdən 2024-cü ilin sonuna yaxın demək olar ki, sıfıra enib.

Proqram Təminatı
Kompüter ekranındakı hər şeyi analiz edə biləcək Copilot Vision funksiyası test edilir
Microsoft Windows üçün Copilot tətbiqinin növbəti yeniləməsini sınaqdan keçirməyə başlayıb. Bu yeniləmə süni zəka köməkçisinə kompüter ekranındakı görüntünü və orada açılmış tətbiqlərin interfeysini izləməyə imkan verəcək.
Ən çox oxunanlar

İnsanabənzər robotlar arasında boks döyüşü anons edilib (VİDEO)
