Logo
    main-post-cover

    Süni zəka proqram təminatı kodundakı səhvləri hələ lazımi səviyyədə aradan qaldıra bilmir

    Süni İntellekt
    11.04.2025
    Emil
         Microsoft Research bölməsinin yeni araşdırması göstərib ki, süni zəka proqramçılara kod yazmaqda kömək etsə də, OpenAI-nin və Anthropic-in qabaqcıl süni zəka modelləri belə səhvləri düzəltmək tapşırıqlarının yalnız yarısında uğur qazana bilirlər. Testlər süni zəka sistemlərinin proqram kodu yaratma qabiliyyətini ölçən ən yaxşı göstəricilərdən biri olan SWE-bench əsasında aparılıb. Təcrübə zamanı süni zəka agentləri 300 kod səhvini aradan qaldırmaq üzrə tapşırıq yerinə yetirməyə çalışıblar. Nəticələr belə olub:
    - 1-ci yer: Claude 3.7 Sonnet - 48.4% uğur,
    - 2-ci yer: OpenAI o1 - 30.2% uğur,
    - 3-cü yer: OpenAI o3-mini - 22.1% uğur.
         Lakin görünən odur ki, bu nəticələr hələ də təcrübəli insan proqramçılardan gözlənilən səviyyədən xeyli aşağıdır. TechCrunch izah edir ki, əsas problem süni zəkanın hələ də mövcud alətlərdən düzgün istifadə etməyi və səhvləri düzgün şərh etməyi tam bacarmamasıdır. Tədqiqat müəlliflərinin fikrincə, modellərin inkişafı qarşısında əsas maneə hələ də öyrənmə üçün məlumat çatışmazlığıdır. “Biz qəti əminik ki, təlim və ya təkrar təlim prosesi onları daha yaxşı interaktiv sazlayıcıya çevirə bilər. Lakin bunun üçün ixtisaslaşdırılmış məlumatlar lazımdır, məsələn, insanların süni zəka sazlayıcıları ilə bütün qarşılıqlı əlaqə proseslərini əks etdirən məlumat zəncirləri”.
         Hazırda belə məlumatlar yetərli deyil, bu da modellərin imkanlarını məhdudlaşdırır. Məsələn, Cognition Labs startapının məşhur aləti Devin, məhz bu səbəbdən kodlaşdırma üzrə 20 testdən yalnız 3-nü uğurla yerinə yetirə bilib. Baxmayaraq ki, süni zəka bu gün artıq Google kimi şirkətlərdə fəal istifadə olunur, CEO Sundar Pichai-nin sözlərinə görə, süni zəka ilə yaradılmış kodun təxminən 25%-i əksinə, yeni səhvlər də əlavə edə bilər. Texnologiya sahəsinin liderləri proqramçılıq peşəsinin tam avtomatlaşdırılmasına skeptik yanaşırlar. Bill Gates əmindir ki, proqramlaşdırma bir peşə olaraq heç yerə yox olmayacaq.
         Eyni fikri Replit şirkətinin baş direktoru Amjad Masad, Okta şirkətinin rəhbəri Todd MckinnonIBM-in başçısı Arvind Krishna da bölüşürlər. Açıq-aşkar problemlərə baxmayaraq, proqram təminatının hazırlanması üçün süni zəka alətlərinə maraq artmaqda davam edir. İnvestorlar bu alətlərdə səmərəliliyin artırılması baxımından böyük potensial görürlər. Lakin tanınmış proqramçılar hesab edirlər ki, hələlik süni zəkaya tam etibar etmək üçün tezdir.
    Mənbə: Techcrunch
    Paylaş
    Bənzər xəbərlər
    openai-gpt-41-i-istifadeye-vermeye-hazirlasir
    Süni İntellekt

    OpenAI GPT-4.1-i istifadəyə verməyə hazırlaşır

    OpenAI yaxın zamanda bir neçə yeni süni zəka modelini təqdim etməyi planlaşdırır. Bunlar arasında GPT-4-ün təkmilləşdirilmiş versiyası olan GPT-4.1 də yer alır.
    google-mentiq-yurude-bilen-gemini-25-flash-suni-zeka-modelini-teqdim-edib
    Süni İntellekt

    Google məntiq yürüdə bilən Gemini 2.5 Flash süni zəka modelini təqdim edib

    Google yüksək məhsuldarlıq və səmərəliliyə fokuslanan yeni süni zəka modelini təqdim edib. Bu model Gemini 2.5 Flash adlanır və tezliklə süni zəka modellərinin yerləşdirilməsi və idarə olunması üçün nəzərdə tutulmuş Google Cloud-un Vertex AI platformasında əlçatan olacaq.
    avropa-suni-zeka-qitesine
    Süni İntellekt

    Avropa "süni zəka qitəsi"nə çevrilməyi planlaşdırır

    Avropa Birliyi rəsmiləri yerli süni zəka sektorunu təşviq etmək və onu ABŞ və Çinlə sərt rəqabət şəraitində gücləndirmək məqsədilə bir plan təqdim ediblər. Bu addım, regionda süni zəka ilə bağlı mövcud qaydaları tənqid edən yerli inkişaf etdiricilərin çıxışlarından sonra atılıb.
    cin-suni-zeka-yarisinda-abs-dan-geriliyini-azaldib
    Süni İntellekt

    Çin süni zəka yarışında ABŞ-dan geriliyini azaldıb

    Çin süni zəka yarışında ABŞ-ı yaxalamaqdadır. Stenford Süni Zəka İnstitutunun son hesabatına görə, əsas testlər üzrə Çin və ABŞ modelləri arasındakı nəticə fərqi 2023-cü ildəki iki rəqəmli göstəricilərdən 2024-cü ilin sonuna yaxın demək olar ki, sıfıra enib.
    komputer-ekranindaki-her-seyi-analiz-ede-bilecek-copilot-vision-funksiyasi-test-edilir
    Proqram Təminatı

    Kompüter ekranındakı hər şeyi analiz edə biləcək Copilot Vision funksiyası test edilir

    Microsoft Windows üçün Copilot tətbiqinin növbəti yeniləməsini sınaqdan keçirməyə başlayıb. Bu yeniləmə süni zəka köməkçisinə kompüter ekranındakı görüntünü və orada açılmış tətbiqlərin interfeysini izləməyə imkan verəcək.