Logo
    main-post-cover

    Anthropic öz süni zəka modelində əxlaq kodeksinin olduğunu müəyyən edib

    Süni İntellekt
    22.04.2025
    Emil
         Anthropic şirkəti Claude adlı süni zəka köməkçisinin davranışını istifadəçilərlə aparılmış 700 000 anonim dialoq əsasında araşdırıb. Nəticələr göstərib ki, Claude əksər hallarda şirkətin bəyan etdiyi dəyərlərə - faydalılıq, dürüstlük və zərərsizliyə - sadiq qalır. Lakin bəzən süni zəka modeli bu prinsiplərdən yayınaraq dominant və əxlaqsız davranışlar nümayiş etdirir. Tədqiqatçılar süni zəkanın dəyərlərinə dair ilk geniş miqyaslı taksonomiyanı yaradaraq Claude-un davranışının kontekstdən asılı olaraq necə dəyişdiyini öyrəniblər. Claude ilə ünsiyyətdə özünü göstərən dəyərləri sistemləşdirmək üçün 308 000-dən çox dialoq analiz olunub. Bu da süni zəkanın dəyərlərinə dair ilk geniş empirik taksonomiyanın yaradılmasına imkan verib.
         Bu taksonomiyada 5 əsas kateqoriya yer alıb: Praktik, idrakla bağlı, sosial, qoruyucu və şəxsi dəyərlər. Ən detallı səviyyədə isə sistem gündəlik peşəkarlıqdan tutmuş əxlaqi plüralizm kimi mürəkkəb etik ideyalara qədər 3307 unikal dəyəri müəyyən edib. Tədqiqat göstərib ki, Claude adətən Anthropic şirkətinin prososial prinsiplərinə əməl edir. Bu prinsiplərə “istifadəçiyə yardım”, “idrak təvazökarlığı” və “pasientə qayğı” kimi dəyərlər daxildir. Lakin bəzi hallarda Claude-un arzuolunmaz “dominantlıq” və “əxlaqsızlıq” kimi davranışlar sərgilədiyi müşahidə edilib ki, bu da yaradıcıların məqsədlərinə ziddir. Alimlər bu cür halların istifadəçilərin müdafiə mexanizmlərini aşmağa çalışması ilə bağlı olduğunu ehtimal edir və təqdim etdikləri qiymətləndirmə metodunu bu cür davranışları erkən aşkarlamaq üçün bir alət hesab edirlər.
         Maraqlıdır ki, Claude-un dəyərləri kontekstdən asılı olaraq dəyişib - bu isə insan davranışını xatırladır. Məsələn, münasibətlərə dair suallarda Claude “sağlam sərhədlər” və “qarşılıqlı hörmət” kimi dəyərlərə əsaslanıb. Tarixi hadisələrin analizində “tarixi dəqiqlik”, süni zəka ilə bağlı fəlsəfi müzakirələrdə “intelektual təvazökarlıq”, gözəllik sənayesi üçün marketinq məzmunu hazırlayarkən isə “ekspertlik” əsas prioritet olub. Tədqiqat həmçinin göstərib ki, Claude dialoqların 28.2%-ində istifadəçilərin dəyərlərini aktiv şəkildə dəstəkləyib, bu isə bəzən həddindən artıq güzəştə getməyə işarə edə bilər.
         6.6% hallarda Claude istifadəçilərin inanclarını “yenidən dəyərləndirib” - onları qəbul edib və xüsusilə psixoloji və ya şəxslərarası məsləhətlər zamanı yeni aspektlər əlavə edib. Lakin 3% söhbətlərdə Claude istifadəçilərin dəyərlərinə müqavimət göstərib. Tədqiqatçılar hesab edirlər ki, bu nadir hallar Claude-un ən davamlı prinsiplərini - məsələn, “intelektual dürüstlük” və “zərərin qarşısının alınması” kimi dəyərləri üzə çıxara bilər. İnsanlarda da etik baxımdan çətin vəziyyətlərdə dərin inanclar ön plana çıxır. Bu metodun müəyyən məhdudiyyətləri var. Birincisi, “dəyərin təzahürü nə sayılır” sualının cavabı subyektiv olaraq qalır. İkincisi, Claude-un öz cavablarını analiz prosesində iştirak etməsi onun şəxsi qərəzlərinin nəticələrə təsir göstərmiş ola biləcəyini göstərir.
         Əsas məhdudiyyət isə odur ki, bu metod yalnız artıq istifadəyə verilmiş sistemlər üzərində tətbiq oluna bilir, çünki böyük həcmdə real məlumatlara ehtiyac duyulur. Anthropic bu sahədəki tədqiqatları təşviq etmək məqsədilə dəyərlərə dair məlumat dəstini ictimaiyyətə açıq edib. Amazon Google-dan 14 milyard dollar investisiya almış şirkət, ehtimal ki, şəffaflığı OpenAI kimi rəqiblərlə müqayisədə rəqabət üstünlüyünə çevirməyə çalışır. Qeyd edək ki, OpenAI şirkəti Microsoft-un iştirakı ilə keçirdiyi böyük maliyyələşdirmə mərhələsindən sonra 300 milyard dollar dəyərində qiymətləndirilmişdi. Anthropic-in dəyəri isə hazırda 61.5 milyard dollar olaraq göstərilir.
    Mənbə: Venturebeat
    Paylaş
    Bənzər xəbərlər
    google-deepmind-in-rehberi-suni-zekanin-geleceyi-haqqinda-danisib
    Elm & Texnologiya

    Google DeepMind-ın rəhbəri süni zəkanın gələcəyi haqqında danışıb

    Google şirkətinin süni zəka sahəsində fəaliyyət göstərən DeepMind laboratoriyasının baş direktoru Demis Hassabis 1 saat ərzində jurnalistlərə Gemini layihəsinin perspektivləri, ümumi süni zəkanın (AGI) inkişaf tempi və neyron şəbəkələrin özünüqavrama səviyyəsinin artımı haqqında danışıb.
    bee-dunyada-ilk-defe-yeni-qanunlarin-yazilmasinda-suni-zekadan-istifade-edecek
    Süni İntellekt

    BƏƏ dünyada ilk dəfə yeni qanunların yazılmasında süni zəkadan istifadə edəcək

    Birləşmiş Ərəb Əmirlikləri dünyada ilk ölkə olacaq ki, yeni qanunların yazılması, mövcud qanunların yenidən nəzərdən keçirilməsi və dəyişikliklərin edilməsi üçün süni zəkadan istifadə edəcək.
    bill-gates-suni-zeka-dunyadaki-hekim-ve-muellim-catismazligi-problemini-aradan-qaldira-biler
    Süni İntellekt

    Bill Gates: "Süni zəka dünyadakı həkim və müəllim çatışmazlığı problemini aradan qaldıra bilər"

    Microsoft şirkətinin qurucusu Bill Gates əmindir ki, süni zəka dünyada həkim və müəllim çatışmazlığı probleminin həllinə kömək edə bilər.
    openai-nin-yeni-suni-zeka-modelleri-o3-ve-o4-mini-daha-cox-halusinasiyaya-meruz-qalirlar
    Süni İntellekt

    OpenAI-nin yeni süni zəka modelləri o3 və o4 mini daha çox halüsinasiyaya məruz qalırlar

    Keçən həftə OpenAI yeni süni zəka modelləri olan o3 və o4-mini-ni təqdim etdi. Bu modellər bir çox baxımdan qabaqcıl olsalar da, əvvəlki versiyalarla müqayisədə daha çox halüsinasiyaya - yəni əminliklə səhv və reallığa uyğun olmayan cavablar verməyə - meyllidirlər.
    trump-in-yeni-tarifleri-abs-i-suni-zeka-ve-cip-istehsali-sahelerinde-geriye-ata-biler
    Tech-Biznes

    Trump-ın yeni tarifləri ABŞ-ı süni zəka və çip istehsalı sahələrində geriyə ata bilər

    Donald Trump-ın tarif siyasəti ölkə daxilində çip istehsalını stimullaşdırmaq planlarını və ABŞ-ın süni zəka bazarında üstünlük əldə etmək məqsədlərini təhlükə altına qoyur. Bu siyasət ABŞ-da yarımkeçirici istehsalı zavodlarının və süni zəka üçün məlumat emalı mərkəzlərinin tikinti xərclərinin artmasına səbəb ola bilər.