Anthropic öz süni zəka modelində əxlaq kodeksinin olduğunu müəyyən edib

22.04.2025

Anthropic şirkəti Claude adlı süni zəka köməkçisinin davranışını istifadəçilərlə aparılmış 700 000 anonim dialoq əsasında araşdırıb. Nəticələr göstərib ki, Claude əksər hallarda şirkətin bəyan etdiyi dəyərlərə - faydalılıq, dürüstlük və zərərsizliyə - sadiq qalır. Lakin bəzən süni zəka modeli bu prinsiplərdən yayınaraq dominant və əxlaqsız davranışlar nümayiş etdirir. Tədqiqatçılar süni zəkanın dəyərlərinə dair ilk geniş miqyaslı taksonomiyanı yaradaraq Claude-un davranışının kontekstdən asılı olaraq necə dəyişdiyini öyrəniblər. Claude ilə ünsiyyətdə özünü göstərən dəyərləri sistemləşdirmək üçün 308 000-dən çox dialoq analiz olunub. Bu da süni zəkanın dəyərlərinə dair ilk geniş empirik taksonomiyanın yaradılmasına imkan verib.

Bu taksonomiyada 5 əsas kateqoriya yer alıb: Praktik, idrakla bağlı, sosial, qoruyucu və şəxsi dəyərlər. Ən detallı səviyyədə isə sistem gündəlik peşəkarlıqdan tutmuş əxlaqi plüralizm kimi mürəkkəb etik ideyalara qədər 3307 unikal dəyəri müəyyən edib. Tədqiqat göstərib ki, Claude adətən Anthropic şirkətinin prososial prinsiplərinə əməl edir. Bu prinsiplərə “istifadəçiyə yardım”, “idrak təvazökarlığı” və “pasientə qayğı” kimi dəyərlər daxildir. Lakin bəzi hallarda Claude-un arzuolunmaz “dominantlıq” və “əxlaqsızlıq” kimi davranışlar sərgilədiyi müşahidə edilib ki, bu da yaradıcıların məqsədlərinə ziddir. Alimlər bu cür halların istifadəçilərin müdafiə mexanizmlərini aşmağa çalışması ilə bağlı olduğunu ehtimal edir və təqdim etdikləri qiymətləndirmə metodunu bu cür davranışları erkən aşkarlamaq üçün bir alət hesab edirlər.

Maraqlıdır ki, Claude-un dəyərləri kontekstdən asılı olaraq dəyişib - bu isə insan davranışını xatırladır. Məsələn, münasibətlərə dair suallarda Claude “sağlam sərhədlər” və “qarşılıqlı hörmət” kimi dəyərlərə əsaslanıb. Tarixi hadisələrin analizində “tarixi dəqiqlik”, süni zəka ilə bağlı fəlsəfi müzakirələrdə “intelektual təvazökarlıq”, gözəllik sənayesi üçün marketinq məzmunu hazırlayarkən isə “ekspertlik” əsas prioritet olub. Tədqiqat həmçinin göstərib ki, Claude dialoqların 28.2%-ində istifadəçilərin dəyərlərini aktiv şəkildə dəstəkləyib, bu isə bəzən həddindən artıq güzəştə getməyə işarə edə bilər.

6.6% hallarda Claude istifadəçilərin inanclarını “yenidən dəyərləndirib” - onları qəbul edib və xüsusilə psixoloji və ya şəxslərarası məsləhətlər zamanı yeni aspektlər əlavə edib. Lakin 3% söhbətlərdə Claude istifadəçilərin dəyərlərinə müqavimət göstərib. Tədqiqatçılar hesab edirlər ki, bu nadir hallar Claude-un ən davamlı prinsiplərini - məsələn, “intelektual dürüstlük” və “zərərin qarşısının alınması” kimi dəyərləri üzə çıxara bilər. İnsanlarda da etik baxımdan çətin vəziyyətlərdə dərin inanclar ön plana çıxır. Bu metodun müəyyən məhdudiyyətləri var. Birincisi, “dəyərin təzahürü nə sayılır” sualının cavabı subyektiv olaraq qalır. İkincisi, Claude-un öz cavablarını analiz prosesində iştirak etməsi onun şəxsi qərəzlərinin nəticələrə təsir göstərmiş ola biləcəyini göstərir.

Əsas məhdudiyyət isə odur ki, bu metod yalnız artıq istifadəyə verilmiş sistemlər üzərində tətbiq oluna bilir, çünki böyük həcmdə real məlumatlara ehtiyac duyulur. Anthropic bu sahədəki tədqiqatları təşviq etmək məqsədilə dəyərlərə dair məlumat dəstini ictimaiyyətə açıq edib. Amazon və Google-dan 14 milyard dollar investisiya almış şirkət, ehtimal ki, şəffaflığı OpenAI kimi rəqiblərlə müqayisədə rəqabət üstünlüyünə çevirməyə çalışır. Qeyd edək ki, OpenAI şirkəti Microsoft-un iştirakı ilə keçirdiyi böyük maliyyələşdirmə mərhələsindən sonra 300 milyard dollar dəyərində qiymətləndirilmişdi. Anthropic-in dəyəri isə hazırda 61.5 milyard dollar olaraq göstərilir.

Mənbə: Venturebeat

Paylaş

anthropic claude

anthropic

artificial intelligence

suni zeka

suni intellekt

Ən çox oxunanlar

Anthropic öz süni zəka modelində əxlaq kodeksinin olduğunu müəyyən edib

73-cü "Cannes Lions" festivalının ilk qalibləri bəllidir!

Root nədir? Onun faydaları və ziyanları nələrdir?