Logo
    main-post-cover

    OpenAI süni intellekt əsaslı Sora 2 video generatorunu təqdim edib (VİDEO)

         OpenAI video və audio generasiyası üçün flaqman süni intellekt modeli Sora 2-ni təqdim edib. Şirkət bunu orijinal Sora ilə müqayisədə böyük keyfiyyət sıçrayışı kimi təqdim edir və mətn generasiyası üçün inqilabi olan GPT-3.5 ilə müqayisə edir. Şirkətin qeyd etdiyinə görə, yeni model süni intellektin dünya simulyasiyasını o səviyyəyə yaxınlaşdırır ki, süni intellekt obyektlərin fizikasını və dinamikasını demək olar insan kimi “anlamağa” başlayır. Əgər əvvəlki video generasiya modelləri tez-tez inandırıcı “şəkil” yaratsalar da, hərəkətlərin elementar məntiqinin öhdəsindən gələ bilmirdilər - məsələn, basketbol topunu səbətə dəymədikdə belə onu səbət daxilinə “teleportasiya” edə bilirdi - Sora 2 isə obyektlərin məhz davranışını modelləşdirir. Məsələn, atış dəqiq deyilsə, top lövhədən geri sıçrayır. Hər hansısa fəndi yerinə yetirən fiqurçu səhv edə və yıxıla bilər.
         Sistem təkcə uğuru deyil, həm də uğursuzluğu imitasiya etməyi öyrənib - bu isə real dünya simulyatorları və irəliləmiş robotların yaradılması üçün əsas tələbdir. Tərtibatçılar bildirirlər ki, artıq obyektlərin qəribə deformasiyası və səhnə məntiqinin pozulması prompta uyğunluğu təmin etmək naminə baş verməyəcək. Nəzarətolunma OpenAI tərəfindən vurğulanan digər bir məqamdır. Sora 2 modeli mürəkkəb çoxmərhələli səhnələrin öhdəsindən inamla gəlir, obyektlərin, məkanların və işığın ziddiyyətsiz vəziyyətini qoruyur. Məsələn, fiqurçu başında pişiklə bir neçə elementdən ibarət çətin proqramı icra edir və ya anime qəhrəmanı möhtəşəm bir döyüşə qatılır. Bütün bunlar - dünyanın bütövlüyü, kadrların əlaqəliliyi və hətta personajların üzündəki emosiyaların saxlanılması ilə həyata keçirilir. Sora 2 bir neçə üslubla işləməyi bacarır: realist, kinematoqrafik və anime.
         Video və audio generasiyası üçün universal sistem kimi, Sora 2 mürəkkəb fon səs landşaftlarını, danışığı və səs effektlərini yüksək dərəcədə realistik şəkildə yarada bilir. Bunun üçün qısa bir video yazısı kifayətdir: model zahiri görkəmi, mimikanı və hətta səsi dəqiq şəkildə təkrarlayır və onları istənilən səhnəyə təbii şəkildə inteqrasiya edir. OpenAI-in press-relizində qeyd olunur ki, bu imkan universaldır və istənilən insan, heyvan və ya obyekt üçün işləyir. Sora 2-nin təqdimatı ilə eyni vaxtda OpenAI sosial iOS tətbiqi olan Sora-nı da istifadəyə verir. Burada istifadəçilər videolar yarada və dostları ilə bölüşə, həmçinin bir-birinin işlərinə remiks edə, fərdiləşdirilə bilən Sora lentində yeni videolar tapa və cameo funksiyası vasitəsilə özlərini və ya dostlarını əlavə edə biləcəklər.
         Cameo funksiyası sayəsində Sora-da istənilən səhnəyə heyrətamiz dəqiqliklə daxil olmaq mümkündür - bunun üçün sadəcə tətbiqin özündən qısa video və səs yazmaq kifayətdir. Bu həm şəxsiyyəti təsdiqləməyə, həm də obrazı tutmağa xidmət edir. “Keçən həftə biz tətbiqi OpenAI daxilində işə saldıq. Həmkarlarımız artıq bizə bildirdilər ki, bu funksiya sayəsində şirkətdə yeni dostlar qazanıblar. Biz hesab edirik ki, cameo funksiyası ətrafında qurulan sosial tətbiq Sora 2-nin bütün sehrini hiss etməyin ən yaxşı yoludur” - deyə OpenAI press-relizində qeyd edib. OpenAI vurğulayıb ki, etik və məsuliyyətli istifadə yeni platformanın vacib hissəsi olacaq. İstifadəçi özü qərar verəcək ki, onun cameo-sundan kim və necə istifadə edə bilər.
         İstifadəçinin iştirakı ilə yaradılan istənilən videonu istənilən vaxt silmək mümkündür. Zərərli məzmunlu və ya insanların razılığı olmadan yaradılmış kontent isə alqoritmlər və moderatorlar səviyyəsində bloklanır. Sora tətbiqi artıq ABŞ və Kanadadakı iPhone istifadəçiləri üçün yükləməyə açıqdır, qeydiyyat isə dəvət sistemi vasitəsilə həyata keçirilir. Bir neçə həftədən sonra Sora 2 veb-versiyada da əlçatan olacaq. Əsas versiya pulsuzdur və geniş limitlərə malikdir, ChatGPT Pro abunəçiləri isə yaxın zamanda daha yüksək keyfiyyətli təcrübi Sora 2 Pro modelinə çıxış əldə edəcəklər. Monetizasiya hələlik aydın deyil: yeganə plan - yüksək tələbat zamanı əlavə generasiyalara görə ödəniş almaqdır. Xidmətin coğrafiyasının genişləndirilməsi və API vasitəsilə çıxışın açılması isə yaxın planlara daxildir.
    Paylaş