
Google robotları düşünməyə məcbur edən süni intellekt modellərini hazırlayıb
Süni İntellekt
29.09.2025
Emil
Google DeepMind şirkəti robot texnologiyası üçün iki yeni süni intellekt modelini təqdim edib: Gemini Robotics 1.5 və Gemini Robotics-ER 1.5. Bu modellər birlikdə elə bir yanaşmanı həyata keçirirlər ki, robot əvvəlcə tapşırığı “düşünür”, yalnız bundan sonra əməliyyatı icra edir. Texnologiya generativ süni intellekt sistemlərinə əsaslanır və hər bir konkret tapşırıq üçün uzunmüddətli sazlama tələb edən müasir robotların məhdudiyyətlərini aradan qaldırmağa yönəlib. Mətn, şəkil, audio və hətta video yarada bilən generativ süni intellekt sistemləri getdikcə daha geniş yayılır. Necə ki, bu modellər müxtəlif tip məlumatları yaradır, eyni zamanda robotlar üçün əməliyyat ardıcıllığı da təqdim edə bilirlər. Google DeepMind tərəfindən təqdim edilmiş Gemini Robotics layihəsi də məhz bu prinsip üzərində qurulub. Bu layihə çərçivəsində iki bir-birini tamamlayan model təqdim olunub ki, bunlar robotlara hərəkət etməzdən öncə “düşünmək” imkanı verir.

Ənənəvi böyük dil modellərinin (LLM) müəyyən məhdudiyyətləri olsa da, simulyasiya edilmiş məntiqi düşüncə mexanizminin tətbiqi onların imkanlarını əhəmiyyətli dərəcədə genişləndirib. İndi isə oxşar irəliləyişin robot texnologiyasında da baş verməsi mümkündür. Google DeepMind komandası hesab edir ki, generativ süni intellekt robot texnologiyasını köklü şəkildə dəyişdirərək onlara universal funksionallıq təmin edə bilər. Müasir sistemlərdən fərqli olaraq, hansı ki, bir dar ixtisaslaşmış tapşırıq üçün aylarla sazlama tələb edir və yeni şəraitə zəif uyğunlaşır, yeni süni intellekt yanaşmaları robotların tanış olmayan mühitlərdə yenidən proqramlaşdırmaya ehtiyac olmadan işləməsinə imkan yaradır. DeepMind-də robototexnika istiqamətinin rəhbəri Carolina Parada qeyd edib ki, bu gün robotlar son dərəcə ixtisaslaşmış və tətbiqdə çətin vəziyyətdədirlər.

Konsepsiyanın həyata keçirilməsi üçün DeepMind Gemini Robotics-ER 1.5 və Gemini Robotics 1.5 modellərini hazırlayıb. Birinci model - “görmə-dil” (VLM) modeli olub, embodied reasoning (bədənləşdirilmiş məntiqi düşüncə) funksiyasına malikdir. O, vizual və mətn məlumatlarını təhlil edir, tapşırığın addım-addım icra planını formalaşdırır və konteksti dəqiqləşdirmək üçün Google axtarışı kimi xarici alətləri qoşa bilir. İkinci model isə “görmə-dil-əməl” (VLA) modelidir. Bu model alınan təlimatları robotun fiziki hərəkətlərinə çevirir, eyni zamanda onları vizual geribildirim və hər addım üzrə öz “düşünmə” prosesinə əsasən tənzimləyir. DeepMind-dən Kanishka Rao-nun sözlərinə görə, əsas irəliləyiş robotun insanın intuitiv məntiqi düşüncəsini təqlid edə bilməsi, yəni hərəkət etməzdən əvvəl düşünmə qabiliyyətinə malik olmasıdır.
Tərtibatçılar yeni modellərin necə işlədiyini əyani şəkildə nümayiş etdiriblər: Gemini Robotics 1.5 ilə təchiz edilmiş humanoid (insanabənzər) robot Apollo videoda səyahət üçün əşyaları yığır, digər robot Aloha 2 isə, daha dəqiq desək, cüt robot qolu vasitəsilə tullantıları çeşidləyir. Hər iki model Gemini əsas arxitekturasına söykənir, lakin əlavə olaraq fiziki dünya ilə qarşılıqlı əlaqəni əks etdirən məlumatlar üzərində təlim keçirilib. Bu, robotlara mürəkkəb və çoxmərhələli tapşırıqları yerinə yetirməyə imkan verir və onları müstəqil agentlər səviyyəsinə yaxınlaşdırır. Bununla yanaşı, sistem kross-platforma uyğunluğunu nümayiş etdirir.
Xüsusilə, bir robota tətbiq edilən bacarıqlar, məsələn, iki qollu Aloha 2 üzərində, heç bir əlavə mexaniki tənzimləmə olmadan digərinə, o cümlədən humanoid Apollo-ya ötürülə bilər. Texnoloji irəliləyiş ehtimalına baxmayaraq, texnologiyanın praktik tətbiqi hələ ki, məhduddur. Robotların idarəsindən cavabdeh olan Gemini Robotics 1.5 modeli yalnız etibarlı test iştirakçıları üçün əlçatandır. Eyni zamanda Gemini Robotics-ER 1.5 artıq Google AI Studio-ya inteqrasiya olunub ki, bu da tərtibatçılara fiziki reallıqda həyata keçirilən robotlarla öz təcrübələri üçün təlimatlar yaratmaq imkanı verir. Lakin gündəlik tapşırıqları yerinə yetirə bilən məişət robotlarının yaranmasına hələ xeyli yol qət olunmalıdır.
Paylaş