
OpenAI səsli köməkçilər üçün nəzərdə tutulmuş GPT-Realtime adlı süni intellekt modelini təqdim edib
Süni İntellekt
29.08.2025
Emil
OpenAI GPT-Realtime adlı ən qabaqcıl modelinin buraxılışını elan edib. Bu model “speech-to-speech” prinsipi ilə işləyir. Tərtibatçılar onu səsli köməkçilər və avtomatlaşdırılmış çağrı mərkəzləri üçün real istehsalatda tətbiqə hazır alət kimi təqdim edirlər. Əsas diqqət səsli təlimatların dəqiq yerinə yetirilməsinə yönəlib. MultiChallenge (Audio) adlı bençmark testinin nəticələrinə görə, GPT-Realtime 30.5% nəticə göstərib. Müqayisə üçün, əvvəlki versiya olan gpt-4o-realtime-preview (iyun 2025) 26.5%, dekabr versiyası isə cəmi 20.6% nəticə göstərmişdi. Başqa bir testdə - ComplexFuncBench (Audio) - model əvvəlkiləri yenidən inamla qabaqlayıb: 66.5% nəticə ilə 58.9% və 49.7% göstəricilərini geridə qoyub.

Yeni sistem nitqi daha yaxşı qəbul edir, tanıma zamanı daha az səhv buraxır və səsli şəkildə deyilmiş mürəkkəb təlimatlara xeyli daha dəqiq əməl edir. Əslində, bu, dialoq əsaslı qarşılıqlı əlaqəyə söykənən bütün xidmətlər - şəxsi köməkçilərdən tutmuş dəstək xidmətlərindəki call-botlara qədər - üçün keyfiyyətcə irəliyə doğru addımdır. GPT-Realtime istifadəsinin dəyəri 1 milyon audio-giriş tokeni üçün 32$ (və 1 milyon keşlənmiş token üçün 0.40$), audio-cavabların generasiyası isə 1 milyon çıxış tokeni üçün 64$ olaraq müəyyən edilib. OpenAI-nin qeyd etdiyinə görə, model diqqətlə seçilmiş məlumatlar əsasında və xüsusi reward-sxemlərin tətbiqi ilə öyrədilib ki, bu da nitqin daha yaxşı anlaşılmasına və səhvlərin azalmasına imkan verib. Mahiyyət etibarilə, GPT-Realtime genişmiqyaslı tətbiqə tam hazır ilk səsli süni intellekt mühərriki kimi dəyərləndirilə bilər.

Paylaş