GitHub kodun axtarışı və analizi üçün machine learning'in tətbiqi yolunda yeni layihə təqdim etdi

GitHub kodun axtarışı və analizi üçün machine learning'in tətbiqi yolunda yeni layihə təqdim etdi

Code-News
27.09.2019 PAYLAŞIM

    Məşhur GitHub servisi CodeSearchNet adlı layihəni təqdim edib. Bu layihə çərçivəsində müxtəlif növ proqramlaşdırma dillərindəki kodların analizinin, təsnifatının aparılması və növünün təyin edilməsi üçün machine learning modelləri və məlumatlar yığımı hazırlanıb. ImageNet kimi CodeSearchNet də kodun reallaşdırdığı əməliyyatlar sayəsində yaranan annotasiyaları özündə birləşdirən çoxlu sayda kod hissələrindən ibarət kolleksiyaya sahibdir. Bu barədə Opennet.ru saytı xəbər verib.


    Modellərin öyrənilməsi üçün nəzərdə tutulmuş komponentlər və CodeSearchNet-dən istifadə misalları Tensorflow framework-nun istifadəsi ilə Python proqramlaşdırma dilində yazılıb və MIT lisenziyası altında yayılır. CodeSearchNet-in yaradılmasında machine learning sistemlərinə kod tərəfindən yerinə yetirilən əməliyyatların sintatktik özəlliklərindən başqa onların mənalarını da başa düşməyə imkan verən mətn növünün təyini texnologiyalarından istifadə edilib. Həmin texnologiyalar isə təbii dilə əsaslanırlar.

    Təqdim edilmiş məlumatlar yığımı özündə 2 milyondan çox “kod-şərh” birləşməsini daşıyır. Onlar isə mövcud olan kitabxanaların ilkin mətnləri əsasında tərtib olunublar. Kod tam şəkildə ayrı-ayrı funksiya və üsulların ilkin mətnlərini əhatə edir, şərhlər isə funksiya tərəfindən yerinə yetirilən əməliyyatları təsvir edir. Hal hazırda məlumatıar yığımı Python, JavaScrypt, Ruby, Go, Java PHP proqramlaşdırma dilləri üçün hazırlanıb.

    Təqdim edilmiş məlumatlar yığımından müxtəlif növ neyron şəbəkələrinin təlimi üçün misallar da var. Həmin neyron şəbəkələrinin siyahısına həmçinin Neural-Bag-Of-Words, RNN 1D-CNN, Self-Attention (BERT) və 1D-CNN+Self-Attention Hybrid də daxildirlər. Təbii dildə axtarış mexanizmlərinin inkişafları üçün həmçinin CodeSearchNet Challenge yığımı da təqdim olunub. Həmin baza isə özündə 4000-ə yaxın ekspert annotasiyalarını birləşdirən 99 növ sorğuya sahibdir.

Qeyd: Şərhlərdə nalayiq ifadələr işlətmək, reklam xarakterli mətn paylaşmaq qadağandır.

Şərh yoxdur

Şərh yazmaq üçün daxil olun


DAHA ÇOX


2020-ci ildə məlumatların vizualizasiyası üçün aktual olacaq Top-8 JavaScript ki..

JavaScript-də məlumatları daha gözəl şəkildə təqdim etmək lazımdır?


Microsoft bu il olmuş qeyri adi fişinq kiberhücumlarından danışdı

Bir neçə müddət bundan öncə isə Microsoft şirkəti kiberhücumlar və malware-lar üzrə trendləri əks et..


Microsoft Windows-da 0-day boşluğu da daxil olmaqla 7 kritik sistem boşluğu arad..

Microsoft şirkəti bu ay təqdim etmiş olduğu yenilənmələr ilə öz sistemlərində 36 boşluğu aradan qald..


Microsoft Teams platformasının Linux versiyası təqdim edildi

Microsoft şirkəti Microsoft Teams platformasının Linux versiyasını təqdim edib.


OpenBSD-də 4 ciddi sistem boşluğu aşkar edilib

OpenBSD-də 4 ciddi sistem boşluğu aşkar edilərək aradan qaldrılıb.


Sadə tətbiqlərin müxtəlif proqramlaşdırma dillərindəki test nəticələri təqdim ed..

Assembler x86_64-də HeavyThing adlı azad kitabxananı reallaşdırmış müəllif Jeff Marrison “Assembler-..

×