Az | EN

Alibaba yeni süni intellekt modeli təqdim edib: Qwen3

Nigar Sultanli
29 Aprel 2025 10:07
54 baxış
Alibaba yeni süni intellekt modeli təqdim edib: Qwen3

Alibaba “c” kimi yeni süni intellekt modelləri ailəsini təqdim edib. Şirkətin verdiyi məlumata görə, bu modellər bəzi hallarda OpenAI və Google-un ən qabaqcıl modelləri ilə rəqabət aparmaqla yanaşı, müəyyən göstəricilər üzrə onları üstələyə bilir.

“Qwen3” ailəsinə daxil olan modellər — və ya çox yaxın zamanda daxil olacaq modellər — süni intellekt inkişaf platforması olan Hugging Face və GitHub vasitəsilə "açıq lisenziya" əsasında istifadəyə təqdim olunacaq. Modellərin ölçüsü 0.6 milyard parametrlə 235 milyard parametr arasında dəyişir. Parametrlər modelin problem həll etmə qabiliyyətinə birbaşa təsir edir və adətən daha çox parametrə malik modellər daha yüksək performans göstərir.

Çin mənşəli bu cür inkişaflar ABŞ-da yerləşən laboratoriyalara, o cümlədən OpenAI-ya daha güclü texnologiyalar təqdim etmək üçün əlavə təzyiqlər yaradır. Eyni zamanda, bu dinamika ABŞ siyasətçilərini Çin şirkətlərinin süni intellekt üçün vacib olan çiplərə çıxışını məhdudlaşdırmağa sövq edir.

Alibaba-nın açıqlamasına görə, “Qwen3” modelləri "hibrid" yanaşmaya əsaslanır. Bu o deməkdir ki, modellər həm sadə suallara sürətlə cavab verə bilir, həm də daha mürəkkəb problemləri "düşünərək" və "məntiq yürüdərək" həll edə bilir. Bu "məntiq yürütmə" qabiliyyəti modellərə öz cavablarını müəyyən dərəcədə faktlarla yoxlamağa imkan verir, lakin bunun müqabilində gecikmə (latency) arta bilər.

"Biz düşünmə və düşünməmə rejimlərini problemsiz şəkildə birləşdirmişik və istifadəçilərə düşünmə büdcəsini idarə etmək imkanı vermişik," — deyə Qwen komandası bloq yazısında qeyd edib. "Bu dizayn istifadəçilərə tapşırıq növünə uyğun fərqli büdcə konfiqurasiyalarını asanlıqla tənzimləməyə imkan verir."

Bəzi “Qwen3” modelləri "ekspertlər qarışığı" (MoE — Mixture of Experts) arxitekturasından istifadə edir. Bu yanaşma vəzifələri alt-vəzifələrə bölərək hər birini xüsusi ixtisaslaşmış "ekspert" modellərə tapşırır və beləliklə, hesablama baxımından daha səmərəli olur.

Alibaba bildirir ki, “Qwen3” modelləri 119 dili dəstəkləyir və təxminən 36 trilyon tokenlik məlumat bazasında hazırlanıb. Tokenlər modelin emal etdiyi xam məlumat vahidləridir; təxminən 1 milyon token 750 min sözə bərabərdir. Təlim materialına dərsliklər, sual-cavab cütləri, kod parçaları, süni intellekt tərəfindən yaradılmış mətnlər və digər müxtəlif mənbələr daxildir.

Bu təkmilləşdirmələr “Qwen3” modellərinin əvvəlki nəsil — “Qwen2” modelləri ilə müqayisədə imkanlarını əhəmiyyətli dərəcədə artırıb. Hərçənd “Qwen3” modelləri OpenAI-nın o3 və o4-mini modellərindən "tamamilə üstün" olmasa da, kifayət qədər rəqabətqabiliyyətlidir.

Məsələn, proqramlaşdırma üzrə yarış platforması olan Codeforces-un nəticələrinə görə, ən iri model — Qwen-3-235B-A22B — OpenAI-nın o3-mini və Google-un Gemini 2.5 Pro modellərini azacıq da olsa geridə qoyub. Həmçinin, Qwen-3-235B-A22B çətin riyazi test olan AIME və "məntiq yürütmə bacarığını" ölçən BFCL testlərində də o3-mini modelini qabaqlayıb.

Lakin qeyd edək ki, Qwen-3-235B-A22B hələlik ictimaiyyət üçün əlçatan deyil.

Hazırda açıq şəkildə təqdim olunan ən iri model, Qwen3-32B, bir sıra digər qabaqcıl açıq və qapalı modellərlə müqayisədə rəqabətə davamlıdır. Bu model, məsələn, OpenAI-nın o1 modelini müxtəlif sahələrdə, o cümlədən kodlaşdırma testləri olan LiveCodeBench-də üstələyib.

Alibaba həmçinin qeyd edir ki, “Qwen3” modelləri alətlərdən istifadə bacarıqlarında (“tool-calling”), təlimatlara əməl etməkdə və konkret məlumat formatlarını düzgün kopyalamaqda yüksək nəticələr göstərir. Bundan əlavə, modellər Fireworks AI və Hyperbolic kimi bulud xidmətləri vasitəsilə də istifadə üçün əlçatandır.

Süni intellekt bulud platforması Baseten-in təsisçisi və CEO-su Tuhin Srivastava TechCrunch-a verdiyi açıqlamada bildirib: “Qwen3 modelləri açıq sistemlərin qapalı mənbəli sistemlərlə ayaqlaşa bildiyini bir daha sübut edir. ABŞ Çinə çip satışlarını və Çindən alışları məhdudlaşdırmağa çalışsa da, belə qabaqcıl və açıq modellər daxildə geniş istifadə olunacaq. Bu, bizneslərin həm öz alətlərini qurduğunu, həm də bazardan hazır həllər aldığını göstərir."

© copyright 2022 | tech.az | info@tech.az