DeepSeek, daha az hesablama gücü tələb edən və "eksperimental" adlandırdığı yeni böyük dil modeli olan DeepSeek-V3.2-Exp-i təqdim edib. Şirkət bu yeniliyi "gələcək nəsil arxitekturalara keçid yolunda aralıq mərhələ" kimi xarakterizə edir.
Yeni modelin əsas üstünlüyü odur ki, o, əvvəlki versiyalara nisbətən daha aşağı xərclərlə təlim edilə (öyrədilə) bilir. Bu, DeepSeek-ə Sİ-nin inkişaf və istifadə xərclərini azaltmağa kömək edəcək. Üstəlik, model uzun mətnləri (məsələn, böyük həcmli sənədləri və ya uzun dialoqları) emal etməkdə daha bacarıqlı olacağını vəd edir.
Modelin bu qənaətcil və effektiv olmasının sirri isə DeepSeek Sparse Attention (Seyrək Diqqət Mexanizmi) texnologiyasıdır. Bu mexanizm, modelin mətndəki bütün məlumatlara deyil, yalnız ən əsas hissələrə diqqət yetirməsini təmin edir. Nəticədə, əməliyyat xərcləri xeyli azalır, amma performans səviyyəsi qorunur və hətta bəzi sahələrdə yaxşılaşır.
Bu elandan dərhal sonra DeepSeek, öz API (proqram təminatı interfeysi) xidmətlərinin qiymətində 50%-dən çox endirim etdiyini açıqladı. Bu, onların texnologiyasından istifadə etmək istəyən developerlər və şirkətlər üçün böyük bir güzəştdir.
Yeni model, hələlik DeepSeek-in bazarı sarsıdan R1 və V3 kimi əvvəlki nəhəng modelləri qədər böyük təsir gözləməsə də, uğurlu çıxarsa, həm Çindəki rəqibləri (məsələn, Alibaba-nın Qwen-i), həm də qlobal Sİ lideri olan OpenAI kimi şirkətlərə ciddi rəqabət təzyiqləri yarada bilər. Çünki daha ucuz və daha səmərəli modellər Sİ sənayesində qaydaları dəyişmə potensialına malikdir.