ABŞ-nin qeyri-kommersiya tədqiqat institutu Allen Institute for AI (AI2) tərəfindən təqdim olunan Olmo 2 1B yeni süni intellekt modelini təqdim edib. AI2-nin məlumatına görə, bu model öz kateqoriyasındakı digər nəhəng texnologiya şirkətlərinin — Google, Meta və Alibaba-nın analoji ölçülü modellərini bir sıra göstəricilər üzrə geridə qoyub.
Olmo 2 1B cəmi 1 milyard parametrə sahib bir dil modelidir. Süni intellekt sahəsində “parametr” anlayışı modelin öyrəndiyi və qərarvermə prosesində istifadə etdiyi əsas daxili komponentlərə deyilir. Bu baxımdan modelin ölçüsü onun parametrlərinin sayı ilə müəyyən olunur. Olmo 2 1B kiçik ölçüsünə baxmayaraq, GSM8K (riyazi düşünmə bacarığını ölçən) və TruthfulQA (faktiki düzgünlüyü qiymətləndirən) kimi testlərdə Google-un Gemma 3 1B, Meta-nın Llama 3.2 1B və Alibaba-nın Qwen 2.5 1.5B modellərindən üstün nəticələr göstərib.
Model açıq kodludur və Apache 2.0 lisenziyası ilə Hugging Face platformasında istifadəyə təqdim olunub. Ai2 bu modelin təkcə kodunu deyil, həm də onun öyrədilməsi zamanı istifadə olunan məlumat dəstlərini — Olmo-mix-1124 və Dolmino-mix-1124 — ictimaiyyətə açıq şəkildə təqdim edib. Bu xüsusiyyət tədqiqatçılara və proqramçılara modeli sıfırdan yenidən qurmaq və öz layihələrində rahat şəkildə istifadə etmək imkanı verir.
Olmo 2 1B-nin əsas üstünlüklərindən biri də onun kompakt ölçülü olmasıdır. Kiçik dil modelləri, nəhəng modellərlə müqayisədə, daha az hesablama gücünə ehtiyac duyur və buna görə də daha az resurs tələb edən mühitlərdə — məsələn, adi noutbuklarda və bəzi mobil cihazlarda belə problemsiz istifadə oluna bilir. Bu, xüsusilə fərdi proqramçılar və süni intellekt sahəsində yenicə fəaliyyətə başlayanlar üçün əlverişlidir.
Ai2 bildirir ki, modelin hazırlanması zamanı 4 trilyon tokenlik verilənlər bazasından istifadə olunub. Bu verilənlər bazasına həm insan tərəfindən yazılmış, həm süni intellekt tərəfindən yaradılmış, həm də açıq mənbələrdə yerləşdirilmiş məlumatlar daxildir. Müqayisə üçün qeyd edək ki, 1 milyon token təqribən 750 min sözə bərabərdir.
Bununla belə, Ai2 Olmo 2 1B modelinin kommersiya məqsədilə istifadəsini tövsiyə etmir. Qurum qeyd edir ki, model digər süni intellekt sistemləri kimi zərərli, həssas və faktlara uyğun olmayan məzmun yarada bilər. Bu səbəbdən istifadəçilərə modeldən istifadə zamanı ehtiyatlı davranmaq tövsiyə olunur.