ABŞ-nin Karnegi Mellon Universitetinin tədqiqatçıları, mətn təsvirlərindən fiziki cəhətdən sabit LEGO konstruksiyaları yarada bilən yeni süni intellekt modeli LegoGPT-ni təqdim ediblər. Bu model, istifadəçilərin sadə mətn sorğularına əsaslanaraq real həyatda qurula bilən LEGO dizaynları yaradır.
LegoGPT, Meta-nın LLaMA-3.2-1B-Instruct adlı böyük dil modelinin modifikasiyasıdır. Model, "növbəti söz" əvəzinə "növbəti kərpic" proqnozlaşdırmaqla işləyir və fiziki sabitliyi təmin etmək üçün əlavə riyazi moduldan istifadə edir. Bu modul, struktural qüvvələri və cazibə qüvvəsini nəzərə alaraq sabitliyi təmin edir. (
Tədqiqatçılar, LegoGPT-ni 47,000-dən çox sabit LEGO strukturu və onların təsvirlərini əhatə edən StableText2Lego adlı məlumat dəsti ilə öyrədiblər. Bu məlumat dəsti, müxtəlif LEGO obyektlərinin 3D modellərini və onların detallı təsvirlərini ehtiva edir.
LegoGPT-nin əsas xüsusiyyətlərindən biri, fiziki sabitliyi təmin etmək üçün "physics-aware rollback" sistemidir. Bu sistem, yaradılan dizaynların sabitliyini yoxlayır və qeyri-sabit elementləri geri qaytararaq yenidən dizayn edir. Bu yanaşma, modelin sabit dizaynlar yaratma qabiliyyətini əhəmiyyətli dərəcədə artırır.
Hazırda LegoGPT, 20x20x20 ölçülü grid daxilində və səkkiz əsas LEGO kərpici növü ilə dizaynlar yarada bilir. Model, həm insan tərəfindən, həm də robotlar tərəfindən qurula bilən dizaynlar təqdim edir. Tədqiqatçılar, gələcəkdə modeli daha böyük və mürəkkəb dizaynları dəstəkləyəcək şəkildə genişləndirməyi planlaşdırırlar.
LegoGPT-nin kodu və məlumat dəsti açıq mənbə olaraq GitHub-da mövcuddur və ictimaiyyət üçün pulsuz istifadəyə açıqdır. İstifadəçilər, sadə mətn təsvirləri ilə öz LEGO dizaynlarını yarada və onları real həyatda qura bilərlər.