Mira Murati tərəfindən qurulan Thinking Machines Lab startapı, dil modellərini, o cümlədən "çoxekspertli" arxitekturaya malik böyük modelləri əlavə öyrətmək (doобучение) üçün nəzərdə tutulmuş ilk məhsulu – "Tinker" API-ni təqdim edib.
Hazırda "Tinker"in beta versiyası tədqiqatçılar və proqramçılar arasında qapalı rejimdə sınaqdan keçirilir və istifadə etmək istəyənlər üçün gözləmə siyahısı mövcuddur. API Python proqramlaşdırma dili üzərində işləyir.
Servis hazırda Çinin Alibaba şirkətindən olan Qwen 3-ün müxtəlif versiyalarını və Meta şirkətindən olan Llama 3.1, 3.2 və 3.3 modellərini dəstəkləyir. Bütün dəstəklənən modellər açıq mənbəli kodu ilə fəaliyyət göstərir və gələcəkdə bu siyahının genişləndiriləcəyi bildirilir.
Əlavə öyrətmə prosesi LoRA (Low-Rank Adaptation) metodu ilə həyata keçirilir. Bu metod ilkin dil modelinin bütün parametrlərini dəyişdirmək əvəzinə, mövcud arxitekturaya yığcam əlavələr edir, bununla da hesablama resurslarına qənaət olunur.
İstifadəçilərin "Tinker" API-dən istifadə etməsi üçün nümunə məlumat dəsti tələb olunur (tövsiyə olunan həcm göstərilməyib). Əlavə öyrətmə prosesinin özü isə birbaşa Thinking Machines Lab-ın Sİ-infrastrukturunda həyata keçirilir. Şirkət bu zaman resursları özü paylayır və sistemdə yarana biləcək problemlərin (sboev) aradan qaldırılmasına nəzarət edir. İstifadəçilər sonda əlavə öyrədilmiş modelin parametrlərini (weights) yükləyə bilərlər.
Startap API ilə yanaşı, onun üzərində işləyəcək hazır alqoritmləri ehtiva edən Tinker Cookbook adlı kitabxananı da yayımlayıb.
Qeyd edək ki, "Tinker" servisi ilkin mərhələdə tamamilə pulsuz təklif olunur, lakin startap "növbəti həftələrdə" istifadə həcminə bağlı olaraq ödənişli sistemə keçəcəyini bəyan edib. Thinking Machines Lab cəmi 2025-ci ilin iyul ayında 2 milyard dollar yatırım alaraq, ümumi dəyərlənməsini 12 milyard dollar səviyyəsinə çatdırmışdı.