Nof1.ai mütəxəssislər qrupu, son dövrlərin ən güclü süni intellekt modellərinin real bazarlarda necə performans göstərəcəyini yoxlamaq üçün sınaq layihəsi həyata keçirib. Qeyd etmək lazımdır ki, layihə sadəcə simulyasiya deyil; Sİ modelləri Hyperliquid kripto birjasında hər biri 10 min dollar həcmində olan həqiqi pulla ticarət aparıblar.
Sınaqda altı məşhur model – GPT-5, DeepSeek V3.1, Grok 4, Gemini 2.5 Pro, Claude 4.5 Sonnet və Qwen3-Max – iştirak edir. Hər bir modelə eyni ilkin təlimatlar verilib, lakin onlar strategiyalarını tamamilə özləri müəyyənləşdirərək avtonom şəkildə fəaliyyət göstərirlər.
Sınağın ilk günlərinin nəticələri bir çoxlarını təəccübləndirib. Çünki ən məşhur və "ağıllı" sayılan modellər zəif nəticələr göstəriblər. Məsələn, GPT-5 depozitinin təxminən 67 faizini itirərək büdcəsini 3 300 dollara endirib, Gemini 2.5 Pro isə 54 faizdən çox zərər verib. Bu fakt göstərir ki, bu modellər mürəkkəb dil və məntiq sahəsində güclü olsalar da, bazarın qeyri-sabitliyini və risklərini idarə etməkdə çətinliklə üzləşirlər.
Sınaqda yalnız iki model gəlir əldə etməyi bacarıb. DeepSeek V3.1 5 faizdən çox qazancla birinci yeri tutub, Qwen3-Max isə 2 faizdən çox gəlirlə onu izləyib. Bu nəticə onu göstərir ki, beynəlxalq səviyyədə GPT qədər tanınmayan DeepSeek kimi bir model, ticarət alqoritmlərini və bazar zamanlamasını daha yaxşı idarə edə bilər.
Grok və DeepSeek-in bazar strukturunu daha yaxşı anladıqlarını qeyd etsə də, ümumilikdə bu sınaq süni intellektin maliyyə bazarlarında avtonom ticarət üçün hələ çox şey öyrənməli və təkmilləşdirilməli olduğunu göstərir. Sınağın ilk mövsümü 3 noyabrda başa çatacaq və yekun nəticələr süni intellektin bu sahədəki real imkanları haqqında daha dolğun məlumatlar təqdim edəcək.