Az | EN

ByteDance GPT-4o səviyyəli şəkil redaktə modeli "Bagel"i təqdim edib

Nigar Sultanli
27 May 2025 10:10
102 baxış
ByteDance GPT-4o səviyyəli şəkil redaktə modeli "Bagel"i təqdim edib

Çin texnologiya şirkəti ByteDance yeni təqdim etdiyi Bagel süni intellekt modelini ictimaiyyətə təqdim edib və onun mənbə kodunu GitHub və HuggingFace platformalarında yerləşdirib.

Bagel modeli əsasən şəkillərlə işləmək üçün nəzərdə tutulub və istifadəçilərə şəkil yaratmaq, redaktə etmək, qrafikləri analiz etmək və vizual materiallar haqqında ətraflı izahlar vermək imkanları yaradır. Modelin 7 milyard parametri var və yaradıcı funksiyaları ilə diqqət çəkir. Bagel-ə təqdim edilən şəkil əsasında realistik dəyişikliklər etmək və onun tərkibindəki üslubu və əsas elementləri qoruyaraq yenidən təqdim etmək mümkündür. Məsələn, məşhur Mona Liza əsəri üzərində aparılan redaktələr zamanı model əsərin bədii xüsusiyyətlərini saxlaya bilmişdir.

Modelin diqqətçəkən funksiyalarından biri də onun foto əsasında anime tərzində illüstrasiyalar və ya 3D fiqurlar yaratmaq imkanlarıdır. Həmçinin istifadəçi modeldən bir əşyanı "açmaq", yəni onun detallarını vizual şəkildə genişləndirmək və saxlanılmış naxış və dizaynı qorumaq kimi mürəkkəb tapşırıqlar yerinə yetirməsini istəyə bilər.

Bagel modeli ilə "mülahizə rejimi" adlı funksiyanı aktivləşdirməklə, istifadəçi bir görüntü haqqında daha dərindən analiz və aydınlaşdırmalar ala bilər. Şirkətin bildirdiyinə görə, bu modelin imkanları OpenAI tərəfindən yaradılmış GPT-4o və Google-un Gemini 2.0 modelləri ilə müqayisə oluna bilər.

Hazırda təqdim olunan demo versiya pulsuzdur, lakin bəzi hallarda yavaş işləməsi və fasilələrlə üzləşməsi mümkündür. Daha sabit işləmə və şəxsi layihələrə inteqrasiya üçün istifadəçilərə modeli lokal kompüterdə quraşdırmaq tövsiyə olunur.

ByteDance-in bu addımı süni intellekt texnologiyalarına açıq mənbə vasitəsilə töhfə vermək niyyətini göstərir və şirkətin bu sahədəki innovativ potensialını ortaya qoyur.

© copyright 2022 | tech.az | info@tech.az