
Ilustracija / Foto Solen Feyissa on Unsplash
povezane vijesti
Kineska kompanija za umjetnu inteligenciju DeepSeek u četvrtak je objavila novu inačicu svog glavnog modela V3, naglasivši da novi model, uz veću brzinu obrade podataka, ima i značajku koja ga može optimizirati za čipove proizvedene u Kini.
Usmjerenost na kompatibilnost s kineskim čipovima mogla bi signalizirati nastojanja DeepSeeka da svoje modele umjetne inteligencije uklopi u sustav naprednih čipova koji se trenutno razvija u Kini, dok službeni Peking nastoji zamijeniti američku tehnologiju zbog izvoznih ograničenja koje je uveo Washington.
Početkom ove godine DeepSeek je zatresao tehnološki sektor svojim modelima AI‑ja koji nude niže operativne troškove, uz manju potrošnju struje, vode i čipova, a značajkama konkuriraju zapadnim modelima poput ChatGPT‑ja američkog OpenAI‑ja.
Nova inačica treća je u nizu, a uslijedila je nakon ranijeg ažuriranja modela V3 u ožujku te nakon ažuriranja modela R1 u svibnju.
Kad je riječ o prilagodbi lokalno proizvedenim čipovima, iz DeepSeeka su na društvenoj mreži WeChat objavili da je format obrade podataka UE8M0 FP8 na kojem funkcionira model DeepSeek-V3.1 optimiziran za “domaće čipove nove generacije koji će uskoro biti pušteni na tržište”.
Kompanija nije objavila koji će konkretno modeli čipova ili proizvođači biti podržani.
Naziv FP8 odnosi se na format obrade podatka koji modelima umjetne inteligencije omogućuje učinkovitiji rad, budući da upotrebljava manje memorije, a radi brže nego tradicionalne metode.
Inačica DeepSeek-V3.1 odlikuje se hibridnom strukturom zaključivanja, koja modelu omogućuje dva načina rada, s i bez rasuđivanja, objavila je kompanija u četvrtak na društvenoj mreži WeChat.
Korisnici mogu uključivati i isključivati dva načina rada s pomoću gumba “duboko razmišljanje” (“deep thinking”) u službenoj aplikaciji i na internetskoj platformi kompanije, na kojima se sada upotrebljava inačica V3.1.
Osim toga, kompanija će od 6. rujna prilagoditi cijene korištenja API‑ja, platforme koja razvojnim programerima omogućuje da u svoje proizvode integriraju DeepSeekove modele umjetne inteligencije, navodi se u izjavi.