A kínai mesterséges intelligencia (AI) induló DeepSeek sikerének első jelentős vesztesége Nvidia-ként bizonyult, amelynek részvényei hétfőn 17 % -kal esett vissza attól tartva, hogy a Hangzhou-alapú cég innovációi csökkenthetik az iparág támaszkodását az amerikai cég fejlett chipjeire. Miközben az NVIDIA kedden visszapattant az előzetes kereskedelemben, az elemzők megjegyezték a vállalat szerepének észlelését a grafikus feldolgozó egységek (GPU) által vezérelt költséges AI fejlődésben, fenyegetve a világ egyik legértékesebb technológiai titánját.
Mit ért el a DeepSeek?

A DeepSeek azt állítja, hogy a V3 modelljét csak 2 048 NVIDIA H800 GPU-n képezte elő, két hónapos időszak alatt, mindegyik chip óránként kb. 2 dollárba kerül. A V3 modell teljes képzési költsége 5,5 millió USD volt, 2,8 millió GPU órával, jóval kevesebb, mint a rivális modellek. Eközben a hónap elején kiadott nyílt forráskódú érvelési modellje, az R1, az Openai, az Antropic és a Google fejlettebb modelljeivel összehasonlítható képességeket mutatott be, de lényegesen alacsonyabb képzési költségekkel.
A DeepSeek bizonyítja, hogy az nvidia chipek nem nélkülözhetetlenek?
Még nem. A DeepSeek alapítója, Liang Wenfeng, egy 2023-as interjúban a kínai média későipostjával elmondta, hogy a vállalat fokozatosan felépítette a 10-nél nagyobb készleteket, 000 Nvidia GPU-k, így a kiszámítási erőforrások egyik legfontosabb tulajdonosa a kínai AI induló vállalkozások között. Egy 2024 júliusban készített interjúban Liang elmondta, hogy a vállalat fő problémája nem pénz, hanem hozzáférés a fejlett amerikai chipekhez, amelyek korlátozódnak a Kínába történő exporttól, kiemelve a hardver fontosságát.
Míg a DeepSeek modellek lenyűgöző eredményeket hoztak, addig a vállalat hiánya a vezető AI gyorsítókhoz, mint például az NVIDIA Best Hopper és a Blackwell termékek, kihívást jelenthet hosszú távú képességének, hogy lépést tartson a nagynyelvű modell teljesítményében az amerikai társaikkal.
Az NVIDIA hétfőn válaszolt a kínai AI cég által generált hype -re, mondván, hogy előrelépései azt mutatják, hogy a GPU -k hasznosak a kínai piacon, és hogy a jövőben több chipsre lenne szükség a DeepSeek szolgáltatásai iránti igény kielégítéséhez.
A DeepSeek helyi alternatívákat használ a modellek kiképzéséhez?
A DeepSeek AI áttörésének egyik legmegtiszteltebb területe az, hogy az edzés során használ-e valamelyik Kína által készített félvezetőt. Jelek voltak, hogy a hardverbeállítás részét tartalmazza a Huawei Technologies Ascend Ai Chips, amely a kínai Nvidia chipek legfontosabb alternatívája. Mik a jelek?
Tanulhatnak -e az amerikai AI cégek a DeepSeek -től a költségek csökkentése érdekében?
Ha az amerikai nagy technológiai vállalatok elkezdenek tanulni a DeepSeek -től, és olcsóbb AI -megoldásokat választanak, ez nyomást gyakorolhat az NVIDIA -ra. Wei Sun, a CounterPoint Research AI fő elemzője elmondta, hogy az NVIDIA eladás tükrözi az AI fejlődésének változó észlelését.
"A DeepSeek sikere megkérdőjelezi azt a hitet, hogy a nagyobb modellek és a több számítástechnikai energia jobb teljesítményt nyújtanak, és veszélyt jelentenek az NVIDIA GPU-vezérelt növekedési stratégiájára"-mondta.




