A kép forrása: Blikk
A DeepSeek létezéséről ugyan korábban is tudtak a szakma bennfentesei, de a kínai AI-stratup csak nemrégiben robbantott bombát azzal, hogy R1-es nagy nyelvi modellje lenyomta az élenjáró nyugati konkurenseit. Azóta is folyik az okok és a háttér kutatása, hátha sikerül rátalálni, hogy egy „kínai sufniban, a kredenc sarkán” hogyan sikerült világverő technológiát összedrótozni. Íme két újabb adalék a hangcsoui csodához.
Alexander Doria a DeepSeek-nek tulajdonította a nagy nyelvi modellt, melyet korábban Nvidia H100 chipen, majd Huawei Ascend 910C chipen működtet. A Huawei szeretné hazai hardverre alapozni a működést, csökkentve a költségeket. A DeepSeek vizsgálja a chip teljesítményét, hogy az Ascend 910C-n is hatékonyan működjön. Felmerült, hogy a 910C kevésbé teljesítményes és hiányzik belőle a szükséges összekapcsolódás. A DeepSeek tervezi következő AI-modelljét 32 ezer Huawei 910C chip segítségével kialakítani.