【新唐人北京時間2025年08月14日訊】中國公司深度求索(DeepSeek)開發的人工智能聊天機器人,因為高成本效益,曾令全球矚目。
不過,《金融時報》今天(8月14日)報導,DeepSeek在嘗試使用中共力推的華為「昇騰」芯片進行訓練時,屢遭技術問題,R2模型發布一再推遲。
多名知情人士透露,今年1月,R1模型發布後,相關部門施壓,要求DeepSeek改用國產芯片替代英偉達(Nvidia)系統,但在訓練過程中頻繁出錯,最後被迫在訓練階段換回英偉達芯片,只在推理階段保留華為平臺。
知情人士表示,R2自5月起延遲,芯片問題是主因,加上新模型所需的大量訓練數據標注耗時遠超預期,進度被進一步拖慢。華為曾派工程師團隊進駐協助,但至今未沒能在昇騰平台上完成一次成功的訓練。目前,雙方還在嘗試,讓推理階段兼容國產芯片。
業內指出,國產芯片在穩定性、互連速度、軟件生態上,都比英偉達差。加州大學伯克利分校人工智慧研究員里特維克.古普塔(Ritwik Gupta)說,華為在使用昇騰進行訓練時,正經歷「成長陣痛」,目前還沒看到在昇騰上誕生的領先模型。
報導還提到,北京當局近期要求中國科技公司,為採購英偉達H20芯片提供理由,逼企業轉用華為、寒武紀(Cambricon)等國產替代品。英偉達作為中美科技博弈焦點,已同意向美國政府上繳部分在華收入,以恢復H20芯片在中國的銷售。
《新聞直擊》製作組
(責任編輯:劉明湘)