21/08/2025 16:54
DeepSeek:V3.1精度針對下一代國產芯片設計
DeepSeek今日在微信公眾號發文,宣布正式發布DeepSeek-V3.1,並特別提到V3.1大模型使用了UE8M0 FP8 Scale的參數精度。DeepSeek隨後在該文章置頂留言稱,UE8M0 FP8是針對即將發布的下一代國產芯片設計。
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內給出答案;更強的Agent能力:通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
《經濟通通訊社21日專訊》
據Deepseek介紹,此次升級主要有以下變化,混合推理架構:一個模型同時支持思考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內給出答案;更強的Agent能力:通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。
《經濟通通訊社21日專訊》
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇
-
上一篇
【AI】百度升級蒸汽機視頻生成模型,多人有聲視頻一體生成 21/08/2025 17:48
-
下一篇
【AI】投資過熱?Meta據悉已凍結人工智能部門招聘 21/08/2025 16:01
-
【AI】快手CFO:可靈AI今年收入料較年初目標翻倍 22/08/2025 09:08
-
【AI】騰訊雲CodeBuddy IDE國內版開啟公測 22/08/2025 09:05
-
【AI】智元機器人啟動「智元A計劃」,擬投入40億助創新創業 21/08/2025 18:00
-
【AI】vivo首款MR頭顯正式發布,僅重398克,暫不銷售 21/08/2025 15:36
-
【AI】DeepSeek-V3﹒1發布,思考效率等優化提升 21/08/2025 15:02