20/08/2025 09:15
DeepSeek升級並開源V3.1版本線上模型
8月19日晚間,DeepSeek宣布其線上模型版本已升級至V3.1,新版本的上下文長度拓展至128k,且增強版本已準備好進行測試。
新模型擁有更長的上下文窗口,這意味著DeepSeek能一次性記住和處理更長的文本內容,對長文檔分析、代碼庫理解、長對話保持一致性都更有幫助。DeepSeek暫未介紹模型的具體細節做,但已將模型文件上傳至Hugging Face,不過目前僅開源了未經指令微調的基礎模型,其配置文件、腳本代碼和模型權重均可供下載。
《經濟通通訊社20日專訊》
新模型擁有更長的上下文窗口,這意味著DeepSeek能一次性記住和處理更長的文本內容,對長文檔分析、代碼庫理解、長對話保持一致性都更有幫助。DeepSeek暫未介紹模型的具體細節做,但已將模型文件上傳至Hugging Face,不過目前僅開源了未經指令微調的基礎模型,其配置文件、腳本代碼和模型權重均可供下載。
《經濟通通訊社20日專訊》
【說說心理話】陳敏兒:人生有很多苦痛的經歷,但我不甘心去白受這些苦,要從中「獲利」,去學習,令苦變得有價值,再跟其他人分享► 即睇
-
上一篇
【AI】宇樹科技預告新款人形機器人,身高一米八配備31個關節 20/08/2025 09:15
-
下一篇
【AI】蘋果擴大印度iPhone產能,為美國市場生產新款手機 19/08/2025 16:09
-
【AI】智己汽車L4級Robotaxi旅遊專線在滬正式運營 20/08/2025 15:21
-
【AI】「視比特機器人」完成億元級B+輪融資 20/08/2025 10:44
-
【AI】聯儲局監管副主席鮑曼:央行對AI和加密貨幣看法將變化 20/08/2025 09:22
-
【AI】軟銀豪擲20億美元投資英特爾,成第五大股東 19/08/2025 13:32
-
【AI】特朗普政府據稱討論收購英特爾10%股份 19/08/2025 09:10