《經濟通通訊社20日專訊》8月19日晚間,DeepSeek宣布其線上模型版本已升
級至V3﹒1,新版本的上下文長度拓展至128k,且增強版本已準備好進行測試。
新模型擁有更長的上下文窗口,這意味著DeepSeek能一次性記住和處理更長的文本
內容,對長文檔分析、代碼庫理解、長對話保持一致性都更有幫助。DeepSeek暫未介紹
模型的具體細節做,但已將模型文件上傳至Hugging Face,不過目前僅開源了未經
指令微調的基礎模型,其配置文件、腳本代碼和模型權重均可供下載。(wn)
【香港好去處】2025去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇