19/09/2025 15:18

【AI】華為與浙大發布安全版DeepSeek模型,有害言論、政治敏感內容等防禦率近100%

  《經濟通通訊社19日專訊》華為全聯接大會2025昨日在上海開幕,會上華為技術有限
公司與浙江大學聯合發布了內地首個基於昇騰千卡算力平台的DeepSeek-R1-
Safe基礎大模型。
 
  據介紹,DeepSeek-R1-Safe的發布旨在打造安全可信的示範應用,推動大
模型安全能力與產業生態協同發展。目前,模型已在ModelZoo、GitCode、
GitHub、Gitee及ModelScope 等多個社區全面開源。
 
  測試結果表明,DeepSeek-R1-Safe針對有毒有害言論、政治敏感內容、違
法行為教唆等14個維度的普通有害問題整體防禦成功率近100%,針對情境假設、角色扮演
、加密編碼等多個越獄模式整體防禦成功率超過40%。其綜合安全防禦能力達83%,在同樣
測試設置下超過Qwen-235B和DeepSeek-R1-671B等多個同期模型8%
至15%。
 
  此外,在MMLU、GSM8K、CEVAL等通用能力基准測試中,DeepSeek-
R1-Safe相比於DeepSeek-R1的性能損耗在1%以內。這些結果表明,
DeepSeek-R1-Safe不僅顯著提升了安全防護能力,也保障了模型的可用性,達
成了安全能力與通用性能之間的有效平衡。(sl)

【你點睇?】新一份施政報告出爐,你認為今次施政報告整體表現如何?你最支持哪個政策方向?► 立即投票

專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

etnet榮獲2024-2025年度「數碼無障礙網頁嘉許計劃」三項金獎

貨幣攻略

關稅戰

說說心理話

施政報告2025

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

流感高峰期

山今養生智慧

輕鬆護老