66484 恒指法興八二牛6 (R 牛證)
即時 按盤價 跌0.217 -0.011 (-4.825%)

01/09/2025 09:32

美團開源大模型「龍貓」,部分性能超越DeepSeek

  美團(03690)開源大模型「龍貓」(LongCat-Flash),這是一個擁有5600億參數的混合專家(MoE)模型,據介紹,在各項基準測試中它與業界的DeepSeek V3.1、Qwen3旗鼓相當,甚至在某些特定能力上實現了超越。

  該模型創新性地採用「零計算」專家機制(Zero-computation Experts) ,能夠極大地節省算力,在處理每個詞元(token)時,僅需動態激活186億至313億的參數(平均約270億)。此外,模型的推理速度超過100詞元/秒(TPS),每處理一百萬輸出詞元的成本僅為0.7美元,並且支持128k的長文本上下文。

  目前,LongCat-Flash模型已經發布在Hugging Face和Githiub社區,並遵循MIT許可協議。
《經濟通通訊社1日專訊》

【說說心理話】陳敏兒:人生有很多苦痛的經歷,但我不甘心去白受這些苦,要從中「獲利」,去學習,令苦變得有價值,再跟其他人分享► 即睇

備註: 即時報價更新時間為02/09/2025 18:00
  港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

etnet榮獲2024-2025年度「數碼無障礙網頁嘉許計劃」三項金獎

大國博弈

關稅戰

貨幣攻略

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

流感高峰期

山今養生智慧

輕鬆護老