21/08/2025 17:48
百度升級蒸汽機視頻生成模型,多人有聲視頻一體生成
百度(09888)舉行發布會宣布,蒸汽機(MuseSteamer)音視頻一體化模型完成重大升級,在行業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索「百度蒸汽機」或登錄「繪想」平台體驗,企業用戶可在千帆平台享受高性能視頻生成服務。
百度蒸汽機於7月2日正式發布,發布首日平均每分鐘超百人申請,2周內註冊用戶超30萬。
*已在多個場景落地應用,定價低至行業70%*
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術(Latent Multi-ModalPlanner),能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。國際知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0製作的科幻短片《歸途》,並指「蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算」。
《經濟通通訊社駐京記者黃燕明21日北京專電》
百度蒸汽機於7月2日正式發布,發布首日平均每分鐘超百人申請,2周內註冊用戶超30萬。
*已在多個場景落地應用,定價低至行業70%*
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術(Latent Multi-ModalPlanner),能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。國際知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0製作的科幻短片《歸途》,並指「蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算」。
《經濟通通訊社駐京記者黃燕明21日北京專電》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
【AI】智元機器人啟動「智元A計劃」,擬投入40億助創新創業 21/08/2025 18:00
-
下一篇
【AI】DeepSeek:V3﹒1精度針對下一代國產芯片設計 21/08/2025 16:54
-
【AI】速騰聚創機器人業務勁增,產品銷量達34400台 22/08/2025 10:27
-
【AI】快手CFO:可靈AI今年收入料較年初目標翻倍 22/08/2025 09:08
-
【AI】騰訊雲CodeBuddy IDE國內版開啟公測 22/08/2025 09:05
-
【AI】投資過熱?Meta據悉已凍結人工智能部門招聘 21/08/2025 16:01
-
【AI】vivo首款MR頭顯正式發布,僅重398克,暫不銷售 21/08/2025 15:36