百度跟进视频生成模型 基础版限时免费打破行业壁垒
2025-07-04 08:07      作者:李静     来源:中国经营网

中经记者 李静 北京报道

7月2日,百度搜索宣布进行十年来最大改版,其中最引人注目的部分,是其推出的全球首个中文音视频一体化生成模型MuseSteamer,该模型由百度商业研发团队推出,其主打的卖点是有别于传统AIGC视频“先画面后配音”的割裂流程。

《中国经营报》记者注意到,在ChatGPT问世之后,百度很快推出了文小言(原文心一言),并且推出了多款基础大模型。而当OpenAI推出视频生成模型Sora,引发国内外众多厂商纷纷入局的热潮时,百度并未跟风快速推出类似产品。直至近日,百度才正式推出首款视频生成模型 MuseSteamer,此举标志着百度正式进军视频生成模型赛道。

“实际上百度一直在关注视频生成模型领域。”百度副总裁、移动生态商业体系负责人陈一凡在接受采访时透露,“MuseSteamer由百度商业研发团队推出,其实来自客户需求的推动,因为商业体系对生成类广告创意素材的需求旺盛。”


商业需求倒逼模型发展

与很多技术驱动型的视频生成模型不同,百度MuseSteamer 的研发启动并非技术驱动,是被广告主用需求“催生”出来的。

“去年年初行业就在卷视频生成模型,我们不是没看,但真正推动自研的,是商业体系收到的具体需求。”陈一凡回忆道,2024年年底短剧投流市场爆发,传统剪辑和生图已无法满足创意需求,就有代理商和广告主向百度提出:“能不能用短剧内容做剪辑?”“科幻场景拍不出来,能生成吗?”

面对这些需求,百度商业团队曾有两个选择:接入外部模型,或自己动手。但当他们尝试反馈优化建议时,却发现外部模型迭代周期太长。于是今年春节后,团队决定自研,项目代号就是“MuseSteamer”。

在百度MuseSteamer的自研过程中,不只是短剧行业,更多的行业客户向百度反馈“希望能用大模型提高广告质量”。

陈一凡表示,由百度商业研发团队推出的MuseSteamer正是来自这些需求的推动。“今天演示的视频偏动漫类型,其实是大概一个多月前,有客户想用类似动漫的方式去展现创意广告,百度大概用了一个多月的时间补足动漫类数据,对模型进行了调整。还有,当发现广告创意需要更丰富的运镜时,团队两周内就研发出运镜语言模型,教会AI理解‘镜头如何转场’。”

百度商业体系商业研发总经理刘林透露,MuseSteamer从春节开始立项,到目前为止,利用三个月左右的有效时间就达到了现在这个效果。一方面百度擎舵平台本身就有很多多模态生成的模型,有算法层、数据层、模型架构层的积累;另一方面,今年国内深度大模型快速迭代发展,对于多模态大模型发展也有很大的促进作用。

过去一年多,国内视频生成大模型快速发展。深度科技研究院院长张孝荣指出:“国内视频生成大模型最明显的突破是‘可控性’的提升,一些模型能精准控制角色位置、运动轨迹甚至音效同步,用户不用再碰运气了。”

值得注意的是,在百度搜索的改版中,MuseSteamer 被嵌入广告投放后台,可以形成“需求输入-创意生成 -效果反馈”的闭环。

“因为搜索团队面临海量长尾需求(如冷门知识、小众技能教程)时,传统素材库常无法覆盖,而MuseSteamer的视频生成能力可即时填补这一空白。”百度商业研发首席架构师李双龙进一步指出。


或掀起行业价格战

据了解,这次百度MuseSteamer还一口气推出三个版本。其中基础Turbo版主打主流需求;Lite版面向需要精准动作控制需求的生产;1080P大师级版本则瞄准高端电影运镜效果。“我们不做特别小众的需求,而是专注服务最大公约数。”陈一凡解释。

其中,百度此次推出的 Turbo 版限时免费公测,Lite版面和大师级版本需要一定的付费,这一策略或将直接冲击视频创作工具市场。

从面向的人群受众来看,陈一凡指出:“C端个人付费用户在当前阶段不是我们的主要目标,更希望先服务好B端客户,包括小B端的内容制作者以及大B端的广告主。”

目前,市面上已有的生成视频大模型产品大多数为每月提供一定的免费使用积分,但基本只够用户尝鲜使用。如果想要对生成内容进行调试,或者商业化大规模使用,都需要付费使用。

例如,快手自去年推出可灵之后,已经将其作为大模型时代的重要营收表现。在2025年第一季度的财报上,快手专门披露可灵AI的商业化进程在同步加速,2025年第一季度,可灵AI的营业收入已经达到1.5亿元。

从收入构成来看,P(Prosumer,产销者)端付费订阅会员贡献可灵AI将近70%的营业收入。可灵对P端付费订阅会员包括自媒体视频创作者和广告营销从业者等专业用户,他们兼具C端用户的传播属性和B端用户的付费能力,可以说与百度所言的B端客户群体有一定重合。

但付费模式一定程度上影响了一些用户使用生成视频大模型的意愿。有关数据显示,目前视频生成大模型和其他头部的AI产品(如ChatGPT、DeepSeek)在访问量级上仍然存在较大差距。

来自东方证券研究所的报告显示,从视频生成产品的用户访问量来看,2025年2月海螺、可灵、Sora位居Top3,分别为2756万、1591万、1050万;从独立访客数看,海螺、Sora、可灵分别以634万、592万、376万保持领先。而同期,DeepSeek国内web端用户访问量为5.7亿。

“如果成本不行,基本上大家就不会用,我们希望有越来越多的人用起来它。”陈一凡的表述透露着百度的市场策略:通过免费公测与分层付费模式,打破行业付费壁垒,推动视频生成技术的普及化应用。

行业其他玩家是否会紧随百度之后推出免费版本的视频生成模型,还值得观察。

(编辑:张靖超 审核:李正豪 校对:颜京宁)