中经记者 李昆昆 李正豪 北京报道
近日,OpenAI推出的AI视频生成应用Sora表现抢眼,凭借其独特的AI技术成功超越Google的Gemini和OpenAI的ChatGPT,成为苹果App Store免费应用榜榜首。
谈及Sora能否超过目前以抖音、快手、TikTok等为代表的短视频应用,速途研究院院长丁道师告诉《中国经营报》记者,它们在某种程度上会相互融合。抖音上的内容,人工智能制作的视频占比越来越高,比如到了明后年,国内的人工智能视频生成技术大幅进步的话,会有大量的人工智能生成的视频产生。它应该是你学习我、我学习你,相互融合的趋势。短期内还看不到其能把抖音取代,因为抖音的算法优势很强,有好几亿有黏性的用户,不是短期内可以被取代的。未来做得好的话,它们应该会并列为行业头部的App。
物理世界模拟器
据了解,在Sora的最新版本Sora2上,用户可以制作并分享由版权内容生成的AI视频,混剪他人视频并发布到类似社交媒体的内容流中。该应用仅支持IOS设备,用户需通过邀请码获取访问权限。
谈及Sora2和Sora的对比,丁道师表示,在制作精度上或者说拟真方面实现了较大幅度的跃进。“去年我们还说,谁可以让中国版的Sora缩小差距,但是现在Sora2一出来,差距可能要被扩大了,甚至我还输入一些中国古典的诗词,其也能理解并生出来相符合诗词含义的视频内容,这是它的第一个特点。第二个特点,它就是一个生成的工具,现在生成内容直接就可以发布到一个类似于抖音的界面,所以有人称它为AI版的抖音。在这个界面中,全是用人工智能生成,视频也是这么来刷,什么点赞、分享功能都有。”
阳明商业论创始人沈阳告诉本报记者,在技术层面,Sora2是质的飞跃,世界模型的一个初步显现,Sora2最令人震撼的并非只是生成视频,而是它展现出的对物理世界(如物体运动、光影变化、材质互动)的初步理解和模拟能力。这暗示它不再仅仅是学习像素的统计规律,而是在构建一个简单的世界模型。在涌现能力方面,它能够理解复杂的摄像机运动、长镜头连贯性,以及多个角色与环境的互动。这些能力并非被明确编程,而是从海量数据中“涌现”出来的,这标志着生成式AI进入了新的阶段。它是“虚拟世界内容物理学”的基石:它正在成为理解和解构视觉内容背后规律的基础模型。
OpenAI在公告中也承认:“之前的视频模型过于乐观——它们会扭曲物体和变形现实,以成功执行文本提示。”而Sora 2“在遵循物理法则方面比之前的系统更好”。
一位体验者兴奋地分享,Sora 2能识别复杂的“脚本化指令”,包括场景、动作、声音、情绪、BGM甚至后期要求,真正实现了“脚本直出内容”。
Sora2多镜头序列处理能力更是让专业视频创作者都感到惊讶,其系统能够在场景变化中保持连续性,这需要对角色和环境有深刻的理解。这意味着AI不再只是生成孤立的画面,而是在构建一个一致的视觉故事。
能否超过抖音?
很多人把Sora称为AI版抖音,这款应用采用垂直视频流和滑动浏览的交互方式,与TikTok高度相似,但所有内容均由AI生成。它不允许用户从手机相册或其他应用上传现有视频或照片,旨在打造一个纯粹的AI生成内容生态。
最引人注目的是“客串”(Cameo)功能。用户只需在应用内完成一次简短的音视频录制,就能将自己“植入”任何Sora生成的场景中。想象一下,你可以和自己创造的虚拟角色同台表演,或者将自己置身于历史场景中,这种体验无疑会重塑社交互动的方式。
谈及Sora2能否超过抖音,沈阳认为,Sora2(及其未来版本)和抖音/TikTok本质上是在不同的赛道上,它们不是直接的替代关系,而是强大的“赋能”与“被赋能”关系。Sora2很难“超过”抖音,但它有潜力成为重塑抖音乃至整个短视频/内容生态的“底层引擎”。
“Sora是‘生产力工具’,它的核心价值是内容生成。它像一个超级强大的‘摄像机+特效团队’,负责从无到有地创造资产。抖音是‘社交内容平台’,它的核心价值是内容分发、社交互动和商业闭环。它构建了一个由创作者、用户、广告主、商家组成的复杂网络和生态系统。”沈阳说,这就好比问:“世界上最先进的摄影机(如ARRI Alexa)能超过YouTube吗?”答案是不能,因为摄影机是制作视频的工具,而YouTube是展示和分享视频的平台。
另外,抖音的护城河不在于视频生成,而在于网络效应。抖音/TikTok最强大的壁垒是什么?业内人士认为,创作者生态,数以亿计的创作者每天生产海量内容,这是平台的血液。用户习惯与社交关系,用户在这里关注朋友、偶像,形成了稳固的社交图谱和使用习惯。算法推荐系统,能够精准地将内容匹配给感兴趣的用户,形成强大的成瘾性。商业闭环,直播、电商、广告、本地生活服务等构成了成熟的商业模式。Sora2作为一个工具,无法直接复制或取代这些网络效应和生态系统。
在沈阳看来,未来最可能出现的场景是,抖音集成Sora类技术,抖音/TikTok完全有可能与OpenAI合作,或将自研/集成的类似Sora的技术内置于其创作工具中。届时,每个抖音用户都可以用文字一键生成高质量视频片段,再结合抖音的剪辑、配乐、特效功能进行二次创作,引爆创作革命,这将极大地丰富平台的内容供给,降低创作门槛,让更多有创意但缺乏拍摄剪辑技能的人成为创作者。可能会出现全新的视频内容形态。
如果抖音能率先、深度地整合最好的视频生成AI,它的护城河会更宽。反之,如果竞争对手(如Sora、Instagram Reels、YouTube Shorts)整合得更好,则可能改变竞争格局。
这场变革的真正看点,在于AI工具与互联网平台生态的深度融合,那将开启一个内容创作前所未有的黄金时代。
(编辑:吴清 审核:李正豪 校对:颜京宁)