Sora发布时风光无限的场景犹在眼前,被视作AI视频生成领域的划时代产品。然而,问世仅25个月,Sora App便黯然退场。与此同时,中国视频生成大模型如雨后春笋般涌现,正不断蓬勃发展。

OpenAI首席执行官:为IPO做准备,将聚焦商业和编程功能

美国《华尔街日报》3月25日报道,美国企业开放人工智能研究中心(OpenAI)称,该公司计划停止其Sora视频平台的应用程序,这款产品去年发布时曾引起轰动,但此后日渐淡出公众视野。

据报道,OpenAI正重新聚焦于商业和编程功能,为最早可能在今年第四季度进行的首次公开募股(IPO)做准备。

3月24日,OpenAI首席执行官萨姆·奥尔特曼向员工宣布了上述调整。

他表示,公司将逐步关停使用其视频模型的产品。除了消费者应用程序,OpenAI还将停止为开发者提供的Sora版本,并且不再支持ChatGPT内部的视频功能。

OpenAI正处于战略转型之中,旨在将其计算资源和顶尖人才重新导向所谓的生产力工具,这些工具可供企业和个人用户使用。

Sora App官方社交媒体账号也宣布了关停的消息

Sora App官方社交媒体账号也宣布了关停的消息:“我们深知这个消息会令人失望。后续我们将尽快公布更多细节,包括app与API的停用时间安排,以及用户作品的留存方案。”

上周,OpenAI宣布将其ChatGPT桌面端、编程工具Codex和浏览器合并为一个“超级应用”。该公司期望这款整合后的产品能让员工围绕一个共同的愿景团结起来。

开启“视频的ChatGPT时代”,如今迪士尼承诺投资的10亿美元已落空

此前,Sora视频生成模型在2024年2月发布Sora技术预览,将AI技术拓展到了视频领域,凭借逼真的物理效果与场景还原能力,开启“视频的ChatGPT时代”,这款模型一经发布服务器就被“挤爆”。

当时,有人振奋地表示“我们真的看到新工业革命来临”,认为技术革新为内容创作者提供了前所未有的工具,使他们能够以更低的成本和更快的速度将创意变为现实,而且为观众带来了更丰富和多样化的视觉体验。

2024年12月,初代Sora正式上线,作为ChatGPT Plus/Pro会员专属功能首先向美加地区用户开放,支持文生视频、图生视频核心功能。

2025年9月,OpenAI正式发布Sora 2以及Sora App。

据介绍,Sora App旨在通过创建一个类似TikTok的社交信息流,让用户可以互相分享AI生成的内容,从而扩大其在消费者中的主导地位。推出后不久,奥尔特曼鼓励用户寻找各种方式,将他“剪辑”进流行文化中的著名或标志性场景。

当时,鉴于缺乏明确证据表明市场对该产品有需求,一些OpenAI员工对公司为该项目投入的计算资源之多感到惊讶。但奥尔特曼希望公司能以宏大的格局来思考其产品路线图,并公布了一项新AI硬件设备的计划,公司打算在未来几年内推出该设备。

报道称,此次关停Sora是对OpenAI先前战略的一次纠偏。此前密集发布的一系列产品不仅导致了臃肿复杂的组织架构,也引发了内部优先级的相互冲突。

OpenAI在推出Sora时并未设置保护措施,以防止某些内容在未经版权所有者同意的情况下被使用,这引发了一场短暂的版权战。最终,该公司增加了控制功能,以便内容所有者可以阻止他人使用其肖像或知识产权。

去年12月,迪士尼(Disney)表示将向OpenAI投资10亿美元。作为交易的一部分,OpenAI准备从迪士尼获得200多个角色的授权,让用户能够创作和分享包含备受喜爱的迪士尼角色的AI生成视频。这份为期三年的协议允许人们与卢克·天行者(Luke Skywalker)一起挥舞光剑,或将自己置身于《玩具总动员》的场景中。

然而,迪士尼对OpenAI的这笔投资现已终止推进。“随着新兴AI领域的快速迭代,我们尊重OpenAI退出视频生成业务并将重心转移至他处的决定,”一位迪士尼发言人表示。

奥尔特曼表示,Sora团队现在将转而专注于机器人等更长期的领域。

OpenAI正试图追赶其初创公司竞争对手Anthropic,以赢得程序员和企业用户的业务。在本月早些时候的一次全员会议上,OpenAI应用主管菲姬·西莫(Fidji Simo)表示,员工不能被“旁支任务”分心,并概述了一个愿景,即OpenAI要为其产品构建更多所谓的“智能体”能力。

网友调侃,中国模型为Sora送葬社交媒体

中国模型水平比美国同类技术领先整整两代,Seedance 2.0“地表最强”

Sora发布至消亡25个月的时间内,中国AI视频生成模型正如雨后春笋般涌现。

2024年3月底,字节跳动旗下剪映团队研发的AI创作平台“即梦AI”开放内测,8月6日上架至苹果应用商店。6月13日,美图推出基于美图奇想大模型、聚焦短片创作的平台MOKI。6月21日,快手旗下的可灵推出了图生视频功能。9月19日,阿里云通义万相发布全新视频生成模型,上线文生视频和图生视频功能……

各大AI企业对音视频生成大模型的交互推进,产品越来越成熟。今年2月,中国人工智能视频生成模型Seedance 2.0发布后在全球网络迅速走红。

Seedance 2.0采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入,集成了目前业界最全面的多模态内容参考和编辑能力。相比1.5版本,Seedance 2.0的生成质量大幅提升,其在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性显著增强,更加贴合工业级创作场景的需求。

这款模型被业界人士评价为“或将彻底改变电影制作的未来”,具备“颠覆好莱坞”的潜能。

Seedance 2.0生成的画面

在Mac生产力社区小有名气的小型独立开发者dashpane.pro前创始人更是直言:“中美AI视频技术的差距已经大到有些难堪。中国这些模型的水平,看起来比美国所有公开可用的同类技术领先了整整两代。”

在游戏科学CEO冯骥看来,Seedance 2.0是一个“杀死比赛”的存在。他直接给出了“当前地表最强的视频生成模型”的超高评价。

“AI理解多模态信息(文、画、影、音)并整合的能力完成了一次飞跃,令人惊叹。”冯骥直言,“我很庆幸,至少今天的Seedance2.0,来自中国。”

本文系观察者网独家稿件,未经授权,不得转载。