春节期间,OpenAI在Altman离职事件沉寂一段时间后,不鸣则已,一鸣惊人,openAI的首个视频生成模型Sora发布,可生成60秒一镜到底视频!
Sora?Sora!
先看看OpenAI官网的描述:
Video generation models as world simulators
We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that operates on spacetime patches of video and image latent codes. Our largest model, Sora, is capable of generating a minute of high fidelity video. Our results suggest that scaling video generation models is a promising path towards building general purpose simulators of the physical world.
作为世界模拟器的视频生成模型
我们探索在大规模视频数据上训练生成模型的方法。 具体而言,我们训练基于文本条件的扩散模型,使其可以同时处理具有不同时长、分辨率和宽高比的视频和图像。我们利用transformer架构,该架构可以在时空块上操作视频和图像潜在代码。我们最大的模型 Sora 能够生成一分钟的高保真视频。我们的研究结果表明,扩展视频生成模型是构建通用物理世界模拟器的有前景的途径。
想想之前对于视频生成的理解, 就是将多个真实图片进行组合。可是这里,Sora可以理解现实的物理世界, 并且进行模拟!抛开这两天漫天飞的对于Sora技术能力参数的夸赞,什么60秒啊,什么一镜到底啊。OpenAI从技术实现思路上就完全不一样。这也是他们能一直保持技术创新的原因吧!
现在到处都是介绍Sora的文章了,具体的视频示例和 prompt 都可以直接从OpenAI官网查看:https://openai.com/research/video-generation-models-as-world-simulators
Sora这个名字是啥意思?
Sora 的名字来自于日语单词“空”(そら),意思是“天空”。这个名字的寓意是希望 Sora 能够像天空一样广阔无垠,能够承载人们无限的想象力。
Sora 的名字也与“SoReal”谐音,意思是“如此真实”。这个名字体现了 Sora 的目标,即生成尽可能逼真的视频,让用户能够身临其境地体验虚拟世界。
此外,Sora 的名字也与“Source”谐音,意思是“源泉”。这个名字体现了 Sora 的定位,即为用户提供创作视频的源泉,帮助用户将自己的想象力变为现实。
总而言之,Sora 的名字简洁明了,寓意深刻,体现了 Sora 的目标、定位和愿景。
Sora,大家怎么看?
- 360的周鸿祎直言:”Sora意味着AGI实现将从10年缩短到1年。“

- 出门问问的CEO李志飞感叹::“LLM ChatGPT是虚拟思维世界的模拟器,以LLM为基础的视频生成模型Sora是物理世界的模拟器,物理和虚拟世界都被建模和模拟了,到底什么是现实?”

- Elon Musk转发了自己在2016年的一条推文说:”看看现在发生了什么:(“

对我们有影响吗?
当然有!一定有!最直观的影响就是震惊!
- Sora会快速颠覆行业吗?这个不一定,一个好的视频,还是需要一个有创意的人的。对传媒行业的影响肯定是巨大的,短期内一定是给传媒行业带来了极高的创作效率。想象一下,以前拍摄一个海上的镜头,需要租个船啊直升机啊之类的,触动一堆人,远远地跑到一个海上去进行拍摄,现在呢?有一定的剪辑能力加上 Sora 的视频生成能力,这个过程一下就完全改变了!
- Sora实现了对物理世界的理解,记得以前学Unity的时候,对于计算机图形学、碰撞检测、加速运动等等,可是搞得晕头转向。现在几句简单的提词,就自动生成了一个带有物理世界理解的视频!这是大模型的胜利!有了对物理世界的理解,这个能力相信不仅仅是用在视频生成领域了就!
- 中国在AGI上的差距到底还有多远?记得去年chatGPT刚发布的时候,国内有很多仅2,3个月差距的声音。到现在,很多声音是国内的大模型在chatGPT3.5的水平左右,距离chatGPT4.0到底有多远,这个能不能说清楚呢?现在又出现了Sora,这个差距,有人能说清楚吗?
- 还记得,在刚出chatGPT的时候,我们几个技术小伙伴一起讨论,为什么类似的创新在国内就是出不来呢?难道真的只是国内的创业环境导致的?和我们的教育机制到底有没有关系?随着AGI能力的快速发展,我们的教育方式应该是怎样的?现在的教育方法到底应该如何调整?

留言