揭秘Sora:开发团队成立不到1年,Sora会“抢”谁的饭碗?
揭秘Sora:开发团队成立不到1年,Sora会“抢”谁的饭碗
2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊艳,一时间,诸如“现实不存在了!”的评论在全网刷屏。OpenAI推出的这款名为Sora的视频生成模型,能理解和模拟运动中的物理世界,使用DALL·E和GPT,根据提示词生成高精度场景、复杂的摄像机运动、情绪生动的多角色。简而言之,可以通过文本生成60秒视频。这条视频里所有你看到的画面,都是由它生成的虚拟内容,所以OpenAI官网也称之为“世界模拟器”,揭秘Sora开发团队成立不到1年,Sora会“抢”谁的饭碗?
Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心技术突破——Spacetime Patch(时空Patch)技术和Diffusion Transformer(DiT,或扩散型 Transformer)架构。
《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一WilliamPeebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。
如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间还尚未超过1年。