现实不存在了?不,这就是现实

2024-02-16每日热点

  一觉醒来,AI讨论群里热血沸腾。

  一头雾水的我看了数百条的聊天记录,发现原来OpenAI发布了最新的视频大模型Sora。

  OpenAI的CEO奥特曼发布了一些演示视频,众所周知,当初谷歌演示的时候涉嫌造假,奥特曼干脆让网友提需求,他即时生成。

  截止现在(北京时间2月16日11点),一部分海外IP用户反馈,已经可以在ChatGPT4上试用。

  演示视频显示,60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。

  我对 Sora 生成的画面非常感兴趣,尤其是它在不崩、不闪方面的表现。

  确实,Sora 的出现为 AI 视频领域带来了新的突破,其生成的画面质量令人印象深刻。

  首先,我们来分析一下脸崩现象的原因。在目前的 AI 绘画工具中,许多大模型在处理大幅画面时,往往会遇到面部细节处理困难的问题。这是因为这些模型在训练过程中,可能没有接触到足够多的、具有大幅面画面的训练数据。因此,当它们面对实际问题时,就会出现细节处理不足的情况,也就是我们所说的“脸崩”。

  此外,目前的 AI 大模型都是通过逐帧生成画面,然后将这些画面拼接成视频。这种方法在画面细节发生变化时,容易出现闪烁现象。这是因为每一帧的画面都是独立生成的,它们之间的差异会在视觉上形成闪烁效果。

  然而,Sora 似乎成功地解决了这两个问题。有分析人士认为,Sora 使用了游戏引擎。我对此表示认同。事实上,使用游戏引擎来生成视频,可以有效地避免逐帧生成画面再拼接的弊端。通过游戏引擎,可以实现更为连续和自然画面生成,从而避免脸崩和闪烁现象。

  英伟达高级科学家 Jim Fan 对 Sora 发表了一些观点。他认为 Sora 是一个数据驱动的物理引擎,它可以对真实世界和虚构世界进行模拟。这种模拟器通过去噪和梯度学习方式,学习了复杂的渲染、直观的物理、长期推理和语义理解。如果 Sora 真的使用了虚幻引擎 5 并接受了大量合成数据的训练,那么它的表现就一点也不令人惊讶了。

  在 ChatGPT 3.5 推出之前,ChatGPT 发布了几个版本。尽管这些版本的表现令人惊艳,但它们的能力有限,并没有引起广泛关注。然而,ChatGPT 3.5 的推出让一切都变了。它一炮走红后,紧接着推出了付费的 4.0 版本。

  与 ChatGPT 类似,Sora 的出现也让人感到措手不及。就在不久前,大家还在为 AI 视频去闪问题而努力。毕竟,我们都看过基于现有技术水平的论文,知道瓶颈在哪里,知道上限在哪里。然而,Sora 的出现就像是从天而降的天顶星科技,打破了我们的认知。

  但是,如果 Sora 真的使用了游戏引擎,比如虚幻 5,那么这一切又都可以理解了。只能说之前的 AI 视频走的是 AI 绘画的老路,想当然地认为视频等于绘画逐帧叠加。Sora 巧妙地换了一条路,依然遵循 ChatGPT 的逻辑,用数据去驱动游戏引擎,再由游戏引擎生成画面。

  这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。

  随着 Sora 的成功,我们可以预见,未来会有越来越多的 AI 大模型接入游戏引擎。这种结合将为绘画大模型带来降维打击,让它们在画面生成方面面临巨大的挑战。不过,这也是 AI 技术发展的必然趋势。只有不断尝试创新,才能推动技术的进步。

  并非现实不存在了。

  这,就是现实。

标签: 今日热榜

“现实不存在了?不,这就是现实” 的相关文章

小米手机全球出货量稳居前三!传音手机跻身前五

小米手机全球出货量稳居前三!传音手机跻身前五

  1月16日,根据国际数据公司(IDC)发布的2023年度全球手机出货量榜单,苹果再次成为无可争议的市场领导者,以2.346亿部的出货量占据了高达20.1%的市场份额。...

新型镀膜技术亮相 CES 2024:可让树莓派等设备完全浸入水中运行

新型镀膜技术亮相 CES 2024:可让树莓派等设备完全浸入水中运行

  IT之家 1 月 16 日消息,HZO 在 CES 2024 大展期间,展示了全新的水蒸气涂层技术,可以让计算机完全浸入水中运行。   IT之家注...

罗永浩谈曾在新东方打工感受:部分高管很恶心

罗永浩谈曾在新东方打工感受:部分高管很恶心

  凤凰网科技讯 (作者/杨睿琪)12月15日,罗永浩现身交个朋友的直播间,谈论曾经在新东方打工时候的事情,他表示,多数人感觉俞老师对下面人还是比较厚道的,但这个公司大了之后比较复杂,有一...

三星Galaxy Z Fold 6外观设计曝光,这颜值怎么样?

三星Galaxy Z Fold 6外观设计曝光,这颜值怎么样?

  近日,CNMO科技注意到,三星Galaxy Z Fold 6基于CAD靠谱渲染图来了。图片显示,三星Galaxy Z Fold 6有很多设计元素与三星Galaxy Z Fold 5、三...

蜜雪冰城不能说的秘密:喜茶永远不是对手,农夫山泉才是

蜜雪冰城不能说的秘密:喜茶永远不是对手,农夫山泉才是

  一批新消费品牌的崛起背后,往往隐含着人们生活方式的变迁。这种变迁从主流人群生活理念的转变开始,形成一种潮流或文化影响更大范围的人群。这一过程中,品牌以标签化的方式,...

机构:去年Q4印度智能手机出货大增28%,小米夺冠

机构:去年Q4印度智能手机出货大增28%,小米夺冠

  集微网消息,研究机构TechInsights统计,2023年第四季度印度智能手机出货量同比增长28%,达到3820万部。这也是印度有史以来最高的季度增长率,前三名分...