谷歌推出AI扩散模型Lumiere,可通过文字生成连贯动作视频

2024-02-04每日热点

  谷歌研究院推出了一款名为Lumiere的“文生视频”扩散模型,主打采用自家最新开发的“Space-Time U-Net”基础架构,号称能够一次生成“完整、真实、动作连贯”的视频。这是一种新的生成式AI工具,可帮助您通过基于文本的命令创建更逼真的图像和视频。

  谷歌表示,业界绝大多数“文生视频”模型无法生成时间长、质量佳、动作连贯逼真的内容,这是因为此类模型通常“分段生成视频”,首先产生几张关键帧,接着用“时间超级分辨率(Temporal Super-Resolution)”技术,生成关键帧之间的视频文件,这种方法虽然能够节省 RAM,但难以生成“连贯逼真”的视频。

  谷歌称他们的新模型 Lumiere的亮点之一是,相对于业界模型最大的不同是采用了全新“Space-Time U-Net”基础架构,该架构能够在空间和时间上同时“降采样(Downsample)”信号,从而在“更紧凑的时空中进行更多运算”,令Lumiere能够生成持续时间更长、动作更连贯的视频。

  Lumiere 可用于创建以下内容:

  谷歌还为我们介绍了 Lumiere 的基础特性,该 AI 建立在一个经过预先训练的“文生图”模型基础上,研究人员首先让基础模型生成视频分帧的基本像素草稿,接着通过空间超分辨率(SSR)模型,逐步提升分帧分辨率及细节,并利用“Multidiffusion”通用生成框架提升模型稳定性,从而保证了最终输出的视频一致性和连续性。

  Lumiere是谷歌在AI视频生成技术上的一次重大突破。值得注意的是,如果您想尝试使用Lumiere,你需要强大的GPU来驱动电脑的图形功能。

标签: 今日热榜

“谷歌推出AI扩散模型Lumiere,可通过文字生成连贯动作视频” 的相关文章

AI 大模型加持,新年不容错过的效率神器

AI 大模型加持,新年不容错过的效率神器

  1993 年,人类第一次将互联网接入公域,而在三十年后,信息爆炸的时代来临了——2003 年之前,人类历史上产生的信息总量,还不到 2023 年的数百万分之一。...

突发!支付宝重大调整

突发!支付宝重大调整

  近日,中国人民银行官网公布的《非银行支付机构重大事项变更许可信息公示(截至2023年12月)》显示,央行发布银许准予决字 [2023] 第189号文,同意支付宝(中国)网络技术有限公司...

今日最佳:坐标席

今日最佳:坐标席

  你的孩子标记了一处地点。...

宝马新一代圆柱电芯,电池成本有望减半

宝马新一代圆柱电芯,电池成本有望减半

  新的电池设计和Neue Klasse底盘让宝马十分看好自己。它相信自己有足够的潜力超越电动汽车领域的竞争对手,包括市场领军者特斯拉。   这家豪华汽车制造商非常有信心...

一汽丰田RAV4遭车主集体投诉:新车就生锈

一汽丰田RAV4遭车主集体投诉:新车就生锈

  快科技2月21日消息,第三方汽车投诉平台车质网显示,一汽丰田RAV4荣放,近日遭到车主们的集体投诉,投诉原因普遍为“车门生锈”。   据投诉车主介...

外媒:芯片情况出现反转了

外媒:芯片情况出现反转了

  在科技的浪潮中,半导体设备无疑是那最为耀眼的一颗星。它们的每一次跳动,都牵引着全球科技产业的神经。近年来,随着技术的飞速发展,半导体设备市场也迎来了翻天覆地的变化。尤其是在光刻机这一核...