输入配音文件即可生成人物对话场景,Meta公布audio2photoreal A

2024-01-09每日热点

  IT之家 1 月 9 日消息,Meta 日前公布了一项名为 audio2photoreal 的 AI 框架,该框架能够生成一系列逼真的 NPC 人物模型,并借助现有配音文件自动为人物模型“对口型”“摆动作”。

  

/

  

Meta研究报告

  

Meta研究报告

  IT之家从官方研究报告中得知,Audio2photoreal 框架在接收到配音文件后,首先生成一系列 NPC 模型,之后利用量化技术及扩散算法生成模型用动作,其中量化技术为框架提供动作样本参考、扩散算法用于改善框架生成的人物动作效果。

  研究人员提到,该框架可以生成 30 FPS 的“高质量动作样本”,还能模拟人类在对话中“手指点物”、“转手腕”或“耸肩”等不由自主的“习惯性动作”。

  

/

  

输入配音文件即可生成人物对话场景,Meta公布audio2photoreal

  研究人员援引自家实验结果,在对照实验中有 43% 的评估者对框架生成的人物对话场景感到“强烈满意”,因此研究人员认为 Audio2photoreal 框架相对于业界竞品能够生成“更具动态和表现力”的动作。

  

输入配音文件即可生成人物对话场景,Meta公布audio2photoreal

  据悉,研究团队目前已经在 GitHub 公开了相关代码和数据集。

标签: 今日热榜

“输入配音文件即可生成人物对话场景,Meta公布audio2photoreal A” 的相关文章

真我12 Pro下周发布:流畅用4年无压力!

真我12 Pro下周发布:流畅用4年无压力!

  快科技2月25日消息,真我12 Pro将于2月27日正式发布,号称“中端颠覆者”。   据真我手机官方介绍,真我12 Pro搭载第二代骁龙7s+UFS 3.1内存+旋...

售价30万级!深蓝全新硬派SUV“G318”官图发布

售价30万级!深蓝全新硬派SUV“G318”官图发布

  快科技1月31日消息,我们从深蓝汽车官方发布了更多“G318”车型的照片,该车上市后,其售价预计将在30万元左右。   作为深蓝旗下全新的硬派SU...

苹果Vision Pro头显目前约有230个原生应用, Office等大量应用截

苹果Vision Pro头显目前约有230个原生应用, Office等大量应用截

  IT之家 1 月 21 日消息,当地时间 1 月 19 日凌晨 5 点,苹果空间计算设备 Apple Vision Pro 开始在美国市场接受预订,2 月 2 日正式上市,售价 349...

鸿蒙智行最新计划:智界S7 2.0有望4月上市,全新SUV最快7月发布

鸿蒙智行最新计划:智界S7 2.0有望4月上市,全新SUV最快7月发布

  快科技3月21日消息,据媒体报道,新款智界S7有望在4月8日上市。   据悉,随着新生产线的投入使用,这款车将搭载多项升级功能,作为参考,现款智界S7的售价为24.9...

突破第三代光伏技术瓶颈!华科大太阳能电池登上Science

突破第三代光伏技术瓶颈!华科大太阳能电池登上Science

  快科技3月15日消息,国际著名学术期刊《科学》刊发了华科大武汉光电国家研究中心韩宏伟教授团队最新研究论文。   论文题目是《电子注入和缺陷钝化机制助力高性能介观钙钛矿...

2023年,锂电市场中的“输家”和“赢家”有哪些

2023年,锂电市场中的“输家”和“赢家”有哪些

  在2023年,中国动力电池行业普遍经历了“频繁降价”、“持续去库存”和“产能利用率下滑”等挑战,行业内各大厂商之间竞争激烈。12月,随着新能源汽车的最后一波降价促销,动力电池市场迎来了...