谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境

2024-02-29每日热点

  科技日报记者 张梦然

  据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。

  

  

Genie效果的动图截图演示。

  

图片来源:谷歌官网

  过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。

  Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。

  Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。

  该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。

  用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。

  谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。

标签: 今日热榜

“谷歌发布基础世界模型Genie,能一图创建互动的虚拟环境” 的相关文章

看齐苹果!高通骁龙8 Gen4拥抱3nm:台积电代工

看齐苹果!高通骁龙8 Gen4拥抱3nm:台积电代工

  快科技12月8日消息,博主数码闲聊站爆料,高通骁龙8 Gen4型号是SM8750,代号SUN,基于台积电3nm工艺制程打造,这将是高通第一款3nm手机芯片。   据悉...

苹果公司要求法庭驳回开发者发起的10亿美元诉讼

苹果公司要求法庭驳回开发者发起的10亿美元诉讼

  凤凰网科技讯 北京时间1月24日,据美媒报道,苹果公司周二要求伦敦法庭驳回代表1500多名应用程序开发商就其应用商店费用提起的价值约10亿美元的大规模诉讼。   这起...

ARM上季度营收58亿元:营收及净利好于预期,带动软银股价暴涨20%

ARM上季度营收58亿元:营收及净利好于预期,带动软银股价暴涨20%

  快科技2月9日消息,半导体设计与软件公司ARM昨日公布了该公司截至2023年12月31日的2024财年第三财季财报。   报告显示,ARM第三财季总营收为8.24亿美...

京东零售“涨薪”细节曝光:4倍月薪固定年终奖、涨幅近100%

京东零售“涨薪”细节曝光:4倍月薪固定年终奖、涨幅近100%

  “京东涨薪”像颗“深夜炸弹”丢进了本就颇不平静的电商江湖。而针对昨日公布的“京东零售全员涨薪”公告,12月28日,京东对外披露了相应薪酬调整方式和部分细节。   《每...

猎户星空大模型发布:千元显卡即可运行 五种能力接近GPT-4水平

猎户星空大模型发布:千元显卡即可运行 五种能力接近GPT-4水平

  快科技1月21日消息,今天下午,在在2024·傅盛的开年AI大课暨猎户星空企业应用大模型发布会上,猎豹移动董事长兼CEO、猎户星空董事长傅盛宣布猎户星空大模型发布。...

Reddit计划通过IPO筹资至多7.48亿美元,腾讯、阿尔特曼等是其股东

Reddit计划通过IPO筹资至多7.48亿美元,腾讯、阿尔特曼等是其股东

  IT之家 3 月 11 日消息,社交媒体平台 Reddit 计划通过首次公开募股 (IPO) 融资最高 7.48 亿美元,估值最高可达 65 亿美元(IT之家备注:当前约 468 亿元...