大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相

2024-02-22每日热点

  几家巨头之间的大模型竞争,越来越像打牌了。你出完炸弹我出炸弹。

  

这不,又一个深夜炸弹。

  2月21日,在与闭源的OpenAI打得火热的同时,Google突然加入了开源的战局。北京时间夜间Google突然宣布,开源了一个新的模型系列Gemma,这个模型使用了与它最强的Gemini同源的技术,并且在一系列的标准测试上秒杀了几款今天最热门的开源模型。

  怎么理解这个动作的重要性呢?你可以粗暴的理解为:

  这有点像现在正在训练更强大的GPT-5的OpenAI,把GPT3的低参数版给开源了。(前几天Sam Altman被问过这个问题,你们是否会在未来把GPT3开源,他没有直接回答。现在看来Google针对性很强啊。)

  

  (X上一张有意思的图)

  

根据Google官方对Gemma的介绍,它的基本信息如下:

  Gemma是谷歌开源的一个大型语言模型,而非像Gemini那样是多模态的,它基于与Gemini相同的技术构建,但完全公开并允许商用授权。

  Gemma模型有两个主要版本,分别是Gemma 7B(70亿参数)和Gemma 2B(20亿参数)。这些模型在大规模的数据集上进行了训练,数据集包含了以英语为主的网络文档、数学数据以及代码数据,总量达到了6万亿tokens。

  Gemma模型的特点包括:

  架构细节:Gemma模型具有不同的参数规模,Gemma-2B有18层,d_model为2048,而Gemma-7B有28层,d_model为3072。这些模型还具有不同的前馈隐藏维度、头数和KV头数,以及词汇量。

  

  新技术:Gemma采用了一些新技术,如Multi-Query Attention、RoPE Embeddings、GeGLU激活函数以及Normalizer Location,这些技术有助于提高模型的性能。

  评测结果:谷歌官方宣称Gemma模型在70亿参数规模的语言模型中表现最佳,甚至超过了一些参数量更大的模型。

  开源情况:Gemma模型遵循一个自定义的开源协议,允许商业使用。

  

  发布完,Jeff Dean就对这个系列模型划了重点:

标签: 每日热点

“大动作不停,Google加入开源战局!低配版“Gemini ”Gemma来了!相” 的相关文章

大地磁暴会产生哪些影响 什么是地磁暴?

大地磁暴会产生哪些影响 什么是地磁暴?

  记者从中国气象局了解到,   3月24日、25日和26日三天,可能出现地磁活动,其中25日可能发生中等以上地磁暴甚至大地磁暴,预计地磁活动将持续到26日...

猴子潜入院内攻击宠物狗,提醒:遇到野生动物千万不要靠近,及时报警求助

猴子潜入院内攻击宠物狗,提醒:遇到野生动物千万不要靠近,及时报警求助

  遇到野生动物千万不要靠近,及时报警求助。      ...

贵州独山村民连续74年祭奠7名剿匪战斗中为保护村民牺牲的烈士

贵州独山村民连续74年祭奠7名剿匪战斗中为保护村民牺牲的烈士

     【#贵州独山村民祭奠7名先烈#清澈的爱永远流淌!】4月3日,贵州独山墨寨村村民来到琴阳烈士陵园祭奠7名革...

河南一高中男教师与女学生发生不正当关系?教育局回应:谣言

河南一高中男教师与女学生发生不正当关系?教育局回应:谣言

  近日有网友爆料称河南固始县永和高中一男教师与女学生发生不正当关系,事件引发网友关注。   针对网传内容,4月2日上午,海报新闻记者采访到固始县教体局,工作人员向记者表...

跌破2600元瓶?飞天茅台降价传闻“吓坏”白酒股,分析师解读,公司回应

跌破2600元瓶?飞天茅台降价传闻“吓坏”白酒股,分析师解读,公司回应

     传统春节旺季过后就是白酒行业传统的淡季,淡季需求有减少也是正常现象。   近日,有网络传闻称,飞天茅台酒终端散瓶成交价格为2580元,跌破了2...

沙特对阵韩国全场数据对比:射门14-22,控球率43%-57%

沙特对阵韩国全场数据对比:射门14-22,控球率43%-57%

  直播吧1月31日讯亚洲杯1/8决赛,韩国点球大战5-3战胜沙特。双方全场对比数据如下↓   左沙特右韩国   射门:14-22...