谷歌发布最强开源大模型Gemma,称其性能在同等规模中最先进!
开源领域大模型,迎来了重磅新玩家。
当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。
谷歌官网写道,Gemma在拉丁语中意为“宝石”,以此命名的开放模型系列Gemma由Google DeepMind等团队开发,采用了与创建Gemini模型相同的研究和技术。
目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。
在性能方面,官方页面显示,Gemma 7B在MMLU(大规模多任务语言理解)的得分率达到64.3%。在同等规模中,原本最强Mistral 7B的得分率为62.5%,Meta的Llama-2 7B和13B也都与其有一定的差距。
Gemma也第一时间上线了HuggingFace和HuggingChat,每个人都能试一下它的生成能力:
在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。
谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。