国内首个官方大模型评测结果出炉!阿里云通义千问首批通过评测

2023-12-22每日热点

  快科技12月22日消息,国内首个官方“大模型标准符合性评测”结果公布。

  阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。

  据悉,本次通过评测的首批大模型中,通义千问是唯一的开源模型,在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。

  12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜。

  此后又登上国内上海人工智能实验室OpenCompass榜首,成为业界公认的性能最强开源大模型。

  目前,通义千问APP可在苹果和安卓各大应用商店中下载体验,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。

  据了解,“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。

  该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。

标签: 今日热榜

“国内首个官方大模型评测结果出炉!阿里云通义千问首批通过评测” 的相关文章

谷歌欢迎苹果采用RCS:倡导公平、安全的信息交流

谷歌欢迎苹果采用RCS:倡导公平、安全的信息交流

  IT之家 11 月 17 日消息,苹果公司已承诺 2024 年采用 RCS,但不会使用谷歌的端到端加密扩展。谷歌公司随后通过国外科技媒体 AppleInsider 发布了一份声明,表示...

华为Pocket 2艺术定制版保外维修价格公布:主板价相当于一台Mate 60

华为Pocket 2艺术定制版保外维修价格公布:主板价相当于一台Mate 60

  华为近日推出了小折叠产品Pocket 2。其中,12+256版本售价为7499元,12+512版本售价为7999元,而12+1TB版本售价高达8999元。此外,华为...

英特尔成立独立FPGA公司Altera

英特尔成立独立FPGA公司Altera

  英特尔今日宣布,成立全新的FPGA(现场可编程门阵列)半导体公司Altera。   在FPGA Vision在线发布会上,Altera公司CEO...

消息称社交平台Reddit授权数据给谷歌训练AI,每年6000万美元

消息称社交平台Reddit授权数据给谷歌训练AI,每年6000万美元

  IT之家 2 月 21 日消息,据路透社报道,三位消息人士透露,社交媒体平台 Reddit 已经与谷歌达成协议,使其内容可用于培训谷歌的人工智能模型。这项合同价值约每年 6000 万美...

舒尔推出MoveMic无线领夹麦克风系统:号称全球最小、音质最佳、可双通道直连手

舒尔推出MoveMic无线领夹麦克风系统:号称全球最小、音质最佳、可双通道直连手

  IT之家 3 月 6 日消息,舒尔近日发布 MoveMic 系列无线领夹麦克风系统,定位内容创作者、摄像师和记者,其直连手机录制时间长达 24 小时。...

马克·扎克伯格:Meta正在构建通用人工智能!

马克·扎克伯格:Meta正在构建通用人工智能!

  Meta公司的CEO马克·扎克伯格最近在社交平台上发布了视频,表示他们正在扩大AI团队的规模,并致力于推动元宇宙和人工智能的发展。   目前,Me...