阿里云弹性计算新升级:CPU上跑推理,模型起建成本降低50%

2024-01-15每日热点

  作者|武静静

  编辑|邓咏仪

  1月11日,阿里云升级第八代企业级通用计算实例ECS g8i产品。新产品依托于英特尔在2023年12月发布的第五代至强可扩展处理器,以及阿里云自研的“飞天+CIPU”架构体系所搭建。

  升级之后,新产品的在算力、网络、性能、应用场景方面有能力提升:

  算力层,ECS g8i实例的ECS g8i实例的L3缓存容量提升到320MB,内存速率提升至5600MT/s;

  性能方面,整机性能提升了85%,单核性能提升25%;

  网络方面,PPS达3000万,时延低至8微秒;

  场景上,新的ECS g8i实例可将MySQL数据库的性能提升至60%,Redis和Nginx的性能分别提升40%和24%。

  面对目前火热的大模型需求,新升级的ECS g8i实例进行了升级优化,让大模型跑在CPU上,并有效降低了模型搭建成本。

  这对于大模型的商业化落地意味着全新的尝试。一般而言,CPU在浮点、并行维度和内存宽带上都与GPU能力相差甚远,让模型跑在CPU上是一件困难的事。

  在技术,ECS g8i上做了一次新的尝试。为了解决首包延迟和吞吐性能技术难题,ECS g8i实例进行了针对性的技术优化,其内置指令集从AVX512升级到了Intel AMX高级矩阵扩展加速技术,可以加速模型运行。

  有了加速能力之后,模型推理过程在CPU上也能跑通,大大降低了大模型搭建和推理成本。此外,CPU相较GPU而言,更容易获取,成本也更低,所以,这也为解决算力短缺难题打开了新可能。

  阿里云弹性计算产品线总经理张献涛表示:“g8i可更迅速地响应中小规模参数模型,运行知识检索、问答系统及摘要生成等AI工作负载时,起建成本相比A10 GPU云服务器下降50%。”

  阿里云新发布的ECS g8i产品

  目前,在CPU上,ECS g8i不仅能支持中小模型的推理计算,还可以支撑72B参数级别的大语言模型分布式推理。以阿里云通义千问开源的Qwen-72B大模型为例,它可在g8i实例eRDMA网络构建的集群实现高效运行,输入小于500字时,首包延时小于3秒,每秒可生成7个Token。

  此外,ECS g8i还能支持超过32batchsize的超大参数规模的AI模型负载,涵盖目前市面上的文生图、AI生成代码、虚拟助手以及创意辅助工具等多类模型。

  在实际的模型落地中,要结合场景端的需求,综合考量效果和成本。根据阿里云的测试,通过CPU做超高并发,可以充分利用算力,进行长时间计算和推理。目前,ECS g8i在一些对实时性要求不高的离线场景,比如创意广告生成、离线视频摘要生成等AI功能方面,已经有良好的效果。

标签: 今日热榜

“阿里云弹性计算新升级:CPU上跑推理,模型起建成本降低50%” 的相关文章

马斯克旗下脑机接口公司在动物实验的记录保存等方面存在问题

马斯克旗下脑机接口公司在动物实验的记录保存等方面存在问题

  财联社2月29日电,一份机构报告显示,美国食品和药物管理局(FDA)检查人员发现,马斯克旗下脑机接口公司Neuralink在动物实验的记录保存和质量控制方面存在问题。...

英伟达的HBM订单,竞争太激烈了

英伟达的HBM订单,竞争太激烈了

  “SK海力士、三星电子和美光中最先通过NVIDIA认证的公司将主导HBM3E市场。到目前为止,SK海力士领先,三星和美光紧随其后。” 知情人士表示。   SK海力士、...

董宇辉回应清空微博:我解决不了被误解,只能逃离

董宇辉回应清空微博:我解决不了被误解,只能逃离

  2 月 27 日晚间消息,今日董宇辉个人微博账号内容全部清空。在今晚“与辉同行”直播中,董宇辉谈起清空微博一事称:“我解决不了被误解,只能逃离。账号没有注销,因为一旦注销,就会出现假号...

龙年开工第一天!雷军、卢伟冰现场亲自发红包:小米员工排长队领

龙年开工第一天!雷军、卢伟冰现场亲自发红包:小米员工排长队领

  快科技2月18日消息,今天是龙年开工第一天,许多企业老板为员工准备了开工红包。   根据小米Civi产品经理胡馨心等多位小米员工介绍,今天早上,北京小米科技园为小米员...

小鹏汽车:阿里减持是执行其投资变现策略 目前仍为公司第二大股东

小鹏汽车:阿里减持是执行其投资变现策略 目前仍为公司第二大股东

  财联社12月16日电,针对“阿里巴巴减持部分小鹏汽车股权”一事,小鹏汽车今日回应称,阿里减持是在执行其Q3季报对外沟通的投资变现回报股东的策略,而不是因为对小鹏公司的看法变化。阿里此后...

ROG PG34WCDM OLED显示器即将推出:34英寸3440x1440 2

ROG PG34WCDM OLED显示器即将推出:34英寸3440x1440 2

  IT之家 1 月 6 日消息,ROG 新款 PG34WCDM OLED 显示器的详细参数已在官网列出,预计将在不久后上市。...