岩芯数智CEO刘凡平:大多数企业不愿负担大模型堆积算力带来的昂贵成本

2024-01-26每日热点

  凤凰网科技讯 (作者|任清)近日,岩芯数智召开“新架构,新模力”大模型发布会,正式发布了国内首个非Attention机制的通用自然语言大模型——Yan模型,这也是业内少有的非Transformer架构大模型。1月26日下午,凤凰网科技就Yan模型的相关问题采访了岩芯数智的CEO刘凡平,他指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。

  Transformer是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,它的崛起无疑是深度学习历史长河中一个重要的里程碑。凭借着其强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,不仅成为自然语言处理领域的主流模型架构,还在计算机视觉、语音识别等多个领域展示了其跨界的通用能力。

岩芯数智CEO刘凡平:大多数企业不愿负担大模型堆积算力带来的昂贵成本

  在Transformer已经占据人工智能领域半壁江山的今天,为什么岩芯数智还要寻求非Transformer的更多可能性?

  刘凡平的看法是,在全球范围内,一直以来都有不少优秀的研究者试图从根本上解决对Transformer架构的过度依赖,寻求更优的办法替代Transformer。就连Transformer 的论文作者之一Llion Jones也在探索‘Transformer 之后的可能’,试图用一种基于进化原理的自然启发智能方法,从不同角度创造对AI框架的再定义。

  岩芯数智也不例外,他们在对Transformer模型不断的调研和改进过程中,意识到了重新设计大模型的必要性:一方面,在Attention机制下,现有架构的调整几乎已经达到瓶颈;另一方面,岩芯数智更期望降低企业对大模型的使用门槛,让大模型在更少的数据、更低的算力下具备更强的性能,以应用于更广泛的业务。因此,在历经近1000多个日夜,超过几百次的设计、修改、优化、对比、重来后,岩芯数智自主研发出了不再依赖Transformer的全新架构——“Yan架构”,同时,基于Yan架构的通用大模型应运而生。

  据他介绍,Yan架构拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。

  刘凡平表示,“我们没有在去年热度最高的时候发布YAN架构、也没有选择通过刷榜单评比自身应有的排名,是因为我们认为最终决定你这个东西是不是有价值的是客户,我们想做更长远的事情。当然,除了星辰大海,我们也会脚踏实地做商业化应用,保证第一是能用的,第二是好用的,第三是大家愿意用的。”

  刘凡平认为,本质上岩芯数智为行业提供了新的视角、新的价值。“这条路最终是不是对的,行业还没有定论,但是通过堆积算力带来的昂贵成本与低性价比,一定是大多数企业不愿负担的,这并没有让人工智能给大家创造一个更加多元化或者更可行的体验。

  所以我们觉得在这个市场我们是能提供价值的。当我们能创造一个新的价值的时候,我们就不会去惧怕巨头或者大厂,他们也没有解决客户的痛点,我们的起点是差不多的。我们是思考过,确信自身能提供新思路、新方案、新应用、新价值,解决用户的痛点。”

标签: 今日热榜

“岩芯数智CEO刘凡平:大多数企业不愿负担大模型堆积算力带来的昂贵成本” 的相关文章

飞书团队精简比例不超20%,系字节跳动要求组织精干

飞书团队精简比例不超20%,系字节跳动要求组织精干

  3月26日,飞书CEO谢欣于今天早上发布全员信,称公司组织自身出现团队规模比较大,组织不够精干,效率在变低,力量不够聚焦的问题。并宣布对公司进行调整,适当精简团队规模。从多位飞书内部人...

一加Nord N30 SE 5G手机低调发布,搭载天玑6020处理器

一加Nord N30 SE 5G手机低调发布,搭载天玑6020处理器

  IT之家 1 月 29 日消息,一加 Nord 系列今日悄悄推出了新机 ——Nord N30 SE 5G。令人意外的是,这款手机没有大力宣传,甚至没有官方预热,直接低调地上架了官网。...

娃哈哈官方店铺销量2天涨超500%:AD钙奶销量第一 纯净水卖空

娃哈哈官方店铺销量2天涨超500%:AD钙奶销量第一 纯净水卖空

  快科技3月1日消息,2月25日,娃哈哈集团创始人、董事长宗庆后因病逝世,享年79岁,全国网友都在用自己的方式悼念宗庆后。   据国内媒体报道,近日,娃哈哈官方旗舰店销...

微软GitHub网站成“帮凶”,被黑客和勒索软件组织滥用发起攻击

微软GitHub网站成“帮凶”,被黑客和勒索软件组织滥用发起攻击

  IT之家 1 月 12 日消息,Recorded Future 旗下威胁研究部门 Insikt Group 近日发布报告,称 2023 年越来越多的高级持续性威胁(APT)组织利用微软...

荣耀MagicBook Pro 16笔记本完整规格泄露:3K 165Hz护眼屏、

荣耀MagicBook Pro 16笔记本完整规格泄露:3K 165Hz护眼屏、

  IT之家 3 月 16 日消息,荣耀昨天在京东上架了 MagicBook Pro 16 笔记本电脑,不过没有公布系列笔记本的完整参数信息,今天博主 @数码闲聊站 公布了这款笔记本的具体...

小米官方辟谣澎湃OS是自研系统 从没宣传过:别对比华为鸿蒙了

小米官方辟谣澎湃OS是自研系统 从没宣传过:别对比华为鸿蒙了

  快科技1月22日消息,小米从来没有说过澎湃OS是自研,不过被很多用户带节奏,也让他们不得不发力。   从网友晒出的小米官方回应看,他们从未在任何场合说小米公司的澎湃O...