袁进辉新公司获创新工场、王慧文等5000万投资

2024-01-10每日热点

  文丨贺乾明

  编辑丨程曼祺

  OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow)。

  《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值为数亿元人民币。

  袁进辉告诉《晚点 LatePost》,他和 OneFlow 核心团队从 2023 年 8 月开始筹备再次创业,新公司延续 OneFlow 的方向,做 AI Infra(AI 基础设施)层中的 “框架”。

  AI 框架介于算力层和模型层之间,是一种系统软件,就像电脑操作系统能使普通用户直接用鼠标和键盘操作应用,AI 框架能帮开发者简单方便地设计模型或使用模型,而无需操心底层算力资源的调配。

  不同的是,OneFlow 当年以通用训练框架为主,服务深度模型的生产;硅基流动则专注做推理框架,服务大模型的应用。

  袁进辉认为,服务大模型应用比服务大模型生产更容易做出标准化产品,市场空间也大得多:模型生产是阶段性的,且由少数公司主导;大模型应用则会遍布各行各业、无处不在,被各种行业和规模的企业需要。

  从 OneFlow 到 SiliconFlow,从训练到推理

  袁进辉本科毕业于西安电子科技大学,2003 年考入清华大学计算机系,师从张钹院士攻读博士学位,做过机器学习、深度学习和脑科学的跨学科研究。

  在 2013 年加入微软亚研院后,袁进辉做出了当时最快的主题模型训练算法和系统 LightLDA,之后又开始尝试研发 AI 训练框架,这也是 2017 年他创办的 OneFlow 的主攻方向。

  当时市场上已有 Google 的 TensorFlow 和 Meta 的 PyTorch 等开源框架。袁进辉之所以觉得有创业机会,在于他有一个非主流的认知:未来 AI 模型会很大。

  他的判断来自博士后阶段研究交叉学科的经历:人类大脑中有上千亿神经元,而当时最庞大的神经网络的参数(类似神经元)也没有破亿,大部分训练框架能满足当时模型的规模,却没有为巨大的模型优化。

  袁进辉称,从 OneFlow 创业之初,他们就在开发大参数模型的训练框架,使用了现在大模型框架常用的分布式并行训练方法,这能提升用大量 GPU 同时训练单个模型的效率。

  2022 年 11 月,PyTorch 发布分布式计算扩展程序 DistributedTensor 时,PyTorch 联合创始人苏米特·金塔拉(Soumith Chintala)还在社交平台上提到,部分灵感来自 OneFlow 的类似功能。

  一位 AI 从业者曾告诉《晚点 LatePost》,OneFlow 训练大模型确实更方便,一般科技大公司使用的框架会在 Pytorch 或 TensorFlow 上又做一层封装和优化,但这些优化是面向信息推荐等已有业务定制的,不是针对大模型,“数亿参数和数百亿甚至上千亿参数的模型,训练框架要做的事差别很大”,OneFlow 则针对大模型训练做了优化。

  2023 年初,大模型在全球获得广泛关注,OneFlow 的技术设想得到验证。同年 3 月,OneFlow 被光年之外并购,又 3 个月后,光年之外创始人王慧文因病退出创业,光年之外被美团收购,袁进辉选择再次创业。

  “加入光年之外时是 40 人,再创业时有 35 人。” 袁进辉说,经过 2023 年的两次变动,OneFlow 核心团队仅有少数人员离开,关键原因是做推理系统的新方向让团队觉得有希望、有机会。

  英伟达、亚马逊都在做推理框架,对手不乏大公司

  推理框架的机会首先在于需求多、市场大。多位大模型从业者估算,如果大模型被广泛使用,大模型的训练和推理用量会达到 2:8,甚至 1:9。

  这同时是一个客户相对分散的市场,供应商更有话语权,能自己生产大模型的公司是少数,基于模型开发应用或直接使用大模型的公司则多得多,它们都需要推理的优化。

  推理成本偏高也正是当前的行业痛点,客户更愿意为此付费。传统软件一次开发、无限复制,边际成本显著降低;而用户每次调用大模型时都要消耗不少 GPU 计算资源做推理。这就是为什么付费版的 ChatGPT 也会限制用户使用 GPT-4 的次数,3 小时内最多用 50 次。

  推理比训练有更大的成本优化空间。“用大量芯片训练大模型,硬件利用率的理论上限是 60% 多,英伟达同时做软硬件可以做到 50% 多,其它公司在这个基础上再优化,最多也只有约十个点的 margin;而推理环节还有数倍、甚至十倍的降本空间,推理的市场容量是训练的好多好多倍。” 袁进辉说。

  袁进辉同时提到,做推理框架的资源门槛更低,对创业公司更友好。因为要做好大模型训练需要数千张 GPU 做实验平台,推理框架则可以使用规模小得多的算力资源做开发和优化。推理的需求也比较同质化,更容易做成标准产品,创业公司能集中精力做研发,减少定制化交付。

  更大的市场机会、更低的资源门槛,意味着更多竞争对手,大小公司皆有:

  大型云计算公司会开发类似产品与 AI 计算资源绑定销售,如亚马逊云的 SageMaker 和阿里云的 PAI 等;

  芯片公司也会研发与芯片搭配的推理框架,如英伟达的 TensorRT-LLM;

  创业公司方面则有贾扬清(知名 AI 训练框架 Caffe 的作者之一)创办的 Lepton AI,陈天奇(机器学习算法 XGBoost、深度学习编译器 TVM 作者)参与创办的 OctoAI,新加坡国立大学教授尤洋创办的潞晨科技,清华电子系主任汪玉创立的无问芯穹等;

  学术界也有开源推理框架,如伯克利大学开发的 vLLM 等。

  袁进辉并不担心硅基流动在这个领域的技术实力,他称公司的框架全部自研,并不基于英伟达的 TensorRT-LLM 或伯克利的 vLLM,这是目前最主流的两个推理框架。

  据硅基流动展示,使用 8 块 A800 GPU 推理 700 亿参数的 Llama2,其语言大模型推理加速引擎 SiliconLLM 在吞吐、时延等指标上超过 vLLM、TensorRT-LLM,部分指标最高可达竞对产品的 10 倍。

  袁进辉称,硅基流动拥有大量长期做 AI 框架的一线技术与工程人才,其中不少人是去了大公司相关团队又回来:“在业务庞大的大公司,AI 框架的优先级不见得很高,而对我们来说,这就是唯一。”

  “第一次创业有了技术影响力,这次想证明好的技术能赚钱”

  从 2017 年创业到 2023 年被收购,OneFlow 没让投资人亏钱,但也没能像国外同行那样独立盈利、快速增长,商业化谈不上成功。

  OneFlow 的境遇不是个例,2016 年之后,中国出现一批基础软件创业公司,它们多尝试开源模式,发展初期有不错的融资,但多数越走越疲惫,鲜有跑出来的成功者。

  这次创业前,袁进辉还是想着做一家面向企业客户的基础软件公司,他请教了创业成功的朋友,得到的反馈是悲观的:“我没想清楚为什么中国那么多优秀人才进入这个行业都做不好,也没看到你在这方面有超出常人的商业认知。”

  对一家想做标准化技术 SaaS(软件即服务)的中国公司到底怎么走通商业化,袁进辉觉得现在他想得更清楚了。

  决定创业时,他第一个想法就是积极开拓海外市场。袁进辉认为,海外、尤其是美国市场数字化程度较高,企业和开发者已经养成了软件付费习惯,培育出了 Databricks、Snowflake 等数百亿美元市值的公司,商业化难度较低,目前硅基流动已经谈下海外客户。

  而在中国市场,他的策略是:绑定一个客户必须付费的产品,如硬件或云计算资源,一起卖软件。

  带着 OneFlow 时期积累的经验和教训,袁进辉说,硅基流动有信心摸索出一条符合大环境的商业化路径。

  在当前的融资环境下,留给硅基流动证明商业化能力的时间更紧迫了。

  一位该领域创业者说,风投机构投资这类基础软件公司时,会因为创业团队的技术提供天使轮资金,但后续投资会更看重实际营收与客户,出手会越来越谨慎。

  硅基流动的办公室在中国大模型和 AI 公司聚集地清华科技园。去年有一天,袁进辉去清华科技园楼下喜家德吃饺子,刚坐下就听到邻桌议论:“OneFlow 技术做得挺好 ...... 最后还不是没挣到钱,被收购。”

  “有时我会想,我们是不是做了一个不好的范例?技术判断没问题,也勤勤恳恳做事,但还是无法取得大家认可的成功。” 袁进辉说,这次决定再创业,不想让团队四散分开,也是想努力证明和实现他觉得简单、正确的道理:“好的技术能赚钱。”

  题图来源:《阿甘正传》

  · FIN ·

标签: 今日热榜

“袁进辉新公司获创新工场、王慧文等5000万投资” 的相关文章

小米汽车上市在即:全新零售店设计图曝光

小米汽车上市在即:全新零售店设计图曝光

  快科技11月26日消息,据多家媒体报道,为了迎接小米的首款车型,小米零售店最新设计图曝光。   据悉,小米SU7目前已经完成了工信部申报,将于2024年上半年正式上市...

超越谷歌、YouTube!微信登顶2024全球最强品牌

超越谷歌、YouTube!微信登顶2024全球最强品牌

  快科技1月17日消息,今天,知名品牌价值评估咨询机构Brand Finance发布了2024年全球品牌价值500强报告,微信以94的BSI评分(满分为100)成为今年全球最强品牌。...

寒武纪2023年净亏损8.4亿元,较上年同期亏损收窄33.50%

寒武纪2023年净亏损8.4亿元,较上年同期亏损收窄33.50%

  凤凰网科技讯 2月28日,寒武纪发布2023年度业绩快报,报告期内,因管理费用、研发费用、资产减值损失较上年同期减少,2023年净亏损8.4亿元,较上年同期亏损收窄33.50%。...

让5G基站便宜如4G!华为将展示RedCap新成果:开启5.5G新时代

让5G基站便宜如4G!华为将展示RedCap新成果:开启5.5G新时代

  快科技2月27日消息,华为发文称,在2024 MWC巴塞罗那期间,华为将携手全球产业伙伴共同展示RedCap丰富的全球商用成果及产业生态,并于2月28日出席由GSMA举办的“移动物联网...

提高免税新能源车技术要求:冬季低温续航衰减率不得超过35%

提高免税新能源车技术要求:冬季低温续航衰减率不得超过35%

  快科技12月11日消息,工业和信息化部、财政部、税务总局今日发布关于调整减免车辆购置税新能源汽车产品技术要求的公告。   2024年1月1日起,申请进入《减免车辆购置...

汽车博主称特斯拉按键转向灯是“王X蛋设计”:四大理由

汽车博主称特斯拉按键转向灯是“王X蛋设计”:四大理由

  1月25日消息,新款特斯拉Model 3于去年9月份开售,车内最大的变化,就是采用了屏幕触控换挡,以及“方向盘按键”式的转向灯控制,不过,这样的方式并非所有人都能接受。...