创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件

2023-11-15每日热点

  凤凰网科技讯 11月15日,创新工场CMO发朋友圈回应Yi大模型“抄袭LLaMA”事件,她表示零一万物发布Yi-34B模型训练的说明,回应对于模型架构的探讨舆论。

  创新工场CMO发文表示,沿用行业演进渐成通用大模型“抄袭LLaMA”事件、生态拥抱的基础架构就成了“套模、山寨“?(就像手机app开发者都得益于ios、Android的共通架构)。零一万物会持续从社区中虚心学习,持续进步。

/

  根据说明内容显示,零一万物从零开始训练了Yi-34B和Yi-6B模型,并根据实际的训练框架重新实现了训练代码,用自建的数据管线构建了高质量配比的训练数据集(从3PB原始数据精选到3T token高质量数据)。

  在零一万物初次开源过程中,我们发现用和开源社区普遍使用的LLaMA 架构会对开发者更为友好,对于沿用LLaMA部分推理代码经实验更名后的疏忽,原始出发点是为了充分测试模型,并非刻意隐瞒来源。零一万物对此提出说明创新工场CMO发文回应Yi,并表达诚挚的歉意,我们正在各开源平台重新提交模型及代码并补充LLaMA 协议副本的流程中,承诺尽速完成各开源社区的版本更新。

  相关阅读:

  零一万物对Yi-34B训练过程的说明

标签: 今日热榜

“创新工场CMO发文回应Yi大模型“抄袭LLaMA”事件” 的相关文章

为保护iPhone生态,苹果取消Apple Watch和Health应用的兼容安

为保护iPhone生态,苹果取消Apple Watch和Health应用的兼容安

  IT之家 11 月 2 日消息,根据彭博社报道,苹果健康团队曾深入开发相关代码,让 Apple Watch 和 Health 应用能够兼容数十亿台安卓设备e Watch和Health应...

阿里云第八代企业级实例g8i算力升级:整机性能提升85% AI推理最高提速7倍

阿里云第八代企业级实例g8i算力升级:整机性能提升85% AI推理最高提速7倍

  凤凰网科技讯 (作者/蒋浇)1月11日,全球领先的云计算厂商阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,国内首发代号Emerald Rapids的第五代英特尔至强可扩展...

全球汽车零部件大厂佛瑞亚宣布裁员1万人,以应对电动汽车转型挑战

全球汽车零部件大厂佛瑞亚宣布裁员1万人,以应对电动汽车转型挑战

  IT之家 2 月 20 日消息,全球第八大汽车零部件供应商法国佛瑞亚(Forvia)近日宣布,将在未来五年内在欧洲裁员 10,000 人,占其员工总数的 13%。此举旨在削减成本、提升...

京东一线客服全员涨薪:超2万名 平均超30%

京东一线客服全员涨薪:超2万名 平均超30%

  凤凰网科技讯 (作者/蒋浇)2月5日,京东集团宣布,自2024年2月1日起,超2万名京东一线客服员工实现全年平均薪酬上涨超过30%。据悉,京东客服成立于2009年,目前已发展成为行业内...

2.5万起 苹果头显预售18分钟内售罄:代购加价上万

2.5万起 苹果头显预售18分钟内售罄:代购加价上万

  快科技1月21日消息,1月19日晚上21:00,苹果Vision Pro正式在美国地区开启预售。   提供256GB、512GB和1TB三种版本,售价分别是3499美...

苹果AirPods耳机新专利曝光:采用柔性结构设计,可拉伸可弯曲

苹果AirPods耳机新专利曝光:采用柔性结构设计,可拉伸可弯曲

  IT之家 11 月 15 日消息,根据美国商标和专利局今天公示的清单,苹果公司获得了一项关于 AirPods 耳机的设计专利,展示了苹果耳机未来可能的变化。...