突发:马斯克Grok开源

2024-03-18每日热点

  作者 | 云鹏

  编辑 | 心缘

  6个月掏出3410亿参数自研大模型,马斯克说到做到!

  智东西3月18日消息,就在刚刚,马斯克的AI创企xAI正式发布了此前备受期待大模型Grok-1,其参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿。

  这是迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

  Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,这种MOE架构重点在于提高大模型的训练和推理效率,形象地理解,MOE就像把各个领域的“专家”集合到了一起,遇到任务派发给不同领域的专家,最后汇总结论,提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

  xAI已经将Grok-1的权重和架构在GitHub上开源。

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

  目前Grok-1的源权重数据大小大约为300GB。

  截至北京时间3月18日上午7时许,Grok-1项目收获了3400颗星。

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

  Grok-1是马斯克xAI自2023年7月12日成立以来发布的首个自研大模型。xAI特别强调说这是他们自己从头训练的大模型。Grok-1没有针对特定应用进行微调。

  xAI是马斯克去年刚刚成立的明星AI创企,其目的之一就是与OpenAI、谷歌、微软等对手在大模型领域进行竞争,其团队来自OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等诸多知名企业和研究机构。

  此前马斯克刚刚“怒喷”OpenAI不够“Open”,后脚这就开源了自家的顶级3410亿参数自研大模型Grok-1。虽然马斯克在预热到发布的过程中也“放了几次鸽子”,但最终他并没有食言。

  今天,xAI还公布了Grok-1的更多细节:

  基础模型基于大量文本数据训练,未针对特定任务进行微调。

  3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%。

  xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头开始训练。

  但此次xAI并没有放出Grok-1的具体测试成绩,其与OpenAI即将发布的GPT-5的大模型王者之战,必将成为业内关注的焦点。

  当然,马斯克发大模型,怎么会少的了大佬隔空对线“互怼”?

  xAI官方消息刚刚发布,ChatGPT的官方账号马上就跟马斯克在X平台上进行了互动,在Grok官方账号评论下回复道:“偷了我的笑话。”

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

  马斯克自然不会示弱,马上说请告诉我OpenAI“Open”之处在哪里。

  马斯克高仿号也马上跑过来添油加醋,说我们都知道是Sam在运营ChatGPT的账号。

  值得一提的是,此次xAI发布Grok-1消息的封面图片,是由Midjourney生成,Grok给出了提示文本:一个神经网络的3D插图,具有透明节点和发光连接,展示不同粗细和颜色的连接线的不同权重(A 3D illustration of a neural network, with transparent nodes and glowing connections, showcasing the varying weights as different thicknesses and colors of the connecting lines)。

  原图:

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

标签: 今日热榜

“突发:马斯克Grok开源” 的相关文章

提供两种动力,国产雪佛兰探界者EV申报图曝光

提供两种动力,国产雪佛兰探界者EV申报图曝光

  近日,我们从相关渠道获取到了国产雪佛兰探界者EV两驱版的申报图和相关信息。该车将搭载单电机驱动系统,并提供两种动力选择,最大功率分别为150千瓦和180千瓦。...

微软365文件查看器迎来更新:速度提升一倍,未来将集成 Copilot

微软365文件查看器迎来更新:速度提升一倍,未来将集成 Copilot

  IT之家 3 月 21 日消息,微软近日宣布了 Microsoft 365 应用(包括 OneDrive、SharePoint 和 Teams)的文件查看器正迎来一系列更新,这些更新将...

7000元手机维修费高达14000元?官方:立案调查!

7000元手机维修费高达14000元?官方:立案调查!

  近日,湖北武汉的卢女士将价值7000元的手机送至一家位于武商广场写字楼的维修店进行维修,经过维修检测之后被告知需支付14000元维修费。这个价格太离谱了,我无法支付。卢女士拒绝支付维修...

胖东来宣布员工将提前3小时下班 创始人:员工长时间太累会生病

胖东来宣布员工将提前3小时下班 创始人:员工长时间太累会生病

  快科技12月28日消息,胖东来是河南省许昌市本土知名企业,胖东来超市在业界可以说是有口皆碑,许多外地游客甚至慕名而来。   今日,一则#胖东来宣布员工将提前3小时下班...

英特尔要在三星大本营“攻城略地”,极力推销18A工艺节点

英特尔要在三星大本营“攻城略地”,极力推销18A工艺节点

  IT之家 2 月 27 日消息,根据韩媒 The Elec 报道,英特尔已针对韩国无晶圆厂芯片公司,大幅增加了营销活动,以推广自家的 Intel 18A 工艺节点。...

vivo X100系列屏幕升级支持高频调光:最后一点遗憾补齐

vivo X100系列屏幕升级支持高频调光:最后一点遗憾补齐

  快科技1月12日消息,vivo韩伯啸透露,vivo X100系列正在内测高频PWM调光,预计本月将会正式推送。   据悉,vivo X100系列在低亮度下是2160H...