苹果AI终于来了从27到30亿四款大年夜模型代码全开源AI技能持续狂飙｜钛媒体AGI

苹果公司溘然公布了一则大新闻。

北京韶光4月25日凌晨，苹果在 Hugging Face 平台上发布一个“具有开源演习和推理框架的高效措辞模型”，名为 OpenELM。

据理解，OpenELM有四种尺寸：2.7亿、4.5亿、11亿和30亿个参数版本，定位于超小规模模型，而微软Phi-3模型为38亿。
这种小模型运行本钱更低，可在手机和条记本电脑等设备上运行。

同时，在WWDC24开拓者大会之前，苹果彻底开源了OpenELM模型权重和推理代码，数据集和演习日志等。
而且，苹果还开源了神经网络库CoreNet。

苹果AI终于来了从27到30亿四款大年夜模型代码全开源AI技能持续狂飙｜钛媒体AGI

早在今年2月，苹果公司CEO蒂姆·库克（TimCook）就表示，苹果天生式 AI 功能将于“今年晚些时候”推出，有称即将在6月发布iOS 18可能是苹果iOS史上“最大”的更新，而9月也将推出首款AI iPhone设备。

如今，苹果彷佛在新一轮AI浪潮快到尾声的时候追遇上了行业脚步。

代码: https://github.com/apple/corenet

hf: https://huggingface.co/apple/OpenELM

论文: https://arxiv.org/abs/2404.14619

预演习tokens数量减一半，11亿参数苹果模型效果却比竞品更精准

随着ChatGPT风靡环球，近几个月来，三星、谷歌、小米等手机厂商全面推进大措辞模型在手机、平板等端侧上的利用，包括照片处理、笔墨处理增强等，并形成一大卖点。
而苹果很少透露并极少有类似的自带功能，紧张是用第三方工具做到类似效果。

今年2月财报会议上，库克首次公布天生式 AI 操持，并将在今年晚些时候将 AI 技能集成到其软件平台（iOS、iPadOS 和 macOS）中。

库克表示，“我只想说，我认为苹果在天生式 AI 和 AI 方面存在着巨大的机会，无需透露更多细节，也无需超出自己的预期。
展望未来，我们将连续投资于这些和其他将塑造未来的技能。
个中包括 AI，我们连续在 AI 领域花费大量韶光和精力，我们很高兴能在今年晚些时候分享我们在该领域正在进行的事情的细节。
我们对此非常愉快。
”

实际上，自年初至今，苹果在天生式 AI 领域动作不断。
今年3月，苹果技能团队揭橥论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》，首次表露苹果大模型MM1，涵盖300亿参数、支持多模态、支持MoE架构，超半数作者属于华人。

如今，针对手机、平板等端侧领域，苹果真正的开源模型终于来了。

据论文显示，苹果开源了大措辞模型OpenELM，有指令微调和预演习两种模型版本，共有2.7亿、4.5亿、11亿和30亿4种参数，供应天生文本、代码、翻译、总结择要等功能。

虽然最小的参数只有2.7亿，但苹果利用了包括RefinedWeb、去重的PILE、RedPajama的子集和Dolma v1.6的子集在内的公共数据集，一共约1.8万亿tokens数据进行了预演习，这也是其能以小参数表现出超强性能的紧张缘故原由之一。

例如，11亿参数的OpenELM，比12亿参数的OLMo模型的准确率赶过2.36%，而利用的预演习数据却只有OLMo的一半。

在演习流程中，苹果采取了CoreNet作为演习框架，并利用了Adam优化算法进行了35万次迭代演习。
而苹果的MobileOne、CVNets、MobileViT、FastVit等有名研究都是基于CoreNet完成的。

苹果在论文中还表示，与以往只供应模型权重和推理代码并在私有数据集上进行预演习的做法不同，苹果发布的版本包含了在公开数据集上演习和评估措辞模型的完全框架，包括演习日志、多个检讨点和预演习配置。
同时，苹果还发布将模型转换为 MLX 库的代码，以便在苹果设备上进行推理和微调。

“这次全面发布旨在增强和巩固开放研究社区，为未来的开放研究事情铺平道路。
”苹果研究团队表示。

此外，OpenELM不该用任何全连接层中的可学习偏置参数，采取RMSNorm进行预归一化，并利用旋转位置嵌入编码位置信息。
OpenELM还通过分组查询把稳力代替多头把稳力，用SwiGLU FFN更换了传统的前馈网络，并利用了Flash把稳力来打算缩放点积把稳力，能以更少的资源来进行演习和推理。
同，苹果利用了动态分词和数据过滤的方法，实现了实时过滤和分词，从而简化了实验流程并提高了灵巧性。
还利用了与Meta的Llama相同的分词器，以确保实验的同等性。

这次，苹果很有诚意将代码开源，一开到底，把所有内容都贡献出来了。
仅1天多的韶光，该模型GitHub平台上就得到超过1100颗星。

而目前，大模型领域紧张分为开源和闭源两大阵营，国内外有名闭源的代表企业有OpenAI、Anthropic、谷歌、Midjourney、百度、出门问问等；开源阵营有Meta、微软、谷歌、商汤、百川智能、零一万物等。

苹果作为手机闭源领域的领导者，这次却罕见地加入开源大模型阵营。
有剖析认为，这可能在效仿谷歌的办法先通过开源拉拢用户，再用闭源产品去实现商业化营利。

同时，这也表明苹果进军 AI 大模型领域的武断决心。

作为同为端侧模型、开源模型企业，商汤科技联合创始人、首席科学家王晓刚近期对钛媒体App表示，开源还是对付全体社区的发展还是非常主要的，是一个主要驱动力。
终极大模型的发展包括各种运用，还是要全体社区共同去推动的。
对付大模型的运用也分为不同的层次，这么多行业对运用的需求也是不一样的，丰富的开源社区非常主要。

AI 技能持续“狂飙”，OpenAI得到了环球第一块DGX H200

不止是苹果，本日凌晨，国内外 AI 技能依然“狂飙”，干系满天飞。

今晨，OpenAI联合创始人、COO Greg Brockman发推文表示，英伟达向该公司移交环球范围内第一块DGX H200，此举旨在“推进人工智能、打算技能与人类的发展”。

同时，他也发布了一张合影，还包括英伟达CEO黄仁勋、OpenAI CEO奥尔特曼（Sam Altman），看起来三人非常愉快。

早在2016年，OpenAI刚成立不久，黄仁勋便亲自将环球首台装备了8块英伟达P100芯片的超级打算机DGX-1送到了OpenAI的办公室。

这台代价逾百万美元的DGX-1，是黄仁勋带领英伟达3000名员工，历时三年精心打造的成果。
它极大地提升了OpenAI的打算能力，将原来须要一年的演习韶光缩短至仅一个月。

当时，OpenAI还处于一个初创阶段的非营利机构，这台超级打算机无疑是一份极具分量的礼物。
马斯克、Sam Altman以及其他早期员工对此感到无比激动，纷纭在这台DGX-1上留下了自己的署名。

2023年11月13日，英伟达发布了新一代AI GPU——NVIDIA Grace Hopper H200超级芯片，其内存容量和带宽分别是H100的两倍和1.4倍，最高支持19.5TB，AI 性能达128 petaFLOPS FP8，估量2024年第二季度开始供货。

黄仁勋称，这是拥有万亿规模的新型 AI 超级打算机，为巨型 AI 模型供应具有线性可扩展性的海量共享内存空间，能够在天生式 AI 时期发挥巨大潜力。

如今，黄仁勋亲手将环球第一块DGX H200送给了OpenAI。

同时，据CTech宣布，英伟达以约7亿美元收购了以色列AI根本举动步伐编排和管理做事Run:ai，据悉，Run:ai成立于2018 年，迄今已筹集1.18亿美元，同时英伟达还收购了Deci公司。

其余，本日凌晨，拥有环球首个 AI 代码工程师的背后企业Cognition被曝完成了一轮1.75亿美元的融资，由Founders Fund 领投，仅仅一个月内，公司估值从3.5亿美元增长到20亿美元，引发关注。

Gartner剖析师John-David Lovelock表示，随着Anthropic、OpenAI 等第一梯队的玩家霸占主导地位，AI投资范围正在“向外延展”（spreading out）。

“数十亿美元的投资数量已经放缓，而且险些已经结束；热钱涌向了新方向——AI 运用。
”上述剖析师表示，“大模型须要大量投资，但市场现在更多地受到科技公司的影响，这些公司将利用现有的 AI 产品、做事和产品来构建新产品。
”

Greylock合资人Seth Rosenberg认为，人们对付帮助AI领域的“大批新玩家”的兴趣本来就较很小。
在这个周期的早期阶段，投资根本模型成本非常密集，比较之下，AI 运用和智能体所需的成本较低，这可能是绝对美元融资额低落的缘故原由。

Thomvest Ventures 董事总经理 Umesh Padval 将 AI整体投资的缩减，归因于增长低于预期。
他表示，最初的激情亲切已经让位于现实—— AI 面临一部分技能寻衅，一部分上市寻衅，可能须要数年韶光才能办理并完备战胜。

”AI 投资放缓反响出人们认识到，我们仍在探索 AI 技能发展及其在各行业运用的早期阶段。
虽然长期市场潜力仍旧巨大，但最初的激情亲切已被在实际运用中推广 AI 技能的繁芜性和寻衅所削弱……这表明投资环境更加成熟和敏锐。
“Umesh Padval表示。

如今，AI 持续“狂飙”，但全体市场方向已快速转变，端侧模型、AI 运用、行业大模型等都将成为今年全体 AI 领域新趋势。

（本文首发于钛媒体App，作者｜林志佳，编辑｜胡润峰）

每期AI知识网

苹果AI终于来了从27到30亿四款大年夜模型代码全开源AI技能持续狂飙｜钛媒体AGI

缠论的四种机械化操作手腕

视觉发声实现零样本语音合成华为云论文入选顶会ACL 2024