Meta 推出 MobileLLM，智能手机也能跑大模型_陀螺科技

我要发布

Meta 推出 MobileLLM，智能手机也能跑大模型

前方智能原创 2024-07-09 10:23 热度 80759

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

编译/前方智能

Meta 的研究团队近日发布了一项重要研究，推出了名为 MobileLLM 的新型语言模型。这项技术旨在为智能手机等资源受限设备创建高效的 AI 模型，挑战了传统认为高效语言模型必须庞大的观念。

图源：Meta

MobileLLM 的核心创新在于优化少于 10 亿参数的模型，相比 GPT-4 等超大模型，规模大幅缩小。研究团队采用了多项创新技术，包括优先考虑模型深度、实施嵌入共享和分组查询注意力机制，以及使用新型即时分块权重共享技术。

测试结果显示，MobileLLM 在常见基准任务上的表现比同等规模模型提高了 2.7% 至 4.3%。特别值得注意的是，仅有 3.5 亿参数的 MobileLLM 版本在某些 API 调用任务上展现出与 70 亿参数 LLaMA-2 模型相当的准确性。

Meta 首席 AI 科学家 Yann LeCun 强调了这项研究的重要性。虽然 MobileLLM 尚未公开使用，但 Meta 已开源预训练代码，为未来研究奠定基础。这一发展预示着更高效、更易获得的 AI 技术即将到来，有望在个人设备上实现更先进的 AI 功能，为用户带来全新的应用体验。

来源：Meta

Meta MobileLLM 模型

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10113889.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇： Crypto市场迎来转机？上周资金流入4.41亿美元

下一篇： Anthropic CEO：未来三年AI模型训练成本将会上升到1000亿美元

相关文章

解读ChatGPT Atlas背后的数据边界之战

大模型炒币谁最强，国产 AI 竟遥遥领先？

微软发布自研图像生成模型 MAI-Image-1

一根香蕉引发的AI狂潮

AI芯天下丨产业丨2025中国产业AI以小模型破局，欲叩...

传亚马逊正在开发两款AR眼镜，最快明年发售；vision...