2025 年,小米的 AI 战略要分三步走

IP归属:广东

2024 年的最后一天,雷军很忙。

他不仅出现在小米汽车工厂跨年直播中,为小米的 2024 年作了最终的总结与展望,吸引超 3700 万人次观看,还神秘连线哔哩哔哩跨年晚会,介绍了自己的 2025 个人愿望。

在小米的 2024 年总结中,雷军用 12 张照片回顾了 2024 年的一些难忘瞬间,包括小米汽车首场发布会、给小米 su7 车主开车门、小米 15 发布会等。可以说,手机、汽车、AI 无疑是小米 2024 年最为重要的三个关键词。

雷军表示,随着小米汽车业务步入正轨,他开始将注意力转向 AI 领域,这不仅是个人兴趣所在,也是小米生态系统的一次战略延展。

图源:网络

AI 已成为众多企业竞相角逐的新高地。作为一家以创新为驱动的科技巨头,小米在 AI 领域的布局并非一蹴而就,而是经历了从萌芽到深耕的漫长历程。

早在 2016 年,小米便组建了技术团队,开启了对 AI 这一前沿领域的探索征程。从最初简单的语音指令执行,到如今能精准理解用户复杂意图、提供个性化服务,AI 助手小爱助手成为小米 AI 技术落地的典型范例,也见证着小米 AI 从无到有再到精的过程。

2024 年,小米 AI 发展又迎来关键转折点,AI 成为贯穿手机、汽车、家居生态的纽带。从人才投入、模型技术再到产品融合,小米的 AI 三步走战略还将继续成为 2025 的主基调。

小米 AI 实力的背后:研发与人才

小米虽然早早就有 AI 相关研究,但真正能够被称为小米 AI 大模型起点的还是 2023 年。这一年,小米 AI 实验室大模型团队正式组建。

团队成员来自五湖四海且背景多元,其中既有在 AI 深耕多年的行业专家,也有在机器学习、自然语言处理方向颇有建树的人才。负责人栾剑曾任职东芝(中国)研究院、微软(中国)工程院,技术积累深厚。

公开资料显示,自 2016 年组建 AI 团队以来,小米经过 7 年 6 次扩展,相关领域人员规模已达 3000 多人,其 AI 技术能力已覆盖视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态方向,并逐步接入手机、汽车、AIoT、机器人等业务板块。

2024 年底,又有消息传出雷军正以千万年薪招揽人才,罗福莉就是在这一背景下加入小米并担任小米 AI 实验室的大模型团队负责人的。

图源:网络

罗福莉本科就读于北京师范大学计算机专业,大三时进入北大语言计算实验室实习,选择 NLP 作为科研方向,之后又保研进入北京大学计算语言学研究所深造。2019 年,罗福莉在人工智能领域顶级国际会议 ACL 上发表 8 篇论文,其中 2 篇为第一作者,硕士两年间在国际顶会上发表超过 20 篇论文。

毕业后,罗福莉进入阿里达摩院机器智能实验室,负责 AliceMind 开源项目,主导开发了多语言预训练模型 VECO,该模型在 xtreme 排行榜上曾排名第一。2022 年,罗福莉选择加入幻方量化从事深度学习相关策略建模和算法研究,之后又担任 DeepSeek 深度学习研究员,参与研发 MoE 大模型 DeepSeek-V2。

而在罗福莉之前,小米在今年还对公司 AI 组织架构进行了一轮调整,公司基础技术平台部成立 AI 平台部,本质上属于小米技术委员会,由张铎担任 AI 平台部负责人,向基础技术平台部总经理冯宏华汇报。

说到张铎,这位技术大牛曾在 2016 年-2021 年间任职小米,被雷军称作“小米的大神”。

图源:网络

据悉,张铎毕业于清华大学计算机科学与技术系,此前在小米任职的 5 年间,曾负责小米开源工作的规划与推进,参与了小米多个核心项目的开发。期间,张铎在 2015 年成为 Apache HBase 项目的 Committer,2016 年晋升为该项目的 PMC 成员,也是国内第一位 HBase 的 PMC 成员,2019 年成为 HBase 项目主席。

2021 年从小米离职后,张铎选择加入神策数据,担任基础研发部负责人和首席架构师,直到 2024 年 9 月,张铎在朋友圈发文晒出小米新员工工牌,宣布回归小米。

罗福莉、张铎的加入被外界视作小米全面发力大模型的信号之一,雷军一度觉得小米在大模型领域发力太晚。因此,除了人才招募以外,小米为了追赶第一梯队,近些年在研发投入方面也是下足了血本。

2023 年第一季度,小米研发支出就达到 41 亿元,同比增长 17.7%,全年总研发投入超 200 亿元;2024 年,小米研发投入再升级,预计达 240 亿元。在 2022 - 2026 五年内,小米研发投入总额预计超千亿,超 70%流向 AI、OS、芯片领域。

模型突破刚需算力局部,

小米搭建 GPU 万卡集群

成立至今,小米 AI 团队成果颇丰。

2024 年 5 月,小米大语言模型 MiLM 正式通过大模型备案,未来将逐步应用于小米手机等产品中。8 月,小米发布了大规模预训练语言模型 MiLM-6B,参数规模达到 64 亿。

图源:小米

在 2024 年 8 月的 C-Eval、CMMLU 大模型评测榜单中,MiLM 模型总榜排名第 10,在同参数级别的模型中排名第 1。在 STEM 全部 20 个科目中,MiLM 模型在物理、化学、生物等多个项目获得了较高的准确率。

11 月,小米又推出第二代自研大语言模型 MiLM2,在指令跟随、闲聊、翻译等关键能力上相比首代模型平均提升超过 45%,支持最长 200k 文本窗口。

MiLM2 涵盖 0.3B 至 30B 多个量级,以适应不同的业务场景和资源需求。其中 0.3B 到 6B 的模型可完成具体、低成本任务;6B 至 13B 的模型支持多任务微调;30B 模型专为云端设计,具备强大的 zero-shot 学习和复杂任务处理能力。

此外在研究领域,2024 年,小米 AI 实验室大模型团队有 5 篇论文被 ACL 2024 录用,2 篇被 EMNLP 2024 录用。其中 Mobile-Bench 评估基准用于评估 LLM 手机智能体的能力,DetermLR 思维框架可增强 LLM 的逻辑推理能力,ToolPlanner 两阶段强化学习框架,可提升模型的任务完成和指令遵循能力,MobileVLM 则增强了大模型对手机 UI 内和 UI 之间的理解。

雷军曾对外多次公开表态称,小米在 AI 领域耕耘多年,面对大模型浪潮,必将全力以赴。而从 AI 大模型研发上看,模型能力都是建立在算力基础之上的,可以说算力才是 AI 大模型研发的关键基石。

从数据上看,AI 大模型动辄数十亿、上百亿参数,例如 GPT-3,就需要海量训练数据计算。

这时,单张 GPU 显然力不从心,集群并行计算才是大模型训练的出路。据估算,训练 GPT-3 最大的 1750 亿参数模型大约需要 3.14×10²³ 次浮点运算,若以英伟达 A100 GPU 为例,其具有每秒 19.5 万亿次(19.5TFlops)的浮点运算能力,在 10 天内完成训练大约需要 10830 个英伟达 A100 GPU。

可见,通过将复杂计算任务拆解,分配到数千张 GPU 同时处理,能大幅缩短训练周期。以图像识别模型训练为例,传统单卡模型训练需要数月时间,而这一数字在万卡集群加持下,可以直接缩减至几周甚至几天完成。

也正因此,头部的大模型公司基本都在投资基础算力。

2024 年年中,Meta 透露训练 Llama 4 模型预计将使用 24 万块 GPU,是 Llama 3 所使用 GPU 数量的十倍,并计划在年底之前部署 35 万块英伟达 H100 GPU。

图源:网络

10 月,马斯克也宣布 xAI 将建立全球最大的 AI 超算,配备 10 万张英伟达 H100 卡,未来还将扩展至 20 万张。

视线放到国内,上周,有传言称小米正在着手搭建自己的 GPU 万卡集群,将对 AI 大模型大力投入,其中有 6500 张 GPU 资源是小米大模型团队成立之时就已投入使用的。

知情人士称,该计划已施行数月之久,雷军曾表示,“在 AI 硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不 all in 是不可能的。”而这也侧面说明,小米的 AI 研发路径基本还是服务于公司旗下产品的。

再回看雷军的跨年直播可以发现,AI 在小米的战略规划中属于是手机、汽车等产品的“第二发展曲线”,是下一个赋能小米全生态产品爆发的关键。

从手机、汽车再到智能家居,

AI 赋能小米全生态爆发

回顾整个 2024,AI 几乎是所有手机厂商发力的重点,小米也是如此。对于小米来说,AI 的俨然已经成为贯穿手机、汽车、家居生态的 “智能纽带”,可以为用户编织出紧密便捷的连续生活场景。

图源:小米

在手机生态,小米做到了操作系统和应用功能的两手抓。小米澎湃 OS 2 发布时就搭载了前瞻性的端边云 AI 子系统,HyperAI 将端云大模型矩阵、多设备端侧感知、跨端执行能力全面整合,拥有 AI 写作、AI 识音、AI 字幕、AI 妙画等功能。

此外,HyperAI 还能将敏感数据在硬件端侧进行加密保存,用户可随时管理和清空存储在超级小爱中的记忆数据,借助 AI 技术加强了安全和隐私保护。

在应用层面,小米推出全生态 AI 智能助手超级小爱,利用多模态能力,简化用户面对海量设备时复杂的操作,打通感知 - 理解 - 执行的全链路操作,通过大模型的支持进一步优化小爱同学的语音识别技术以及智能设备的互动体验。

在影像系统中,小米 15 系列手机将 AI 融入交互、影像、性能优化各层面。AI 场景智能识别拓展至超 500 种,拍摄城市夜景,AI 精准调优曝光、降噪,暗处细节清晰,霓虹灯光色彩还原逼真。

图源:小米

在汽车生态,小米将自研底层算法与大模型融合。如采用变焦 BEV 技术,能根据车辆行驶场景切换识别模式;超分辨率占用网络技术,可提高对障碍物的识别精确度,支持雨雪天气的智能降噪。

道路大模型方面,小米自研无图方案道路大模型,可实时生成道路拓扑和高精度地图,实现路口识别、障碍物自动绕行等功能,其效果媲美高精地图。端到端的感知决策大模型将感知决策算法二合一,大模型实时观察、动态调整,甚至可以将 200cm 的车停进 210cm 车位。

智能座舱体验方面,HyperMind 成为智能座舱的“大脑”,通过深度学习对用户操作习惯进行学习,实现 主动智能及跨端智联。

车载小爱则提供了语音交互功能,在小米 SU7 上市发布会上,雷军介绍了小米 SU7 车型搭载的 “全新小爱大模型”。车载小爱支持连续对话,单次唤醒后可连续发出语音指令控车,无需反复唤醒,同时还具备协同唤醒功能,在车内时只会唤醒车内的小爱同学,避免与其他设备产生干扰。

小爱同学还可以覆盖全部核心控车功能,能语音控制车窗、HUD、后视镜等,即使在离线或无信号的地区,小爱同学也能正常使用,通过语音实现对中控屏显示内容的操控。

图源:小米

在智能家居生态,小米的 AI 布局同样基于小爱同学及多种 AI 算法。通过对大模型的算法进行深度定制与优化,小爱同学更适应智能家居场景,能更准确地理解用户意图,更流畅地进行对话交流。未来,小米在家居、智能电器等多个领域还会不断拓展,并发布几款令人期待的智能家居新产品。

当然,得益于小米澎湃 OS 自研的跨端互联框架 Xiaomi HyperConnect,多种小米设备也能实现跨端协同,人、车、手机、可穿戴设备、家居都能实现深度互联和协同,让用户在不同设备上获得连贯一致的 AI 体验。

AI 的发展的是如此之快,2023 年才成立的 AI 实验室大模型团队,就已经开始在小米全生态链产生影响。回顾小米 AI 的发展历程,从 2016 年团队初建,到 2024 年的 “人车家全生态” 出现,越来越多超乎想象的智能场景开始走进千家万户。

在跨年直播中,雷军提到了自己的三个 2025 年新年愿望,一是 2025 年交 30 万辆车;二是有时间去更多地方看看美景、尝尝美食,顺便测测汽车;三是明年要好好健身,打算在健身房打卡 100 次。

图源:网络

这三个愿望或许也在一定程度上反映了小米的 AI 愿景,在汽车中欣赏诗与远方时,我们有 AI 助手陪伴在侧,在健身房健身时,我们也有手机 AI 和手表 AI 提醒着锻炼注意事项,并监控健康指标。

AI 通过与产品的融合,已经融入生活,我们也期待在 2024 年交出优秀答卷后,小米依旧能在2025年延续之前的人才投入-模型技术-产品融合三步战略,在 AI 融合的道路上越走越远,直至让 AI 完全成为生活的一种必不可少的体验。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10119079.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章