罗永浩旗下AI初创项目Jarvis海外上线
近日,罗永浩旗下AI初创项目Jarvis已悄然在海外上线,引发关注。
据悉,Jarvis官网目前展示了一款名为J1 Assistant的AI助理软件的Beta 版本,该软件支持三星Galaxy S24系列、Galaxy S23系列、Galaxy S22系列,以及谷歌Pixel 9系列、谷歌Pixel 8 系列、谷歌Pixel 7系列等多款机型,暂时仅推出安卓版本。
图源:网络
从官方公布的演示视频可见,打开J1 Assistant后,主界面呈现一个名为Ripple Touch的麦克风图标,用户可通过该功能实现与J1 Assistant、谷歌搜索、ChatGPT等的语音交互。
J1 Assistant能够聆听、精准理解语义内容,并给出相应答案,官方称其是一款更智能、更高效、设计更优雅的AI助手,可真正理解用户意图,完成诸如创建待办事项、执行高效搜索等复杂的语音指令。
智元已累计下线1000台通用具身机器人
近日,智元机器人宣布其量产的第1000台通用具身机器人正式下线,其中双足人形机器人远征A2/灵犀X1为731套,轮式通用机器人远征A2-/A2-W为269套。
图源:智元机器人
根据公开信息,智元机器人由华为天才少年“稚晖君”创立,公司在过去一年时间完成七轮融资,估值已达到70亿元。目前,智元机器人旗下已拥有远征A2系列、灵犀X1系列等多款商用人形机器人。
而就在上周,智元机器人被曝已成立一家机器人新公司“软通天擎”,该公司由软通动力、智元机器人等共同持股,其中软通动力直接持股比例为65%,智元机器人为5%。新公司预计将瞄准工业机器人场景,在采集真实工业数据、构建工业垂域大模型的同时推动工业场景下的机器人替代方案落地。
Anthropic将以600亿美元的估值融资20亿美元
据外媒报道,人工智能初创公司Anthropic即将达成协议,将再融资20亿美元,公司估值达到600亿美元。
报道援引消息人士的话称,风险投资公司Lightspeed Venture Partners正在领投本轮融资,新一轮融资总额为60亿美元。
图源:网络
据悉,Anthropic是OpenAI在基础模型领域的主要竞争对手。去年,该公司在Menlo Ventures牵头的一轮融资中估值约为180亿美元。
Anthropic的年化收入约为8.75亿美元,该公司直接或间接通过亚马逊网络服务(Amazon Web services)等第三方云服务销售其模型的访问权限。
高通发布全新骁龙 X 芯片
高通在 CES 2025 展会上发布了最新的 Arm 架构处理器 —— 骁龙 X 系列新成员,将搭载在价格 600 美元左右的 Copilot+ PC 上,这款处理器被简单命名为骁龙 X(Snapdragon X)。
图源:高通
据高通表示,搭载这款新处理器的设备预计将于 2025 年初由宏碁、华硕、戴尔、惠普和联想等厂商推出。除了笔记本电脑外,迷你台式机设计也在计划之中。
这款型号为 X1-26-100 的处理器配备了 8 个高通自研的 Oryon CPU 核心,多核心最高频率可达 3 GHz,总缓存为 30 MB。虽然这些参数在骁龙 X 系列产品线中属于入门级别,但其 45 TOPS 的 Hexagon 神经处理单元(NPU)性能使其符合 Copilot+ PC 的要求。
高通表示,基于骁龙 X 的系统将吸引学生、自由职业者或注重预算的消费者。该公司声称,这款平台在性能上可以与其他 PC 处理器相媲美,同时能够提供数天的续航时间。
智元发布首个机器人4D世界模型
日前,智元机器人具身算法团队宣布推出EnerVerse架构,以自回归扩散模型为核心,通过生成未来具身空间来引导动作规划。
团队设计了一种稀疏记忆(Sparse Memory)机制,用于维持长程任务的上下文逻辑,并提出了自由锚定视角(Free Anchor View, FAV),灵活地表达4D空间。实验表明,EnerVerse拥有卓越的4D生成能力,并在动作规划任务中达到了当前最优(SOTA)水平。
据悉,机器人动作规划的核心在于基于实时观测和任务指令,预测并完成一系列复杂的未来操作,然而现有方法在应对复杂具身任务时存在通用模型局限性和视觉记忆泛化能力不足。
而EnerVerse通过逐块生成的自回归扩散框架,结合创新的稀疏记忆机制与自由锚定视角方法,可以有效解决上述瓶颈问题。
图源:智元机器人
实验结果显示,在短程与长程任务视频生成中,EnerVerse 均展现出卓越的性能,特别是在短程生成任务中,EnerVerse表现优于现有微调视频生成模型,如基于DynamiCrafter与 FreeNoise的扩散模型。
在LIBERO基准测试中,EnerVerse在机器人动作规划任务中取得了显著优势,单视角(one FAV)模型在LIBERO四类任务中的平均成功率已超过现有最佳方法,多视角(three FAV)设定进一步提升任务成功率,在每一类任务上均超越现有方法。
此外,EnerVerse生成的未来空间与预测的动作空间具有较强的时序一致性,表明EnerVerse 在未来空间生成与动作规划任务中具有相关性与优势。
目前,EnerVerse项目主页与论文已上线,模型与相关数据集即将开源。
微软正式开源 Phi-4 语言模型
微软于 2025 年 1 月 8 日正式宣布,将其 Phi-4 语言模型完整开源,并在 AI 代码共享平台 Hugging Face 上发布了包含模型权重在内的所有内容。该模型采用 MIT 许可,这意味着开发者可以将其用于商业应用。
图源:微软
Phi-4 是一个仅有 140 亿参数的小型语言模型,其训练数据包含 9.8 万亿个 tokens,涵盖经过严格筛选的公开文档、类似教科书的合成数据以及高质量的学术著作和问答数据集。尽管体量较小,但在多项基准测试中表现出色,特别是数学推理和编程。该模型在 MATH 和 MGSM 等具有挑战性的基准测试中得分超过 80%,超越了包括 Gemini Pro 和 GPT-4o-mini 在内的多个更大规模模型。
在 2024 年 11 月的美国数学竞赛测试中,Phi-4 取得了 91.8% 的平均得分,这一成绩出人意料地超过了所有参与测试的竞争对手。值得注意的是,这些测试题目是在模型训练完成后才出现的,这证明了模型具有真正的推理能力,而不仅仅是记忆训练数据。
xAI 推出 Grok 独立 iOS 应用
xAI 公司今日宣布,其 AI 聊天机器人 Grok 的独立 iOS 应用已在 App Store 正式上线,该应用此前已在澳大利亚等少数国家进行测试,现已扩展到更多地区。
图源:App Store
这款应用搭载了最新的 Grok 2 模型,具备实时信息查询、问答对话、图像生成等功能。用户可以通过该应用获取来自网络和 X 平台(原 Twitter)的最新信息。此外,该应用还支持 iOS 系统特有功能,包括控制中心集成、Siri 语音助手以及快捷指令等。
Grok 此前仅作为 X 平台的内置功能向用户开放,自上个月起,该服务已对所有 X 用户免费开放,与 OpenAI 的 ChatGPT、Anthropic 的 Claude、谷歌的 Gemini 以及微软的 Copilot 等竞品采取相同策略。
同时,xAI 正在筹备独立网站 Grok.com,目前该网站显示"即将推出"。该公司在去年六月获得 60 亿美元融资后,最近又完成新一轮 60 亿美元融资,投资方包括英伟达和 AMD 等战略投资者。
谷歌将更多AI团队并入DeepMind
日前,谷歌AI Studio开发者平台产品负责人Logan Kilpatrick在社交媒体X上的一篇推文中表示,谷歌AI Studio团队和Gemini系列模型API开发团队将被转移到谷歌DeepMind旗下。
图源:网络
Kilpatrick在推文中写道,“此举将使我们能够加强部门间合作,并加快从研究到开发人员的管道,我们团队的使命保持不变。”
据悉,在AI Studio合并前的几个月,谷歌还将负责其模型研究的AI团队转移到了DeepMind,包括Gemini聊天机器人团队,谷歌首席执行官Sundar Pichai称,此次重组旨在不断加快谷歌人工智能开发的步伐。
在去年12月谷歌全体会议中,Pichai将Gemini聊天机器人具有“强劲的势头”,同时也表示谷歌在2025年将有更多工作要做,包括“缩小差距并在行业中建立领导地位”。