全球首款 AI Agent 产品上线;谷歌创始人开设新 AI 公司;AI 先驱荣获 2024 年图灵奖

IP归属:广东

AMD 发布新一代 RDNA 4 架构显卡,将于 3 月 6 日上市

AMD 近日正式发布了新一代 RDNA 4 架构和基于该架构的 Radeon RX 9070 系列显卡,定位中端市场,将于 3 月 6 日正式开售。这一系列包括两款产品:售价 549 美元的 RX 9070 和售价 599 美元的 RX 9070 XT。

图源:AMD

这两款显卡都采用 RDNA 4 架构,相比上一代产品有显著提升:第三代光线追踪加速器,每计算单元光追性能是 RDNA 3 的两倍;第二代 AI 加速器,在稀疏矩阵计算时比上一代提升最高可达 8 倍;两款显卡均配备 16GB GDDR6 显存和 256 位内存接口;PCIe 5.0 插槽支持,DisplayPort 2.1a 和 HDMI 2.1b 接口。

根据 AMD 发布的数据,RX 9070 在 1440p 分辨率下性能比上一代 RX 7900 GRE 提升约 20%,而 RX 9070 XT 则提升约 38%。更高端的 RX 9070 XT 据称性能仅比英伟达的 RTX 5070 Ti 低 2%,但价格却低了 150 美元。

这两款显卡同时还支持新一代的 AMD FSR 4(FidelityFX Super Resolution 4)技术,这是一种基于机器学习的超分辨率技术,可以在保持画质的同时显著提升帧率。AMD 表示,FSR 4 在发布时将支持 30 款游戏,年底前将扩展到 75 款以上。

杭州参投,智谱完成新一轮10亿元融资

近日,国内大模型独角兽智谱AI完成逾 10 亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等地方国资平台。新募资金将重点投向 GLM 大模型技术研发体系构建及开发者生态建设。

这也是DeepSeek之后,杭州再次加码国内大模型企业。此前,智谱已在杭州成立浙江智谱新篇科技有限公司,该公司将依托前沿人工智能和大模型技术,更好服务浙江省和长三角地区蓬勃发展的经济实体,全面推动基于人工智能技术的数字产业转型升级。

图源:网络

随着开源生态建设成为新一轮竞争焦点,在DeepSeek加速布局的背景下,智谱AI宣布2025年将成为智谱的开源年,将很快发布全新大模型(涵盖基座模型、推理模型、多模态模型、Agent 等)并开源。

作为国内最早开源大模型的人工智能公司,智谱一直致力于推动AI普惠,陆续开源了多款模型,通过开发者社区扩大产业影响力。在商业化方面,智谱一直是“大模型六小虎”的领头羊。据悉,今年春节复工后不到一个月,智谱收入就超过1亿元,其API平台付费节后增长超过30%。

深圳企业优必选实现全球首例多台人形机器人自主协同作业

近日,深圳企业优必选在极氪5G智慧工厂开展全球首例多台、多场景、多任务的人形机器人协同实训,探索建立面向多任务工业场景的通用人形机器人群体作业解决方案,推动人形机器人从单机自主向群体智能进化。

在此次实训中,优必选首次将群体智能技术引入人形机器人,实现多机协同作业。为此,优必选提出了人形机器人群脑网络(BrainNet)软件架构,并设计人形智能网联中枢Internet of Humanoids (IoH),为群体智能的软硬件实现提供了可借鉴的路径。

图源:网络

针对人形机器人群体协作场景,优必选群脑网络(BrainNet)架构由端云协同的推理型节点和技能型节点灵活链接,形成群体维度下的超级大脑和智能小脑。

其中,超级大脑基于多模态具身推理大模型,重点突破智能混合决策技术,实现复杂产线级任务的高维决策;智能小脑则基于Transformer模型,创新研发跨场域融合感知技术和多机协同控制技术,支持多机并行分布式学习,加速技能生成与迁移。

截至目前,优必选已与比亚迪、富士康、顺丰、东风柳汽、吉利汽车、一汽-大众青岛分公司、奥迪一汽、北汽新能源等多家行业领军企业达成合作,自主研发的工业人形机器人Walker S系列已成功进入多家车厂,并完成了第一阶段的单机自主智能实训。

Stability AI 与 Arm 合作推出端侧生成式音频模型

Stability AI 和 Arm 近日宣布成功优化 Stable Audio Open 模型,使其能够完全在移动设备的 ARM CPU 上运行,成为首个可在智能手机上完全离线运行的文本到音频 AI 模型。

图源:Stability AI

通过利用 ARM KleidiAI 技术和 Stability AI 的优化,该模型的响应时间提升了 30 倍,将音频生成时间从数分钟缩短至几秒钟。用户只需输入文本描述(如"日落时分的轻柔海浪声"),即可在几秒钟内生成相应的音频,无需连接网络。

这一突破使得高级 AI 音频功能得以普及,让全球数十亿智能手机用户受益,特别是考虑到全球 99% 的智能手机都基于 ARM 技术。

该合作不仅解决了复杂的 AI 挑战,还为未来在移动设备上部署更多生成式 AI 应用铺平了道路。Arm 和 Stability AI 计划进一步优化性能,以提升用户体验,并最终将音频、图像、视频和 3D 等多种生成式 AI 模型引入移动设备,从根本上改变人们创建内容和与数字媒体互动的方式。

智谱发布首个支持生成汉字的开源文生图模型CogView4

日前,国内大模型独角兽智谱宣布推出「智谱2025开源年」第一个模型:首个支持生成汉字的开源文生图模型CogView4。

在DPG-Bench基准测试中,CogView4综合评分排名第一,在开源文生图模型中达到SOTA,也是首个遵循Apache 2.0协议的图像生成模型。

图源:智谱

据悉,CogView4具备较强的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,能够生成在给定范围内的任意分辨率图像,同时具备较强的文字生成能力。

在技术层面,CogView4具有两大领先性:

一是该模型支持中英双语提示词输入,擅长理解和遵循中文提示词,是首个能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求;

二是CogView4支持输入任意长度提示词,能够生成范围内任意分辨率图像,不仅使用户创作更加自由,也提升了训练效率。

图源:智谱

目前,最新的CogView4-0304版本已经开源,GitHub页面显示,智谱已适配并开源了 CogView-4模型的diffusers版本,模型具有60亿参数,支持原生中文输入和中文文本到图像生成。此外,CogView4还将在近期登陆MaaS平台,并在3月13日上线智谱清言。

OpenAI 启动 NextGenAI 联盟,投资 5000 万美元推动 AI 研究与教育

OpenAI 近日宣布成立 NextGenAI 联盟,这是一个由 15 家领先研究机构组成的联合体,致力于利用 AI 加速研究突破和改革教育。OpenAI 承诺提供 5000 万美元的资金支持,用于研究补助、计算资源以及 API 访问权限,以支持学生、教育工作者和研究人员拓展知识前沿。

图源:OpenAI

这个联盟汇集了美国和国际知名学府,包括哈佛大学、麻省理工学院、牛津大学、加州理工学院、杜克大学、佐治亚大学、密歇根大学、俄亥俄州立大学、波士顿儿童医院等。

OpenAI 首席运营官 Brad Lightcap 表示:"如果没有学术界几十年的工作,AI 领域不可能达到今天的水平。持续合作对构建造福所有人的 AI 至关重要。NextGenAI 将加速研究进展,催生新一代机构利用 AI 的变革性力量。"

这一计划扩展了 OpenAI 对教育的承诺,继 2024 年 5 月推出 ChatGPT Edu 后,NextGenAI 通过提供 OpenAI 的 API 和资金来推动关键创新,进一步支持科学家寻找治愈方法、学者发现新见解以及学生掌握面向未来世界的 AI 技能。

北京将举办全球首个人形机器人半程马拉松比赛

3月4日,北京经济技术开发区(北京亦庄)发布消息称,将于4月13日举行北京亦庄半程马拉松赛,全球首个人形机器人半程马拉松赛将同期举行。

本次赛事以“亦马当先,智领未来”为主题,赛事报名时间为2025年3月5日10时至3月11日17时,机器人参赛队报名通道在马拉马拉APP。比赛设置了冠、亚、季军,奖金分别为5000、4000、3000元,还设置了完赛奖、最优耐力奖、最佳人气奖、最佳步态奖、最佳形态创意奖等系列奖项。

图源:北京亦庄

据悉,比赛将采取机器人和运动员“同步报名、同一赛道、同时起跑”的原则,人形机器人将与运动员在起点同时鸣枪起跑,但有单独赛道。

参赛机器人要求具备人形外观、可以实现双足行走或奔跑等动作,不能是轮式结构。在控制方式方面,可以是手动遥控(包含半自主),也可以是完全自主的控制方式。

比赛过程中,参赛单位可以更换机器人电池,也可直接更换机器人,以接力形式参加全程比赛。依据比赛过程中完赛时间、机器人更换次数进行综合评价,比赛过程中更换机器人每次罚时10分钟。

此外,赛前起跑仪式也将由机器人主持,赛后还设置有机器人大秀场和互动体验等一系列活动。

英伟达 RTX 5070 FE 版显卡延期发售

英伟达于 2025 年 3 月 4 日宣布,其备受期待的 GeForce RTX 5070 Founders Edition 显卡将不会在原定的 3 月 5 日发售日上市,而是将推迟至 3 月晚些时候。

图源:英伟达

据多家媒体报道,英伟达在显卡评测禁令解除前几小时才通知评测人员这一延期消息。尽管 Founders Edition 推迟发售,但包括华硕、微星、技嘉和索泰等第三方厂商的 RTX 5070 显卡预计仍将按原计划上市,售价为 549 美元。

RTX 5070 是目前英伟达最新 RTX 50 系列中最经济实惠的选择,配备 6144 个 CUDA 核心、192 个第五代 Tensor 核心和 48 个第四代光线追踪核心,搭载 12GB GDDR7 显存,提供 672 GB/秒的内存带宽。

对于此次延期的具体原因,英伟达尚未给出官方解释。不过有报道指出,英伟达近期确实面临显卡质量控制问题。上个月,多位 RTX 5090 买家发现他们的显卡比广告宣传的渲染输出单元(ROPs)少,导致性能损失。英伟达随后表示,这是一个罕见问题,影响了不到 0.5% 的 GeForce RTX 5090/5090D、5070 Ti 和 5080 型号。

对于急于升级的消费者来说,除了考虑第三方 RTX 5070 型号外,还可以关注 AMD 即将于 3 月 6 日发布的 Radeon RX 9070 系列显卡。

全球首款AI Agent产品“Manus”上线

3月6日凌晨,Monica团队研发的全球首款AI Agent产品上线。据团队介绍,Manus是一个真正自主的AI Agent,能够解决各类复杂多变的任务。

与传统AI助手不同,Manus不仅能提供建议或答案,还能直接交付完整的任务成果。比起Claude的Computer use等同样能操作多任务,或者能点外卖的Agent,Manus可以覆盖更多领域和达成更高的执行质量。

图源:网络

Manus的核心优势在于强大的工具调用能力和任务异步处理机制,其可以在虚拟环境中自主调用各类工具,包括编写和执行代码、智能浏览网页以及操作各种网页应用。用户无需长时间等待任务完成,即使关闭设备,Manus仍会在后台持续运行,任务结束后自动通知用户,期间用户还能随时下达新指令。

此外,Manus采用多重签名(multisig)系统,由多个独立模型驱动,并具备知识记忆功能,能够记住用户的偏好,为用户提供更加个性化的服务。

在评估通用AI助手解决现实问题能力的权威GAIA基准测试中,Manus在所有三个难度级别上均达到了SOTA水平。

据悉,Monica团队创始人肖弘毕业于华中科技大学软件工程专业,曾创立夜莺科技并推出“壹伴助手”和“微伴助手”。2022年,肖弘创立Monica,专注海外市场,并成功推出ChatGPT for Google等产品,截至2024年,用户数量已突破1000万。

AI 先驱 Barto 和 Sutton 荣获 2024 年图灵奖

计算机协会(ACM)宣布,Andrew G. Barto 和 Richard S. Sutton 因在强化学习领域的开创性贡献获得 2024 年图灵奖。这一奖项被誉为"计算机界的诺贝尔奖",奖金为 100 万美元,由谷歌赞助。

图源:ACM

这两位科学家在 20 世纪 80 年代开始,通过一系列论文构建了强化学习的概念和数学基础,开发了多种关键算法,包括其最重要的贡献——时间差分学习,以及策略梯度方法和使用神经网络作为表示学习函数的工具。

他们于 1998 年合著的教材《强化学习导论》至今仍是该领域的标准参考,已被引用超过 75,000 次,启发了众多计算机科学研究。尽管 Barto 和 Sutton 的算法是几十年前开发的,但通过与深度学习算法的结合,强化学习在过去十五年中实现了重大的实际应用突破:

1. 谷歌 DeepMind 利用强化学习开发了 AlphaGo,该程序于 2016 年和 2017 年击败了世界顶级围棋选手

2. OpenAI 的 ChatGPT 在训练中采用了基于人类反馈的强化学习(RLHF)技术

3. 其他应用领域包括机器人运动技能学习、网络拥塞控制、芯片设计、互联网广告、优化、全球供应链优化等

ACM 评价道:"Barto 和 Sutton 的工作展示了将多学科方法应用于我们领域长期挑战的巨大潜力。从认知科学和心理学到神经科学的研究领域启发了强化学习的发展,这为 AI 的一些最重要进展奠定了基础,也让我们对大脑工作原理有了更深入的了解。"

PyTorch 核心开发者从 Meta 离职

近日,PyTorch 团队的核心开发者 Horace He 宣布离开 Meta,加入由 OpenAI 前 CTO Mira Murati 创办的初创公司 Thinking Machines Lab。这一消息在人工智能领域引起广泛关注。

图源:X

Horace He 在社交媒体上分享了离职原因,他表示在 PyTorch 的工作经历非常宝贵,认为 PyTorch 已成为学术界、开源社区以及几乎所有使用 GPU 的顶尖实验室的"通用语言"。据统计,约有 59% 的研究论文使用了 PyTorch,充分展示了其在学术界和产业界的重要地位。

他强调在 PyTorch 工作期间能够参与真正"有意义"的项目是非常幸运的,这个项目不仅支撑了整个行业,还高度重视开源贡献,为他提供了避开大型科技公司政治和获得职业发展的宝贵机会。PyTorch 创始人 Soumith Chintala 对 Horace He 的贡献也给予高度评价,他的离职也被认为是 Meta 的重大损失。

我国将于今年内发布AI教育白皮书

3月5日上午,十四届全国人大三次会议开幕会结束后举行首场 “部长通道” 集中采访活动,邀请部分列席会议的国务院有关部委主要负责人接受采访。教育部部长怀进鹏表示,今年中国将发布人工智能教育白皮书。

图源:网络

怀进鹏称,DeepSeek (深度求索) 和机器人最近引起国内外的广泛关注,说明了中国科技创新和人才培养的效果。这也是教育改革和发展的重大机遇。

怀进鹏谈到,教育部将以制定实施教育强国建设三年行动计划为基本出发点,推动高等教育综合改革。其中,将加大产教融合和科教融汇,协同相关部门共同建立一个有利于人才成长和创新发展相融合的生态和组织机制,同时将围绕产业变革加快和加强学科布局,要在人工智能、生物技术、新能源、新材料等诸多领域加快布局。

“把人工智能与教育结合起来”。怀进鹏表示,中国将在今年发布人工智能教育白皮书,为学生提供更好的数字化时代、智能化时代的素养和能力。

Manus AI合伙人辟谣:从未投入市场推广及开设付费邀请码

3月6日,一款中国团队研发发布的通用Agent产品Manus突然走红,该产品以邀请码的方式进行小范围内测,邀请码价格一度被炒高至上万元,不少卖家也纷纷出售自己手头的Manus邀请码。

对此,Manus AI合伙人张涛在社交平台回应称,短期内会专注build。他表示,感谢大家对Manus的关注,并特此澄清,Manus官方从未开设任何付费获取邀请码的渠道;同时从未投入任何市场推广预算;内测期间系统容量有限,Manus将优先保障现有用户的核心体验,并逐步有序释放邀请。

图源:网络

此外,张涛还表示,“首批测试用户给我们带来了极具价值的反馈,我们也收到了非常中肯的建议和批评。大家目前看到的Manus还是一个襁褓中的小婴儿,离我们在正式版中想交付给大家的体验还差很远。像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间。恳请大家对一家几十人的创业公司多一点包容和理解,团队正在全力输出,让大家早日体验上更好的产品。”

谷歌创始人开设新 AI 公司 Dynatomics

据《The Information》报道,谷歌联合创始人 Larry Page 正在建立一家名为 Dynatomics 的新公司,专注于将 AI 应用于产品制造领域。

图源:Getty Images

报道称, Larry Page 正与工程师合作开发人工智能技术,该技术能够为物体创建"高度优化"的设计,然后交由工厂生产。传统的制造流程往往依赖于工程师的经验和反复试验,而 Dynatomics 希望通过 AI 算法,能够快速找到最优的设计方案,从而提升产品的性能、降低成本、甚至创造出前所未有的新型产品。

Larry Page 旗下的电动飞机初创公司 Kittyhawk 的前首席技术官 Chris Anderson 正在领导这个秘密项目。

DeepSeek登顶全球AI应用第2名

3月7日凌晨,全球著名投资基金公司Andreessen Horowitz(简称a16z)发布了2025年全球100生成式AI应用排行榜。

本次榜单一共分为50生成式AI应用(网页)和50生成式AI(移动版)。其中ChatGPT凭借4亿的周活跃用户和1.75亿的移动端用户,在网页端、移动端排名双第1,而DeepSeek则凭借DeepSeek-R1模型在网页端中排名第2。

图源:网络

图源:网络

在今年1月末开源R1模型之后,DeepSeek在全球范围内引起巨大轰动,尤其是对美国科技股造成重创,用户群体也呈指数级增长。

据悉,DeepSeek在14天达到100万用户,这比ChatGPT的5天要慢一些。但是20天就疯涨至1000万用户,比ChatGPT的40天快了整整一倍。

值得一提的是,中国其他知名大模型也进入了该排行榜,字节跳动的豆包排名第10;月之暗面排名11;海螺视频排名12;快手可灵排名20,全部超过了Sora、Midjourney、Runway等知名产品。在移动端中,百度AI搜索排名第4;夸克AI第6;豆包排名第7;DeepSeek排名第14。

AMD 发布 Instella 开源语言模型

AMD 于近日宣布推出 Instella,这是一系列完全开源的 30 亿参数语言模型,在 AMD Instinct MI300X GPU 上从零训练而成。根据 AMD 发布的数据,Instella 模型不仅在性能上超越了同等规模的现有开源模型,还能与 Llama-3.2-3B、Gemma-2-2B 和 Qwen-2.5-3B 等顶级开源权重模型相媲美。

图源:AMD

Instella 是 AMD 在语言模型领域的重要进展,从此前的 10 亿参数 AMD OLMo 模型扩展至 30 亿参数模型。与前代产品相比,Instella 使用了 128 个 Instinct MI300X GPU(而非 64 个 MI250),训练数据从 1.3 万亿 token 增加到 4.15 万亿 token。

Instella 模型系列包括 Instella-3B-Stage1、Instella-3B、Instella-3B-SFT 和 Instella-3B-Instruct 四个模型,涵盖了从基础自然语言理解到指令跟随和人类偏好对齐的多个训练阶段。

所有 Instella 模型的相关资源,包括模型权重、训练配置和代码,都已在 Hugging Face 和 GitHub 上开源。

米哈游前AI负责人初创公司获数千万元使轮融资

有消息称,国内3D AI虚拟人制作公司半图科技(SemiGraph)完成了一轮数千万人民币的天使轮融资,全球知名投资机构IDG资本独家投资。此次融资的成功为半图科技3D动画大模型底层技术的突破提供了强有力的资金支持,并有望加速其产品和技术的市场落地。

据悉,半图科技团队核心成员来自米哈游、叠纸、字节跳动等公司,创始人邢骏此前在米哈游担任“逆熵”AI研究负责人,并在“鹿鸣”项目中负责了多项AI技术的研发和落地。

虽然目前半图科技的具体产品规划尚未对外公布,但外界普遍认为其产品可能聚焦于AI与内容结合的游戏式交互产品。公开资料显示,半图科技正专注于3D虚拟人方向,通过游戏的形式,重新定义虚拟角色的社交和陪伴功能。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10120466.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章