OpenAI 宣布维持非营利组织控制权,转型为公共利益公司
5 月 6 日,人工智能巨头 OpenAI 宣布,将维持由其非营利组织对公司整体的控制权,放弃此前将核心业务完全转为盈利公司的争议性计划。
OpenAI 表示,经过与加州和特拉华州总检察长办公室的对话,并听取了社会各界的意见后,决定调整公司结构。未来,OpenAI 旗下的有限责任公司将转型为公共利益公司(PBC),非营利母公司不仅将继续掌控公司,还将成为 PBC 的大股东。这一调整旨在确保 OpenAI 的使命——让 AGI 造福全人类——不受资本利益主导,同时为公司争取更多资源以支持公益项目。
图源:Getty Images
此前,OpenAI 曾计划将盈利子公司转型为营利性公司,并取消对投资者回报的上限,以吸引更多资金,助力 AI 研发和商业化,部分投资方甚至将资金投入与公司完成重组挂钩。
但该方案引发了包括前员工、AI 领域专家、法律学者在内的广泛反对,担忧公司治理和公益使命可能被削弱。面对持续的外部压力和法律挑战,OpenAI 最终选择让非营利组织继续掌控全局,同时简化盈利结构,让所有员工和投资人持有普通股权。
OpenAI 首席执行官 Sam Altman 在内部信中表示,构建通用人工智能需要数千亿美元甚至数万亿美元的投入,公司必须在坚守使命的同时,寻求可持续发展路径。Altman 强调,OpenAI 将继续推动 AI 技术的安全、民主化发展,致力于让强大工具服务于全球用户,造福社会各界。此次结构调整被外界普遍解读为 OpenAI 在资本和使命之间寻求平衡的关键转折点。
OpenAI 任命新 CEO
OpenAI 日前宣布,Instacart 首席执行官 Fidji Simo 将加入 OpenAI,担任应用首席执行官,全面负责公司的业务和运营板块。Simo 此前已是 OpenAI 董事会成员,她将在未来几个月内完成在 Instacart 的交接,随后全职加入 OpenAI。
图源:Shutterstock
Sam Altman 仍然是 OpenAI 的首席执行官,他将继续负责公司的整体战略、研究、算力和安全等核心领域。Simo 将直接向 Altman 汇报,并负责管理销售、市场、财务等团队,包括首席运营官、首席财务官和首席产品官等高管都将向 Simo 汇报。
Simo 在科技行业拥有丰富的管理和产品经验。加入 Instacart 前,她曾在 Meta 领导 Facebook 应用的产品开发和商业化工作。她还曾共同创办医疗研究机构 Metrodora Institute,致力于神经免疫疾病的治疗。
OpenAI 近年来业务快速扩展,已成为全球领先的人工智能产品公司。Simo 表示,OpenAI 有机会以前所未有的速度加速人类潜能,她将致力于推动人工智能应用服务于公共利益。
OpenAI 计划大幅削减与微软的收入分成比例
据外媒报道,OpenAI 已告知投资者,在推进公司重组计划的同时,将大幅减少与主要支持者微软的收入分成比例。
根据现有达成的协议,OpenAI 同意到 2030 年前,向微软分享 20% 的收入。而最新泄露的私人文件指出,OpenAI 已向部分潜在及现有投资者明确,到 2030 年,与包括微软在内的商业伙伴的收入分成将控制在 10% 以内。
图源:网络
此前有报道称,OpenAI 放弃将自身转变为营利性公司的计划,保持整体业务继续接受非营利机构的控制,而微软希望 OpenAI 的结构调整能够充分保障微软的投资利益,知情人士表示,目前微软仍在积极协商重组方案的细节,内容涉及现有合同要求的服务许可、持股、收入分成以及其他问题。
OpenAI 拟 30 亿美元收购 AI 编码工具 Windsurf,或创其最大规模收购纪录
据外媒报道,OpenAI 日前已同意以约 30 亿美元的价格收购专注于人工智能编码领域的工具公司 Windsurf,这一决策是在数周前双方就交易事宜展开洽谈后迅速达成的,有望成为 OpenAI 自成立以来规模最大的一笔收购交易。
图源:网络
据悉,Windsurf 的前身为 Codeium,由麻省理工学院校友 Varun Mohan 和 Douglas Chen 于 2021 年联合创立,起初是一家专注于 GPU 虚拟化软件的公司,后转型为 AI 编码工具领域的佼佼者。
Windsurf 的核心竞争力在于其 “代理式编程” 理念,也被称为 “氛围编程”,搭配深度集成的 AI 智能体 Cascade,大幅提升了开发者的工作效率和协作体验。
目前,Windsurf 每天处理超过 1000 亿个 token,拥有超过 1000 家企业客户,其中包括 Anduril、Zillow 和戴尔等。自 2024 年初以来,其年经常性收入已经增长了 500% 以上。
此前,OpenAI 曾考虑收购另一家 AI 编码工具公司 Cursor,但谈判未能取得进展。而尽管目前 OpenAI 与 Windsurf 的收购交易尚未正式画上句点,但双方已就核心条款达成高度共识。
业内分析人士认为,OpenAI 此次收购意图明确,旨在通过整合 Windsurf 的技术资源,进一步强化自身在 AI 辅助编程、自动化代码生成等前沿技术领域的探索与应用,为开发者提供更加智能、高效的开发工具链,推动 AI 技术与软件开发行业的深度融合。
AI 编程工具 Cursor 完成 9 亿美元融资,估值达 90 亿美元
近日,AI 编程工具 Cursor 的开发商 Anysphere 完成了 9 亿美元的新一轮融资,最新估值达到 90 亿美元。本轮融资由 Thrive Capital 领投,Andreessen Horowitz、Accel 等知名投资机构参与。据悉,Anysphere 在今年 1 月刚完成上一轮融资,当时估值为 25 亿美元,仅数月内估值已大幅提升。
图源:Cursor
Cursor 是一款基于 AI 的代码编辑器,因其“vibe coding”理念在开发者中广受欢迎。产品支持自然语言指令,开发者可以直接与 AI 聊天,实现自动生成、修改和补全代码,大幅提升编程效率。Cursor 目前已被 Stripe、OpenAI、Spotify 等科技公司采用,每天生成近 10 亿行代码。
公司年化经常性收入已突破 2 亿美元,成为增长最快的软件公司之一。Cursor 目前主要采用外部大模型,但未来计划进一步开发自有 AI 模型,以降低对第三方 AI 平台的依赖并优化成本。
此次融资也反映了 AI 编程工具领域的火热。除 Anysphere 外,Windsurf、Replit 等初创公司也受到资本青睐。业内人士认为,AI 驱动的开发工具正推动软件产业变革,吸引着越来越多的投资者关注。
谷歌发布Gemini 2.5 Pro(I/O预览版)
日前,谷歌宣布推出 Gemini 2.5 Pro Preview(I/O 版),这是其旗舰产品 Gemini 2.5 Pro AI 模型的更新版本,在多项广泛使用的基准测试中名列前茅。
据悉,该模型原计划于 5 月 20 日至 21 日的谷歌年度 I/O 开发者大会上发布,由于开发者社区反响热烈,谷歌决定提前发布,因其在 I/O 大会前夕推出,所以被称为 “I/O 版”。
图源:网络
谷歌表示,Gemini 2.5 Pro Preview(I/O 版)在编码能力上有显著提升,在构建交互式 Web 应用方面表现更为出色,在代码转换、代码编辑以及开发复杂智能工作流程等方面也有进步。
在 WebDev Arena 排行榜上,Gemini 2.5 Pro Preview(I/O 版)比之前的版本高出 147 Elo 积分,超越了此前的第一名。在 Live Code Bench v5(代码生成)基准测试中,成绩从 70.4% 提升至 75.6% 。
此外,该模型在视频理解方面也有出色表现,在流行的 VideoMME 基准测试中取得了 84.8% 的成绩。谷歌在官方博客中还强调了该模型的一些应用场景,如将 YouTube 视频转换为完整的学习应用、生成风格化的 UI 组件以及根据简单想法创建 Web 应用等。
目前,Gemini 2.5 Pro Preview(I/O 版)可通过 Gemini API 以及谷歌的 Vertex AI 和 AI Studio 平台获取,价格与其实际替代的 Gemini 2.5 Pro 型号相同。它也包含在谷歌的 Gemini 聊天机器人应用中,适用于网页和移动设备。
Mistral 推出全新 AI 模型 Medium 3,性能超越 Meta Llama 4 Maverick
法国 AI 初创公司 Mistral 于 5 月 7 日正式发布了其最新 AI 模型 Mistral Medium 3,并同步推出面向企业客户的 AI 助手平台 Le Chat Enterprise。
图源:Mistral
Mistral Medium 3 主打高性能与低成本,官方称其在多项基准测试中不仅超越了 Meta 的 Llama 4 Maverick 和 Cohere Command A,还以远低于 Anthropic Claude 3.7 Sonnet 的价格实现了 90% 以上的性能表现。Mistral Medium 3 的 API 输入费用为每百万 tokens 0.4 美元,输出费用为 2 美元,大幅低于同类竞品(Claude 两项的价格则是 3 美元和 15 美元)。
该模型尤其适用于编程和 STEM 相关任务,在 HumanEval、MultiPL-E 等编码测试中与 Claude 3.7 Sonnet 及 OpenAI GPT-4o 持平甚至更优。同时,Mistral Medium 3 支持多语言和多模态任务,具备企业级集成能力,可灵活部署在公有云、私有云或本地环境,方便企业根据自身需求定制和优化。
Le Chat Enterprise 平台以 Medium 3 为核心,专为企业级生产力和数据隐私打造,支持企业搜索、文档库、自动摘要、个性化模型集成、无代码智能体构建等功能。平台可连接 Google Drive、SharePoint、Gmail 等主流办公应用,实现跨系统数据整合与安全访问。Mistral 强调,Le Chat Enterprise 遵循严格的隐私与访问控制标准,支持全栈自定义和审计日志,帮助企业在保障数据主权的同时,提升自动化与智能化水平。
目前,Mistral Medium 3 已通过 API 和 Amazon SageMaker 上线,Le Chat Enterprise 已在 Google Cloud Marketplace 推出,并将陆续登陆 Azure AI 和 AWS Bedrock 等平台。Mistral 表示,已有金融、能源、医疗等行业客户率先试用新模型,用于客户服务、流程自动化和复杂数据分析等场景。
微软发布两款 Surface 新品,并带来全新 AI 功能
5 月 7 日,微软正式发布了多款全新 Surface 设备,并宣布 Windows 11 和 Copilot+ PC 将迎来一系列 AI 新功能。
图源:The Verge
此次发布的 Surface Pro 12 英寸平板电脑采用高通 Snapdragon X Plus 处理器,配备 16GB 内存和 256GB 存储,起售价为 799 美元。新机型采用无风扇设计,配备 12 英寸 LCD 屏幕,分辨率为 2196 x 1464,刷新率为 90Hz,支持全新磁吸手写笔,键盘也进行了重新设计,带来更舒适的输入体验。
图源:The Verge
同时,微软还推出了 13 英寸的 Surface Laptop,售价 899 美元,同样搭载高通 Snapdragon X Plus 芯片,标配 16GB 内存和 256GB 存储。新款笔记本取消了 Surface Connect 充电口和 Windows Hello 面部识别,改为指纹识别,采用 13 英寸 1920 x 1280 分辨率屏幕,刷新率为 60Hz。接口方面,配备两个 USB-C 3.2、一个 USB-A 3.1 以及耳机接口。
图源:微软
在软件方面,微软为 Windows 11 和 Copilot+ PC 带来了全新 AI 体验。未来用户可以通过 AI 助手快速查找和调整系统设置,使用自然语言与电脑交互。Photos、Paint 和 Snipping Tool 等应用也将获得 AI 增强功能,例如智能补光、对象选择、贴纸生成和文本提取等。Windows 11 的开始菜单、文件资源管理器和记事本等核心应用也将陆续加入 AI 功能,提升用户操作效率。
图源:微软
这些新功能将首先在搭载 Snapdragon 处理器的 Copilot+ PC 上推出,后续也会扩展到 AMD 和 Intel 平台。新款 Surface Pro 和 Surface Laptop 将于 5 月 20 日正式发售。
英伟达正为中国市场设计新款特供版AI芯片,最快6月推出
据媒体报道,在针对中国市场的H20芯片遭美国政府禁售后,英伟达正加紧开发另一款符合美国出口规定的AI芯片,以继续保住其在中国的市场份额。
报道称,英伟达日前已向字节跳动、阿里巴巴、腾讯等中国大陆重要客户通报其正在调整AI芯片设计,以寻求在不触犯美国出口管制的前提下继续向中国供应产品。新款芯片的样品预计最快将在6月交付测试,同时,专为中国大陆市场设计的Blackwell系列芯片目前也正处于研发阶段。
图源:网络
此外,有传言称黄仁勋正考虑在中国设立合资企业以维持CUDA生态系统,甚至可能将来会将中国业务独立出来。在4月中旬访问北京期间,黄仁勋反复强调英伟达与中国30年的关系,公开承认中国对英伟达的重要性。
英伟达 RTX 5060 显卡将于 5 月 20 日正式上市,起售价 2499 元
英伟达宣布,旗下全新 GeForce RTX 5060 显卡将在 5 月 19 日正式发售(国内开售时间为 20 日),桌面版起售价为 299 美元(国内售价 2499 元),搭载该显卡的笔记本电脑起价为 1099 美元。
图源:英伟达
作为 RTX 50 系列中最亲民的型号,RTX 5060 配备 3840 个 CUDA 核心,采用 GDDR7 显存,支持 DLSS 4 及多帧生成技术,并集成了最新的光线追踪和 Tensor 核心。英伟达表示,上市前将有更多游戏支持 DLSS 4 多帧生成,包括 5 月 7 日上线的 MechWarrior 5: Clans(机甲战士 5:部落) 和 5 月 13 日上线的 New World: Aeternum(新世界:永恒)。
据悉,RTX 5060 相比上一代 RTX 4060,CUDA 核心略有提升,显存带宽也因 GDDR7 显存大幅增加,但 8GB 显存容量在高分辨率下仍可能成为瓶颈。尽管如此,凭借合理的定价和主流定位,RTX xx60 系列一直是 PC 游戏玩家的首选,预计 RTX 5060 也将延续其受欢迎的趋势。
不过,实际能否以 299 美元(国内售价 2499 元)的官方建议零售价买到 RTX 5060 仍存疑,因为目前多款显卡上市后都存在溢价现象。
苹果与 Anthropic 合作开发 AI 编程工具
近日,多家科技媒体报道,苹果正与人工智能公司 Anthropic 合作,研发一款集成 Claude 模型的 AI 编程工具。该工具将内置于 Xcode,支持代码的自动生成、编辑和测试,目前仅在苹果内部员工中小范围试用。
图源:Anthropic
新版本 Xcode 采用 Claude Sonnet 模型,开发者可以通过聊天界面请求代码、测试用户界面,并定位和修复 Bug。苹果尚未决定是否向外部开发者公开发布这一功能。
据悉,Claude 在代码生成领域表现出色,受到开发者青睐。苹果此前已宣布与 OpenAI、Google 等多家 AI 公司合作,推动 Apple Intelligence 相关功能落地。去年发布会亮相的 Swift Assist 代码助手因实际效果不佳迟迟未能上线,而与 Anthropic 的合作有望推动 AI 编程工具的进一步完善。业内人士认为,苹果加快 AI 布局,有助于提升产品开发效率,缩小与竞争对手在 AI 领域的差距。
苹果考虑在 Safari 浏览器中引入 AI 搜索引擎
5 月 7 日,多家外媒报道,苹果公司正积极考虑在 Safari 浏览器中加入包括 OpenAI、Perplexity、Anthropic 等 AI 搜索引擎选项。
图源:Getty Images
苹果高级副总裁 Eddy Cue 在美国司法部针对谷歌的反垄断诉讼中作证时表示,Safari 浏览器的搜索量在四月首次出现下滑,主要原因是用户转向 AI 工具获取信息。Cue 认为,AI 搜索最终将取代传统搜索引擎,苹果已经与 Perplexity 等公司展开初步接洽,但这些 AI 服务目前还不会成为默认选项,因为它们需要进一步完善。
目前,谷歌每年向苹果支付约 200 亿美元,确保其搜索引擎作为 Safari 默认选项。随着 AI 技术的快速发展和用户行为的转变,这一长期合作关系面临挑战。Eddy Cue 表示,技术变革带来了新的竞争机会,AI 搜索正成为新的行业趋势。受相关消息影响,谷歌母公司 Alphabet 股价大跌 7%,苹果股价也有所下滑。未来 Safari 浏览器或将支持更多 AI 搜索引擎,传统搜索引擎的主导地位正受到前所未有的威胁。
Anthropic 推出 Claude 网络搜索 API
5 月 8 日,AI 初创公司 Anthropic 正式发布 Claude 网络搜索 API,允许开发者为其旗舰大模型 Claude 接入实时互联网信息。这一功能不仅让 Claude 能够根据用户需求自动判断是否需要联网搜索,还能生成针对性查询、分析结果,并以引用形式给出信息来源。
图源:X
据悉,Claude 的新 API 支持多轮递进式搜索,模拟人类研究者的探索过程,提升答案的全面性和准确性。开发者还可自定义 Claude 可访问或屏蔽的网站域名,增强数据安全与合规性。该服务定价为每 1000 次搜索 10 美元,首批适用于 Claude 3.7 Sonnet、升级版 Claude 3.5 Sonnet 和 Claude 3.5 Haiku 模型。
业内普遍认为,AI 搜索助手正对传统搜索引擎构成实质威胁。根据最新市场数据,已有 19% 的用户转向 AI 搜索工具。苹果高管在谷歌反垄断案中也透露,Safari 浏览器的谷歌搜索量首次出现下滑,显示用户行为正在发生根本转变。
AI 搜索助手能够整合多来源信息,生成简洁、上下文相关的答案,省去了用户筛选网页的繁琐流程。而随着苹果与 OpenAI、Anthropic、Perplexity 等公司洽谈合作,AI 搜索有望进一步嵌入主流浏览器,撼动谷歌的市场主导地位。
Neuralink脑机接口设备已获FDA认证
日前,由马斯克支持的脑机接口(BCI)制造商Neuralink在领英上发布的一篇帖子称,其治疗严重语言障碍患者的设备获得了美国食品药品监督管理局(FDA)的突破性设备认定。
图源:网络
Neuralink称,“我们已获得FDA的突破性设备认定,以帮助包括受肌萎缩侧索硬化症(ALS,即渐冻症)、脑卒中、脊髓损伤、脑瘫、多发性硬化症及其他神经系统疾病在内的患者恢复交流能力。”
据悉,从2024年1月开始,Neuralink截至目前已经完成了三例心灵感应(Telepathy)脑植入物的人体植入。此外马斯克在近日也开始了Neuralink最新一轮5亿美元融资,公司投前估值已达85亿美元。
百度Apollo将与神州租车合作,探索全球首个自动驾驶租赁服务
日前,百度旗下 Apollo 与租车平台神州租车在北京举行战略签约仪式,宣布达成深度合作,双方将联合推出全球首个自动驾驶汽车租赁服务,为用户提供普惠化的智能出行服务。
图源:Apollo智能驾驶
据介绍,本次合作将通过自动驾驶技术重构租车出行服务范式,双方首创的 “自动驾驶汽车租赁” 新模式,可供用户自由探索城市文化地标和旅游景区
未来,双方将在多个城市文旅场景中共同推动自动驾驶技术的应用,形成可复制、可拓展的创新应用模型。预计从今年第二季度起,双方将根据特定场景共同定义产品,并根据用户反馈不断迭代升级。未来 3 至 5 年内,双方将进一步深化合作,共同推动自动驾驶技术在更多层面的应用,实现多领域的战略协同。
零一万物技术副总裁离职创业
据悉,零一万物联合创始人、技术副总裁戴宗宏已于近日离职创业。这也是继李先刚、黄文灏、潘欣、曹大鹏等联创和早期核心成员之后,零一万物 2024 年下半年以来的又一位核心高管离职。
图源:网络
在零一万物期间,戴宗宏负责 AI Infra 团队,主要解决大批量并行训练时的系统瓶颈,提升训练效率,降低训练成本。
戴宗宏是国内少数具有大模型 Infra 经验的技术人才。加入零一万物之前,他曾任华为云 AI CTO 及技术创新部长、前阿里达摩院 AI Infra 总监,由他组建的零一万物 AI Infra 团队,核心成员来自阿里、华为、微软、商汤等公司。
而关于戴宗宏的创业项目,零一万物回复称,“零一万物联合创始人、技术副总裁戴宗宏数月前在创新工场支持下再次创业。零一万物也会根据市场PMF对项目进行快速调整,包括加强投资部分业务、鼓励有商业化潜力的项目进行独立融资,也包括关停部分项目。”
Meta 任命前 Google DeepMind 高管领导 AI 研究实验室
近日,Meta 宣布任命 Robert Fergus 为旗下 AI 研究实验室 FAIR 的新负责人。Robert Fergus 曾在 Google DeepMind 担任研究总监约五年,此前也曾在 Meta 担任研究科学家,并与 Yann LeCun 于 2014 年共同创立了 FAIR 实验室。
图源:X
FAIR 主要负责 Meta 的长期人工智能研究,包括推动机器人、音频生成、图像理解等领域的技术进步。近年来,FAIR 经历了多位核心研究人员的流失,不少人跳槽至初创公司、其他科技巨头,甚至加入 Meta 旗下领导 Llama 4 开发的 GenAI 团队。
Fergus 的回归被视为加强 FAIR 研究团队、推动公司 AI 战略的重要举措。Meta 前任 AI 研究副总裁 Joelle Pineau 已于 4 月宣布离职。
特朗普政府拟取消拜登时代的 AI 芯片限制
据外媒报道,美国总统特朗普正计划撤销拜登时期的 AI 芯片出口限制,特朗普政府认为拜登时代的限制过于复杂,阻碍美国创新。
图源:网络
今年 1 月,拜登在卸任前一周发布了《人工智能扩散出口管制框架》,为驱动 AI 计算数据中心的芯片建立 “三级许可制度”,以此限制各国获取先进 AI 芯片数量。
该规定刚发布便遭到来自英伟达和甲骨文等美国科技企业的批评,因此虽然政策原定于 5 月 15 日生效,但目前仍未最终确定。
据知情人士透露,特朗普政府废除这项规定的决定尚未最终落定,最早可能在当地时间本周四宣布。但与此同时,“他们正在积极推动一项旨在加强对海外芯片管控的新规”,目标仍是巩固美国在 AI 领域的主导。
世界人形机器人运动会将于8月在北京举行
5月7日,北京市人民政府新闻办公室举行2025世界机器人大会、2025世界人形机器人运动会新闻发布会,北京市经济和信息化局局长姜广智在发布会上透露,首届世界人形机器人运动会将于今年 8月15日至17日在北京国家体育场(鸟巢)和国家速滑馆(冰丝带)举办,届时预计将有约200家机器人企业集中展示各自最新研发成果。
据悉,本届人形机器人运动会竞赛项目分为主体赛事和外围赛事,主体赛事侧重人形机器人技能竞技,包括田径、足球、舞蹈以及物料搬运、药品分拣等;外围赛事侧重趣味性和观众互动性,包括羽毛球、乒乓球、篮球等。
主体赛事包括竞技赛、表演赛和场景赛,共3大类19个项目。其中,竞技赛参照人类传统体育项目设置11个赛项,包括100米、400米、1500米、4×100米接力、100米障碍赛和立定跳远、原地跳高,还有自由体操和二对二、三对三、五对五足球赛。
表演赛设置了单机舞蹈和群体舞蹈两个项目,通过艺术编排、音乐配合,以动作创新展示人形机器人全身实时协同控制和群体的协同能力。
场景赛则聚焦人形机器人实际应用场景,设置了工业场景、医院场景和酒店场景,共 3 类 6 个项目。其中,工业场景包括工厂物料搬运与整理;医院场景包括药品分拣与分装;酒店场景包括迎宾服务与清洁服务。
图源:网络
参赛人形机器人应满足以下条件:
-
参赛机器人是参赛队自研或采购的机器人。
-
机器人是一个独立整体,不得分离为多个子单元,或是用软缆连接的子单元,不得在比赛场地内设置标记物。
-
机器人应具有躯干、上肢、双足,有效重心到足底的最大伸展距离为身体高度的40%-70%,其中,场景赛比赛项目机器人的下肢可采用轮式或双足式。
-
手动遥控(包含半自动)只能采用无线遥控方式,由操作人员在指定区域进行遥控指挥;完全自主控制,除发送开始指令外,计时阶段不允许任何形式的人工介入,全程由机器人自主完成。自由体操、单机舞蹈、群体舞蹈比赛项目的控制方式,必须是完全自主。
国内外企业、高校、科研院所、创新团队、俱乐部、其他社会组织等均可报名此次运动会,每个参赛队可以报名参加多个赛项,可以使用不同的机器人参加不同赛项,但比赛过程中不允许更换机器人。
比赛期间每个参赛队最多允许2名参赛队员进入比赛场地;除4×100米接力赛项可由不超过4个参赛队联合参赛,其余所有赛项仅允许参赛队独立参赛。
百度公布动物语言转换专利,可实现人与动物深度交流
据天眼查数据,北京百度网讯科技有限公司日前公布了一项名为“动物语言转换方法、装置、电子设备及存储介质” 的专利。该专利涉及人工智能技术领域,涵盖机器学习、深度学习以及自然语言处理等,有望实现动物与人类之间更深层次的交流。
图源:网络
据悉,这一专利能够准确识别动物的情感状态,并将其转换为人类能够理解的语言,从而实现动物与人类之间更深层次的情感交流和理解。
该专利的核心实现方案为:首先获取与动物相关的多模态数据,包括动物声音数据、行为数据以及体征数据。随后对多模态数据进行预处理,得到融合后的多模态数据。接着,根据融合后的数据对动物当前情感进行识别,得出情感识别结果。最后,将情感识别结果进行语义映射和语言翻译,把动物语言转换为人类语言,形成语言转换结果。
通过整合动物的声音、行为和生理数据,该技术能够凭借多模态数据的综合运用与深度分析全面精准地理解动物的情感状态,避免了仅依赖单一数据源可能产生的误判。同时,还能将情感识别与语言翻译相结合,为人类与动物的沟通开创了全新方式,有助于人类更准确地把握动物的需求与情感。
从应用前景来看,这一技术潜力巨大,特别是在动物保护和研究领域,该技术能为研究人员提供更深入的动物行为分析工具,推动珍稀动物保护和研究工作的开展。