Google DeepMind 开源 AlphaFold 3,加速药物研发进程
2024 年 11 月 11 日,Google DeepMind 宣布将开源 AlphaFold 3 的源代码和模型权重,供学术用途使用。这一决定出现在该系统的创造者 Demis Hassabis 和 John Jumper 因在蛋白质结构预测领域的贡献而获得 2024 年诺贝尔化学奖几周后。
图源:美国微生物学会
与前代产品相比,AlphaFold 3 实现了革命性的突破,该系统不仅能够预测蛋白质结构,还能模拟蛋白质与 DNA、RNA 和小分子之间的复杂相互作用,这对现代药物研发和疾病治疗具有重要意义。传统研究这些分子相互作用的方法通常需要数月的实验室工作和大量研究经费,且成功率并不确定。
此次开源采用了折中方案:代码在知识共享许可协议(CC 协议)下免费提供,但访问关键的模型权重需要获得 Google 对学术用途的明确许可。值得注意的是,AlphaFold 3 在预测蛋白质-配体相互作用方面的准确性超过了传统的物理方法,这标志着计算生物学领域的重要转变。
随着全球研究人员开始使用这一强大工具,我们可能会看到在疾病理解和治疗方面取得前所未有的快速进展。
OpenAI 新模型进展不及预期
据 The Information 报道,OpenAI 正在开发的新一代语言模型 Orion 相较于 GPT-4 的性能提升幅度低于预期,与 GPT-3 到 GPT-4 的巨大进步相比,这次的提升显得相对有限。
图源:OpenAI
消息人士透露,Orion 在编程能力方面并未明显超越其前代产品,仅在语言处理方面表现出一定优势。此外,该模型在数据中心的运营成本可能高于先前版本。
造成发展速度放缓的一个主要原因是高质量训练数据的短缺。为应对这一挑战,OpenAI 专门成立了由 Nick Ryder 领导的"基础团队"。该公司计划通过使用 AI 生成的合成数据来弥补训练数据的不足,但这种方法可能导致新模型在某些方面与旧模型过于相似。
值得注意的是,这种发展瓶颈似乎是行业普遍现象。据报道,Google 即将推出的 Gemini 2.0 也未能达到内部预期目标,Anthropic 则暂停了其旗舰产品 Opus 3.5 版本的开发。
尽管如此,OpenAI 首席执行官 Sam Altman 仍保持乐观态度。他表示,通往人工通用智能(AGI)的道路是明确的,关键在于创造性地运用现有模型,并暗示可能会将语言模型与推理方法相结合。
亚马逊将于下月推出新一代 AI 训练芯片 Trainium 2
亚马逊正在加大对自研 AI 芯片的投入,以期降低对市场领导者英伟达的依赖。据报道,亚马逊云计算部门(AWS)将于下月推出新一代 AI 训练芯片 Trainium 2,该芯片已获得 Anthropic、Databricks、德国电信等多家公司试用。
图源:网络
据悉,亚马逊的芯片研发工作主要由其在 2015 年以 3.5 亿美元收购的芯片初创公司 Annapurna Labs 负责。AWS 计算和网络服务副总裁 Dave Brown 表示,虽然 AWS 仍将为客户提供最佳的英伟达解决方案,但同时也希望能为市场带来更多选择。据透露,亚马逊自研的推理芯片 Inferentia 在运行 AI 模型时的成本已比竞品低 40%。
为支持芯片研发,亚马逊预计 2024 年将投入约 750 亿美元的资本支出,主要用于技术基础设施建设,且 2025 年的支出可能更高。除了硬件研发,亚马逊还在积极开拓学术市场,宣布向研究人员提供价值 1.1 亿美元的免费算力额度,支持他们使用 Trainium 芯片开展 AI 研究。
值得注意的是,除亚马逊外,微软、Meta 等科技巨头也在积极研发自有数据中心芯片。业内分析师认为,这一趋势反映了各大云计算服务商希望通过自研芯片降低成本、提高利润率并获得更多供应链控制权。
传苹果“壁挂式”AI智能家居设备明年3月上市
据知名科技记者马克·古尔曼消息,Apple最早将在2025年3月推出一款形似iPad的壁挂式智能家居显示器,显示器类似于 Amazon Echo Hub,可以安装在墙上,控制智能家居设备、参加视频通话等。
图源:网络
古尔曼称,该设备配备6英寸厚边显示屏、内置摄像头、可充电电池和扬声器,搭载了新的操作系统“App Intents”,可以独立工作,但需要iPhone来完成初始设置。此外,设备还将支持包括Siri和Apple Intelligence的语音控制交互,并提供银色和黑色两种颜色选择。
苹果为该设备创建了多个底座,用户可以将其挂在墙上或使用带有额外扬声器的支架放置在桌面上。此外,设备还将使用传感器检测用户与屏幕的距离,并根据距离调整显示的内容。设备还支持苹果Handoff功能,允许用户跨设备进行任务。
目前尚不能确定这款壁挂式平板是否为为此前透露过的苹果代号J490的“带机械臂的智能家居平板”,该设备的零售价可能高达1000美元。
思科发布带有 AI 功能的 Wi-Fi 7 解决方案
思科于 2024 年 11 月 12 日宣布推出新一代 Wi-Fi 7 接入点设备,计划于 2024 年 12 月正式发货。这款新产品融合了人工智能、安全性和质量保障等先进功能。
图源:网络
在智能化方面,新设备具备 AI 原生性能优化和开箱即用的自配置功能。接入点能够自动检测位置,一旦接通电源就会下载相应的配置,大大简化了部署流程。
在安全性方面,思科将其威胁检测功能嵌入设备中,通过 AI 原生设备分析、威胁防范以及先进的无线安全和数据加密技术,确保每个连接的安全性。
新产品还集成了思科 ThousandEyes 数字质量保障解决方案,利用 AI 和自动化技术识别并修复无线网络内外的性能瓶颈,帮助用户快速定位和解决网络问题。
新产品将于 2024 年 11 月开放订购,预计 12 月开始发货。
苹果发布 Final Cut Pro 11,AI 功能升级,支持空间视频编辑
苹果在今天发布新一代视频编辑软件 Final Cut Pro 11,重点强化了 AI 功能和空间视频编辑能力。这是继 Final Cut Pro X 发布 13 年后的重大更新,现有用户可免费升级,新用户需支付 299 美元的一次性购买费用。
图源:苹果
新版本引入了基于 AI 的"磁性蒙版"(Magnetic Mask)功能,无需绿幕即可快速分离视频中的人物和物体。该功能支持自动追踪分析,用户可对背景进行自定义调整并添加特效。测试显示,在搭载 M1 Pro 处理器的 MacBook Pro 上,45 秒视频片段的蒙版处理时间不到一分钟。
另一项重要的 AI 功能是自动生成字幕,该功能由苹果自研的语言模型驱动,可在设备本地完成处理,无需连接云端。此外,Final Cut Pro 11 新增了空间视频编辑功能,支持调整 Vision Pro 头显设备拍摄的空间视频,包括颜色校正、添加特效以及调整字幕深度位置。
在 iPad 版本方面,Final Cut Pro 2.1 同步更新,新增了 AI 增强的光线和色彩工具,并优化了触控界面的工作流程。新版本还支持 Apple Pencil Pro 的笔刷功能和触觉反馈,为用户提供更直观的编辑体验。
值得一提的是,Final Cut Pro 11 针对苹果 M 系列芯片进行了优化,可支持更多 4K 和 8K ProRes 视频的同时播放,进一步提升了专业用户的剪辑效率。
传OpenAI明年1月份发布AI代理工具
据外媒报道,OpenAI最早可能在明年1月份推出名为“Operator”的AI代理工具,Operator将采用Web浏览器通用工具的形式实现AI在计算机上的直接操作。
图源:网络
消息称,OpenAI计划最初将其作为研究预览和开发人员工具推出,并与Anthropic的Computer Use和Google的以消费者为中心的AI代理等竞争。
就在几周前,OpenAI首席执行官Sam Altman曾在Reddit上表示:“我们将拥有越来越好的模型,但我认为下一个重大突破将是AI代理。”此外在上个月的OpenAI新闻发布会上,公司首席产品官Kevin Weil也称:“我认为2025年将是代理系统最终成为主流的一年。”
Operator最终向消费者发布的时间仍处于保密状态,但其开发标志着科技公司研究重心的关键转变,这些AI代理系统的出现将强化大模型与计算机界面互动,而不仅仅是处理文本和图像。
AMD将裁员全球4%员工
近日,AMD宣布将裁员4%的全球员工,即在其估计的26000名全球员工中裁员近1000人。
AMD发言人表示:“作为将我们的资源与我们最大的增长机会保持一致的一部分,我们正在采取一些有针对性的措施,不幸的是,这些措施将导致我们的全球员工人数减少约4%。我们致力于尊重受影响的员工,并帮助他们度过这一过渡期。”
图源:网络
据悉,与股票大涨、市值已达到3.6万亿美元的Nvidia相比,AMD市值目前仅为2270亿美元。
AMD在10月份表示,预计今年AI芯片销售额将达到50亿美元,约为257亿美元的五分之一。AMD在游戏机处理器/GPU方面占有一席之地,但这一代市场弱于预期,部分原因是 PlayStation 5和Xbox Series X/S的大流行供应短缺。
但根据Mercury Research的报告,目前AMD与英特尔的处理器市场份额为34%,相较几年前有大幅上升。分析师Jon Peddie表示,“虽然表现不如华尔街预期,但AMD还是有一个不错的季度表现,我认为AMD似乎并没有在员工人数上负担过重,目前的裁员决定非常糟糕,我建议AMD可以再等几个月。”
DeepL 发布 DeepL Voice,实现实时多语言交互
近日,全球知名的 AI 翻译平台 DeepL 在柏林发布了最新产品 DeepL Voice,这是该公司首个语音翻译工具,旨在突破语言障碍,实现实时多语言沟通。作为估值达 20 亿美元的语言科技巨头,DeepL 目前已服务超过 10 万家企业客户,其中包括半数财富 500 强企业。
图源:DeepL
DeepL Voice 提供两种专门解决方案:会议版(Voice for Meetings)和对话版(Voice for Conversations)。会议版支持在线会议中的多语言实时字幕翻译,使与会者能够使用母语发言和交流;对话版则针对面对面交谈场景,可在移动设备上实现即时翻译。目前,DeepL Voice 支持包括英语、德语、日语、韩语、法语和西班牙语在内的多种语言语音输入,可提供 33 种语言的实时字幕翻译输出。
值得一提的是,DeepL Voice 目前仅支持文字形式的翻译输出,尚未提供语音或视频输出功能。在视频会议平台方面,现阶段仅支持 Microsoft Teams,未来可能扩展到其他平台。该服务严格遵守数据保护规定,所有语音数据仅用于实时翻译,不会被保存或用于模型训练。
腾讯元宝推出2.0版本,整合视频号、QQ音乐等特色信息资源
11月14日,腾讯混元宣布推出腾讯元宝2.0版本。
图源:腾讯混元
基于新一代大模型"混元turbo",腾讯元宝2.0性能大幅提升,训练和推理效率提升一倍,并在信息回顾、AI搜索、多模态AI应用方面有较大升级,回答更快更准:
-
对话列表焕新:历史使用资产沉淀,用户可以更轻松地查找历史对话和使用过的智能体。无论是回顾信息还是继续未完的交流,都更加便捷。
-
AI应用专属板块:便捷、高效的AI应用集结专区。腾讯元宝2.0精选AI搜索、AI阅读、创意绘画、灵感图库、AI美照五大应用,多维度满足搜、读、写、画创作需求。更有“应用广场”提供类型丰富多样的智能体供用户选择,并可以一键添加到AI应用页面。
基于国内首个自研MoE多模态大模型,腾讯元宝2.0支持任意长宽比及最高7K分辨率图片的理解分析;基于业界领先的中文原生DiT 文生图架构,腾讯元宝2.0在语义理解、画面质感与真实性方面全面提升。
-
AI搜索:除微信公众号外,腾讯元宝2.0升级整合微信视频号、QQ音乐等特色信息资源,提供更加智能、便捷的搜索服务,随时随地想搜就搜。
此外,腾讯元宝2.0还将融入腾讯文档、电脑管家、搜狗输入法等生态产品,提供搜索资讯、研读文档等各种工作生活需求的AI功能。
Google Gemini AI 独立应用登陆 iOS 平台
2024 年 11 月 14 日,Google 正式发布了其 AI 助手 Gemini 的 iOS 独立应用。此前,iPhone 用户只能通过 Google Search 应用或移动网页访问 Gemini。
图源:Google
这款全新的独立应用支持多项创新功能:用户可以通过 Gemini Live 功能实现自然对话交互,支持英语、西班牙语、法语等 12 种语言;借助 Imagen 3 模型实现高质量图像生成;通过 Gemini Extensions 可以连接 Gmail、Google Maps、YouTube 等 Google 服务。
值得一提的是,该应用还针对 iOS 平台进行了深度优化,支持灵动岛功能和锁屏界面交互。用户在使用其他应用或手机锁屏时,也可以便捷地与 Gemini 进行对话。
Gemini 应用免费提供基础功能,同时也提供 Gemini Advanced 高级订阅服务,订阅费用为每月 19.99 美元。高级服务可使用 Google One AI 高级计划,包含 Mail、Docs 等应用中的 Gemini 功能,以及优先访问新特性等权益。
AI PC 出货量激增,第三季度市占率达 20%,环比增长 49%
据市场研究机构 Canalys 最新数据显示,2024 年第三季度,AI PC 出货量达到 1330 万台,占当季 PC 总出货量的 20%。这一新兴品类环比增长 49%,其中 Windows 设备首次占据主导地位,市场份额达到 53%。
图源:Canalys
Canalys 将 AI PC 定义为配备专用芯片或模块(如 NPU)以运行设备端 AI 工作负载的台式机和笔记本电脑。业内专家指出,目前 AI PC 面临两大挑战:一是缺乏明确的应用场景,二是较高的价格溢价(比普通 PC 高出 10-15%)。不过,随着 Windows 10 支持即将结束,以及处理器技术更新换代,预计到 2025 年,AI PC 可能占据市场份额的 43%,并在 2026 年成为市场主流。