谷歌展示多个AI大模型更新_陀螺科技

我要发布

谷歌展示多个AI大模型更新

VR陀螺原创 2024-05-15 17:34 热度 82336

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

今日谷歌在其I/O大会期间，宣布了自家AI大模型矩阵的更新以及迭代情况，主要信息如下：

新增Gemini 1.5 Flash

谷歌表示，1.5 Flash是目前速度最快的Gemini模型，它专门针对大规模的大批量、高频任务进行了优化，服务更具成本效益。

据悉，1.5 Flash基于Gemini 1.5 Pro“distillation”（译为蒸馏）训练而来，它能将较大模型中最重要的知识和技能转移到更小、更高效的模型中。

1.5 Flash的负载要比1.5 Pro小得多，但是在内容生成方面同样有不俗的质量表现。1.5 Flash擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等。

1.5 Pro性能提升

目前1.5 Pro最为显著的提升在于它的信息处理能力由100万token提升至了200万token。

此外，谷歌表示该大模型还进一步提升了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力，目前可以执行更加复杂和细致的指令。

其他方面，Gemini API和Google AI Studio中新增了音频理解能力，可以对上传视频的图像和音频进行推理。当然，现如今1.5 Pro也更为紧密地与谷歌旗下产品结合在了一起。（这也是本次I/O大会核心展示部分）

Gemini Nano

Gemini Nano是一款适用于智能手机等设备的端侧大模型，早些时候该大模型只支持纯文本处理，现如今已经进一步升级图像处理功能。Gemini Nano目前已经应用于Pixel等手机产品当中。

开放模型Gemma 2

推出开放大模型Gemma 2，该模型采用全新架构，相较老版本性能以及效率有所升级，并且新增了不同尺寸版本。

Project Astra

Project Astra旨在成为下一代AI助理，具有多模态能力，用户能够与之进行复杂的对话。谷歌在I/O大会期间展示了基于Project Astra所构建的体验视频，里面包含了Project Astra与AR眼镜相集成的用例。

来源：谷歌

AI 大模型谷歌

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏： https://www.tuoluo.cn/columns/author1286744/

本文网址： https://www.tuoluo.cn/article/detail-10112556.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：谷歌展示照片AI搜索功能“Ask Photos”

下一篇： Crypto行业在美国国会面临最关键的两周，以下是你需要知道的一切

相关文章

趋势丨AI大厂转向效率优先，大模型商业化分配生变

我用这本「40万字的AI指南」，让TRAE Work给我...

在这届WAIC上，我们看到了智能体、具身智能和算力的三大...

取次硅谷懒回顾，半缘DeepSeek半缘Kimi

一大批AI硬件，正在帮我们「教」孩子

当大模型搬进终端，AI手机竞赛全面提速