谷歌展示多个AI大模型更新

IP归属:广东

今日谷歌在其I/O大会期间,宣布了自家AI大模型矩阵的更新以及迭代情况,主要信息如下:

新增Gemini 1.5 Flash

谷歌表示,1.5 Flash是目前速度最快的Gemini模型,它专门针对大规模的大批量、高频任务进行了优化,服务更具成本效益。

据悉,1.5 Flash基于Gemini 1.5 Pro“distillation”(译为蒸馏)训练而来,它能将较大模型中最重要的知识和技能转移到更小、更高效的模型中。

1.5 Flash的负载要比1.5 Pro小得多,但是在内容生成方面同样有不俗的质量表现。1.5 Flash擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等。

1.5 Pro性能提升

目前1.5 Pro最为显著的提升在于它的信息处理能力由100万token提升至了200万token。

此外,谷歌表示该大模型还进一步提升了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力,目前可以执行更加复杂和细致的指令。

其他方面,Gemini API和Google AI Studio中新增了音频理解能力,可以对上传视频的图像和音频进行推理。当然,现如今1.5 Pro也更为紧密地与谷歌旗下产品结合在了一起。(这也是本次I/O大会核心展示部分)

Gemini Nano

Gemini Nano是一款适用于智能手机等设备的端侧大模型,早些时候该大模型只支持纯文本处理,现如今已经进一步升级图像处理功能。Gemini Nano目前已经应用于Pixel等手机产品当中。

开放模型Gemma 2

推出开放大模型Gemma 2,该模型采用全新架构,相较老版本性能以及效率有所升级,并且新增了不同尺寸版本。

Project Astra

Project Astra旨在成为下一代AI助理,具有多模态能力,用户能够与之进行复杂的对话。谷歌在I/O大会期间展示了基于Project Astra所构建的体验视频,里面包含了Project Astra与AR眼镜相集成的用例。

来源:谷歌

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10112556.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章