日前,谷歌发布了三种新的“开放”生成式人工智能模型Gemma 2 2B、ShieldGemma和Gemma Scope,新型号是谷歌Gemma 2系列生成模型的补充,该模型于5月份首次亮相。
图源:网络
其中,Gemma 2 2B是一个轻量级模型,模型仅包含26亿个参数,性能可媲美甚至超过OpenAI的GPT-3.5和Mistral AI的Mixtral 8x 7 B等大型语言模型。
谷歌报告Gemma 2 2B在MMLU(大规模多任务语言理解)基准测试中获得56.1分,在MBPP(主要是基本Python编程)中获得36.6分。
由人工智能研究机构LMIGO进行的独立测试显示,Gemma 2 2B在其评估竞技场中获得了1130分。这一结果略高于GPT-3.5-Turbo-0613(1117)和Mixtral-8x 7 B(1114),这两种型号的参数是前者的十倍。
Gemma 2 2B可用于生成分析文本,可以在包括笔记本电脑和边缘设备等在内的一系列硬件上运行,并被授权用于某些研究和商业应用,开发者可以从Google的Vertex AI模型库、数据科学平台Kaggle和Google的AI Studio工具包等来源下载模型。
而ShieldGemma是一个“安全分类器”的集合,其构建在Gemma 2之上,可过滤生成模型的提示以及模型生成的内容,被用于检测仇恨言论、骚扰和色情等内容。
Gemma Scope则由专门的神经网络组成,可帮助解压缩Gemma 2处理的密集、复杂信息,并将其扩展为更容易分析和理解的形式。通过研究这些扩展的视图,研究人员可以获得宝贵的见解,了解Gemma 2如何识别模式,处理信息并最终做出预测。