编译/前方智能
谷歌近日宣布,他们为「谷歌翻译」添加了 110 种新语言的支持。此前,「谷歌翻译」一共只支持 133 种语言,此次更新几乎让「谷歌翻译」能够翻译的语言翻了一番,使支持的总语言数量达到了 243 种。
谷歌透露,能有如此大的飞跃还要得益于旗下的 PaLM 2 语言模型的帮助,它在学习彼此相关的语言时表现得特别好。这是由 Google Research 开发的基于 Transformer 的大型语言模型 AI,与 Gemini 不同,PaLM 2 是在 Pathways 上训练的,这是一个包含超过 1.56 万亿个单词和 2500 亿参数的人类语言数据集。
根据谷歌的统计,这些新添加的语言目前有超过 6.14 亿的使用者,其中有些是拥有超过 1 亿使用者的主流语言,还有一些则是由小型原住民社区使用的语言,甚至包括一些即将濒临灭绝的语言。
此次新添加的语言中,还首次出现了粤语的身影。目前除了广东、香港等地区在使用,粤语在东南亚以及欧美等华人聚集区域也被广泛使用(不是简单的简体转繁体,可看下图示例)。
全世界有超过 7000 种语言,谷歌将继续与语言学专家合作,把更多语言引入该平台。
来源:TheVerge