GPT-4o高级语音模式开始向部分ChatGPT Plus用户开放测试_陀螺科技

我要发布

GPT-4o高级语音模式开始向部分ChatGPT Plus用户开放测试

前方智能原创 2024-07-31 10:09 热度 3569

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

在此前的“斯嘉丽·约翰逊语音侵权争议”后，OpenAI终于宣布于本周开始推出ChatGPT的高级语音模式，让用户得以首次访问GPT-4o的超现实音频响应。OpenAI表示，Alpha版本将于今天提供给部分ChatGPT Plus用户，该功能将在2024年秋季逐步向所有Plus用户推出。

图源：OpenAI

据悉，GPT-4o语音模式与目前可用的ChatGPT语音模式不同。ChatGPT的旧音频解决方案使用三个独立的模型：一个将语音转换为文本，GPT-4处理提示，第三个将ChatGPT的文本转换为语音。

而GPT-4o是多模态的，能够在没有辅助模型的帮助下处理这些任务，从而显著降低了会话的延迟。此外，OpenAI还声称GPT-4o可以感知声音中的情绪语调，包括悲伤、兴奋或唱歌。

在过去的几个月中，OpenAI已经与100多名会说45种不同语言的外部团队成员一起测试了GPT-4o的语音功能，相关安全措施报告将于8月初发布。而在Alpha版本推出后，OpenAI也将密切监控其使用情况。获得Alpha测试资格的用户将在ChatGPT应用程序中收到通知和一封电子邮件，其中包含GPT-4o的使用说明。

OpenAI表示，高级语音模式将仅限于ChatGPT与付费配音演员合作制作的四种预设语音- Juniper，Breeze，Cove和Ember。OpenAI在5月演示中展示的Sky语音已不再可用。公司代表对此表示：“ChatGPT不能模仿其他人（无论是个人还是公众人物）的声音，并且会阻止与这些预设声音不同的输出。”

OpenAI还称，公司引入了新的过滤器来阻止某些生成音乐或其他受版权保护的音频的请求，防止出现与Suno和Udio类似的因侵犯版权而陷入法律麻烦。

ChatGPT GPT-4o OpenAI 模型测试语音模型

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10114638.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇： Perplexity AI 推出出版商收入分享计划

下一篇： Canva 收购 Leonardo AI，强化 AI 图像生成能力

相关文章

OpenAI 生意做大了，奥尔特曼口碑更差了

AI芯天下丨热点丨OpenAI在AI基建下重注，与AMD...

AI芯天下丨深度丨OpenAI年底将上线100万张GPU...

AI芯天下丨热点丨OpenAI即将推出Agent模式，A...

AI芯天下丨热点丨OpenAI转向谷歌TPU芯片，AI基...

OpenAI首次停摆的背后