速递|OpenAI 推出 ChatGPT 高级语音模式,Plus 用户率先体验 GPT-4o 超逼真语音交互

7 月 30 日,OpenAI 推出了 ChatGPT 高级语音模式,用户首次能够体验 GPT-4o 超逼真语音交互。目前,Alpha 版本面向于小部分 ChatGPT Plus 用户,秋季之后将逐步推广至所有 Plus 用户。

速递|OpenAI 推出 ChatGPT 高级语音模式,Plus 用户率先体验 GPT-4o 超逼真语音交互

OpenAI 表示,春季更新期间演示的视频和屏幕共享功能并不包括在 Alpha 版本在内,而是在后面推出。

ChatGPT 高级语音模式不同于此前的语音模式,原有的音频解决方案使用了三个独立的模型:一个用于将用户的语音转换为文本,然后由 GPT-4 处理 Prompt,然后由第三个模型将 ChatGPT 生成的文本转化为语音。

GPT-4o 是一个多模态模型,能够在没有其他模型辅助的情况下处理这些任务,因为在体验上将显著降低对话的延迟。

OpenAI 还透露,GPT-4o 可以感知用户声音中的情绪语调,包括悲伤、兴奋或者唱歌;目前,Alpha 组的用户将在 ChatGPT 中收到提醒,并将收到一封邮件介绍如何使用。

速递|OpenAI 推出 ChatGPT 高级语音模式,Plus 用户率先体验 GPT-4o 超逼真语音交互

据悉,高级语音模式种的预设声音将仅限 Juniper、Breeze、Cove 以及 Ember,这些都是与付费配音演员合作制作的,而 5 月份演示的 Sky 声音将不再可用。

OpenAI 发言人 Lindsay McCallum 表示,ChatGPT 目前还无法模仿其他人的声音,无论是个人还是公众人物,并且会屏蔽与这四种预设声音不同的输出。

此外,OpenAI 引入了新的过滤方式来避免模型生成受版权保护的音频,从而造成法律纠纷。

自发布 Demo 以来,OpenAI 已经与 100 多名使用 45 种不同语言的外部红队成员一起测试了 GPT-4o 语音功能,相关的安全措施报告将在 8 月初发布。

文章来源:有新Newin

温馨提示 网站名称:壹柒学Ai-给真正想学习AIGC爱好者们规避弯路,提供顺畅学习之路!
官方网址:https://17xueai.net
本网站的部分文章内容收集来源于网络,部分会附上原作者信息,所有资源内容仅限于大家学习与参考。
版权归原作者所有,若内容若侵犯到您的权益,请联系站长QQ:1005406289 我们将第一时间处理!
本网站的部分文章内容需要指定积分进行获取查看,积分获取方式请查看【帮助文档】中说明。
本网站的资源所售价格并非资源售卖价格,是收集、整理、制作、编辑详情以及本站运营的适当补贴。
本网站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报,举报成功会获得对应积分奖励!
如无特别声明本文即为原创文章仅代表个人观点,版权归《壹柒学Ai》所有,欢迎转载,转载请保留原文链接。

给TA打赏
共{{data.count}}人
人已打赏
行业资讯

Meta 如约发布 Llama3.1 405B 模型

2024-7-29 16:57:31

行业资讯

AI助手:汇总国内所有大语言模型的AI工具

2024-8-6 9:56:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索