每经编辑 张锦河 每经实习编辑 宋欣悦
9月25日,OpenAI正式宣布,ChatGPT的高级语音模式(Advanced Voice Mode)将于本周内正式面向ChatGPT Plus个人用户及小型企业团队(Teams)用户推出,该功能将率先在美国市场上线。
此外,OpenAI表示,下周将向OpenAI企业版和教育版用户开放这一功能。但值得注意的是,全新的语音功能适用于OpenAI的GPT-4o模型,不适用于最近发布的预览模型o1。
此次更新意味着,从本周起,ChatGPT的Plus版个人用户和小型企业团队用户可以通过“语音”而非传统文本输入与聊天机器人进行互动。
高级语音模式的两大亮点尤为引人注目:一是支持用户为语音助手设定“自定义指令”,实现个性化操作;二是具备“记忆”功能,能记住用户偏好的交互方式,这与今年早些时候为ChatGPT的文本版本推出的功能类似。
在官方发布的视频中,OpenAI的技术项目经理夏洛特·科尔(Charlotte Cole)和OpenAI研究工程师迈克(Mike)表示,用户不仅能自定义对话语速,还能让模型以用户的名字或偏好的称呼进行交流,使沟通更加亲切自然。
此外,用户还能在系统内预设个人姓名与住址信息。当发起新一轮对话时,如询问“这个周末天气真好,户外有什么有趣的活动可以推荐吗?”高级语音助手将调用用户之前输入的住址信息,主动推荐周边的游玩地点,甚至贴心地规划出行路线。
为满足不同用户的喜好,高级语音模式新增了五种各具特色的声线:Arbor、Maple、Sol、Spruce和Vale,与原有四种声音Breeze、Juniper、Cove和Ember,共同构成了九大声线选择。这些声线的名称均以自然元素为灵感,旨在提供多样化的语气和特征。
值得注意的是,OpenAI撤除了被指模仿女演员斯嘉丽·约翰逊(Scarlett Johansson)的Sky声线。此前,斯嘉丽指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。
此外,OpenAI表示,他们还对部分外语的对话能力进行了优化,不仅提升了对话速度和流畅度,还对口音进行了细致调整,力求更贴近自然交流。
OpenAI的模型设计师德鲁(Drew)也分享了他的使用体验,他表示,在日常使用中,用户可以将高级语音助手置于一旁,它会在静默中等待,不会打扰到用户。而当用户有任何疑问或需要时,随时可以向它发起对话,它将迅速捕捉对话的语调变化,灵活扮演各种角色,如同与真人朋友通话般自然流畅。
ChatGPT高级语音模式现已支持50多种语言,拓展了用户的沟通范围。尤为有趣的是,在官方发布的演示视频中,用户要求语音助手表达,由于让奶奶久等了,向奶奶致歉。高级语音助手先用英语流畅地总结了一遍,并在用户表示“奶奶只会说普通话”后,又用标准的普通话表达了一遍“对不起,我迟到了”,仿佛是OpenAI因为一再推迟发布高级语音模式,在向用户们致歉。
需要注意的是,该高级语音模式目前还没有向欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放使用。OpenAI尚未公布这些地区的开放时间。
OpenAI首席执行官山姆·奥尔特曼(Sam Altman)在社交平台上难掩兴奋之情,表示“希望你们觉得等待是值得的”,还加上了委屈和比心的表情。
尚在假期的OpenAI总裁格雷格·布罗克曼(Greg Brockman)也热情参与了宣传,他表示:“高级语音功能的推出,让你能够轻松与ChatGPT展开流畅无阻的对话。那一刻,你或许会意识到,以往在电脑上费力打字交流的方式是多么不自然。”
每日经济新闻综合公开消息