扩展阅读
![3月份中国制造业采购经理指数回升重回扩张区间](/uploadfile/2024/0331/20240331075833104.png)
![](/uploadfile/2024/0331/20240331075833104.png)
![OpenAI官网首次分享名为“Voice Engine”(语音引擎)预览](/uploadfile/2024/0330/20240330102508282.png)
![](/uploadfile/2024/0330/20240330102508282.png)
![黄金价格不断上涨多次创历史新高 金饰价格逼近700元/克](/uploadfile/2024/0330/20240330101846717.png)
![](/uploadfile/2024/0330/20240330101846717.png)
![湖北国资旗下长江产投将成为长江证券第一大股东](/uploadfile/2024/0330/20240330101548992.png)
![](/uploadfile/2024/0330/20240330101548992.png)
![微软、OpenAI算力建设项目曝光成本超千亿美元 算力概念股票引关注](/uploadfile/2024/0330/20240330100955543.png)
![](/uploadfile/2024/0330/20240330100955543.png)
![俄罗斯央行:人民币成为俄罗斯外汇储备唯一也是最佳的选择](/uploadfile/2024/0330/20240330100456475.png)
![](/uploadfile/2024/0330/20240330100456475.png)
![美联储降息预期遭质疑 美联储主席鲍威尔周五讲话引发市场关注](/uploadfile/2024/0330/20240330100112958.png)
![](/uploadfile/2024/0330/20240330100112958.png)
![十大头部券商2023年业绩披露完毕 净利润超百亿的券商](/uploadfile/2024/0330/20240330095906938.png)
![](/uploadfile/2024/0330/20240330095906938.png)
![先正达终止650亿元ipo申请 未来将在合适的时机重启上市进程](/uploadfile/2024/0330/20240330095620103.png)
![](/uploadfile/2024/0330/20240330095620103.png)
![美联储不急于降息谨慎把握降息时机 将会对降息决策持谨慎态度](/uploadfile/2024/0330/20240330095442479.png)
![](/uploadfile/2024/0330/20240330095442479.png)
据介绍,通过输入文本和15秒音频样本,Voice Engine便可以生成一个与音频中说话者非常相似的自然语音。新闻稿强调,生成的自然语音具有丰富的情感和逼真的声音。
OpenAI称,公司在2022年底就启动了Voice Engine的研发工作,并将它用作一些其他功能的预设语音。由于合成语音可能会被滥用,公司只在小范围内与开发人员分享了该模型,未来可能不会广泛推出这一功能。
新闻稿写道,儿童教育技术公司Age of Learning正在使用这个模型来生成一些预先编写好的内容,并且还结合GPT-4 创建实时的响应来与学生互动。
在案例中,OpenAI放出了一段英语男声和西班牙语女声的样本音频,并用两段音频各生成了讲解知识的语音。
另外,数字人视频生成初创公司HeyGen也采用了这项技术。HeyGen可以根据内容创建定制的数字人化身,而Voice Engine可以将样本的声音转换成多种其他语言,来帮助产品营销到销售演示。
新闻稿提到,在转换语言时,Voice Engine会保留原始说话者的母语口音,例如样本中的人使用的是法语,那么生成的英语将带有法国口音。本周早些时候,有消息称HeyGen正在进行新一轮融资,投前估值达到4.4亿美元。
除此以外,OpenAI还展示了生成较小语系和孤立语系声音的能力,以帮助落后地区的社区卫生工作者;同时还与神经科学研究所探索AI在临床环境中的应用,比如帮助语言障碍者等用途。
“太强大了导致无法推广”
OpenAI写道,“我们认识到,生成声音的功能存在严重风险,这一点在大选年尤为突出。我们正在与来自政府、媒体、娱乐、教育等领域的国际合作伙伴合作,以确保我们在建设过程中吸收他们的反馈。 ”
OpenAI产品负责人Jeff Harris告诉媒体,“如果你能正确地设置音频,基本上就能生成人类口径的声音,这是一种相当令人印象深刻的技术。”但Harris提到,准确模仿人类语音的能力确实存在安全隐患。
今年1月,美国就出现“AI拜登”事件,由AI生成的“假拜登”在电话中用逼真的声音鼓励可能支持民主党的5000位选民在新罕布什尔州初选中不要投票。本月早些时候,拜登呼吁国会通过立法来监管AI,包括禁止“AI语音模仿”等。
在测试计划中,OpenAI要求其合作伙伴遵守其制定的使用政策:在使用语音样本之前要征得声音主人的同意,并明确告诉听众声音是AI生成的。该公司还在安装一种听不见的音频水印,以区分音频是否是由其工具创建的。
OpenAI写道,“无论我们最终是否会广泛部署这项技术,让全球各地的人们了解这个发展方向都是非常重要的。”
用户评论(已有0条评论)