OpenAI发布语音模型Voice Engine，出于安全考虑仅小范围试用

2024-04-02 16:25:02来源：界面新闻

文章导读: 3月30日，OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入，生成与原始说话者极为相似的自然语音。在通告中， OpenAI给出了Voice E ...

3月30日，OpenAI在官网上公开了其最新的研究成果——“Voice Engine”。这项技术可通过简短的15秒音频样本和文本输入，生成与原始说话者极为相似的自然语音。

在通告中，OpenAI给出了Voice Engine的一些早期应用场景。如通过自然、富有情感的声音辅助儿童阅读、翻译视频和播客等内容、改善偏远地区的社区服务、帮助患有突发性或退化性言语病症的患者恢复声音等。

针对上述应用场景，OpenAI也分别给出了和少数“值得信赖”的合作伙伴共同完成的技术案例。儿童教育公司Age of Learning使用GPT-4与Voice Engine与学生进行个性化的交流；人工智能替代通信应用程序Livox通过使用语音引擎，为残疾人提供跨多种语言的自然声音；此前靠“Taylor Swift说中文”等视频爆火的Heygen也有使用Voice Engine。

OpenAI称，Voice Engine技术于2022年底开始开发，目前已经为文本转语音API和ChatGPT的朗读功能提供预设语音。至于模型训练的数据来源问题，OpenAI语音引擎产品团队成员杰夫·哈里斯（Jeff Harris）在接受媒体采访时表示，该模型是根据“许可数据和公开数据的组合”进行训练的。

尽管此前已经为“Voice Engine”申请了商标，但是对于未来是否要大规模部署这项技术，OpenAI仍保持保守态度。2024年2月，美国曾发布了少数公司利用总统的人工智能语音来影响选民投票的事件，类似的潜在风险也是OpenAI选择先小范围应用Voice Engine的一大原因。

OpenAI发布语音模型Voice Engine，出于安全考虑仅小范围试用

通告中显示，由于合成语音存在遭滥用的可能性，OpenAI希望就合成声音的负责任部署以及社会如何适应这些新功能展开讨论，根据讨论和小规模测试的结果，OpenAI将会对是否大规模部署这项技术做出决定。

OpenAI在人工智能安全方面曾早早做出准备。2023年10月，OpenAI 宣布成立“准备团队”（Preparedness team），旨在监测和评估前沿模型的技术和风险；随后于2023年12月，OpenAI进一步公布了“准备框架”（Preparedness Framework），介绍了围绕OpenAI“追踪、评估、预测和防范灾难性风险”所制定的一系列机制。

对于Voice Engine，OpenAI表示正在探索对合成声音加水印或添加控制措施的方法，以防止人们使用带有政治家或其他知名人物声音的技术。

，元宇宙之家消息

上一篇：从解剖结构到手术指导，香港试水医疗多模态大模型 返回首页 返回栏目

下一篇：柔宇“柔性星球”梦碎：破产审查启动、欠薪员工休假

头条资讯

咖啡机大卖家：去年中东业绩继续暴涨，新年加码国内电商市场: 龙虎榜 | 中广天择今日涨1.17%，上榜营业部席位全天合计净卖出 7连板安奈儿：尚未收到交易对手方卓云智创关于创新科其他股东龙虎榜 | 纵横股份今日涨停，知名游资炒股养家净买入143.79万元

龙蟠科技：拟1.01亿元收购山东美多100%股权，并对其增资5000万元: 2连板大连圣亚：目前生产经营活动正常，未发生重大变化龙虎榜 | 望变电气今日涨停，机构合计净买入1782.48万元 3天2次跌停*ST同达：不排除公司2023年度经审计营收低于1亿元且净

龙虎榜 | 天元智能今日涨停，知名游资宁波桑田路卖出1871.32万元: 业绩走弱、扩张遇阻，天奈科技定增额缩水六成后股价大跌 3月5日投资晚报|国务院国资委：对三家中央车企进行单独考核， AI手机概念活跃，四连板福蓉科技：与AI功能直接相关的芯片无关