TCL科技申请音频合成专利,使得合成音频能够呈现同语种下的不同口音和音色

TCL科技申请音频合成专利,使得合成音频能够呈现同语种下的不同口音和音色


2023-12-02 00:46:00
来源:金融界网站作者:

2023年12月1日消息,据国家 知识产权 局公告, TCL科技 集团股份有限公司申请一项名为“一种音频合成方法、装置、设备和存储介质“,公开号CN117153140A,申请日期为2022年5月。

 

专利摘要显示,本申请实施例公开了一种音频合成方法、装置、设备和存储介质,包括:获取预设文本的标准音标文本,所述标准音标文本用于表征所述预设文本的标准读音;获取目标口音特征向量;获取目标身份标识;通过音频合成模型,根据所述标准音标文本、所述目标口音特征向量以及所述身份标识,生成目标声音特征参数;将所述目标声音特征参数转换成所述预设文本对应的目标音频,所述目标音频携带有所述目标口音特征向量对应的目标口音和所述目标身份标识对应的所述目标音色。通过训练音频合成模型来生成合成音频,使得合成音频能够呈现同语种下的不同口音和音色,改善现有的部分人群无法适应或理解普通话提示语音或引导语音的问题。

 

   特别声明    本站部分内容《图·文》来源于国际互联网,仅供参考,不代表本站立场!

本站尊重知识产权,版权归原创所有,本站资讯除非注明原创,否则均为转载或出自网络整理,如发现内容涉及言论、版权问题时,烦请与我们联系,微信号:863274087,我们会及时做删除处理。