广州方硅申请语音合成专利,合成语音能逼近真人语音效果

360影视 2025-01-28 18:10 2

摘要:国家知识产权局信息显示,广州方硅信息技术有限公司申请一项名为“语音合成方法、装置、直播系统、电子设备及存储介质”的专利,公开号CN 119360822 A,申请日期为2024年9月。

金融界2025年1月28日消息,国家知识产权局信息显示,广州方硅信息技术有限公司申请一项名为“语音合成方法、装置、直播系统、电子设备及存储介质”的专利,公开号CN 119360822 A,申请日期为2024年9月。

专利摘要显示,本申请涉及一种语音合成方法、装置、直播系统、电子设备及计算机可读存储介质;所述方法包括:获取语言合成的目标文本和说话人的音色特征;对目标引导音频进行编码得到去除音色的目标离散语义编码;其中,所述目标离散语义编码包含韵律特征;基于大语言模型对所述目标离散语义编码和所述目标文本进行预测得到待合成音频编码;其中,所述待合成音频编码包括目标引导音频的韵律和目标文本的语义特征根据所述目标文本和音色特征对所述待合成音频编码进行解码得到语音合成音频;该技术方案,合成语音能逼近真人语音效果,可以调制合成语音的韵律和音色,满足网络直播中的多样化应用需求。

天眼查资料显示,广州方硅信息技术有限公司,成立于2016年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本200万人民币,实缴资本50万人民币。通过天眼查大数据分析,广州方硅信息技术有限公司参与招投标项目1次,知识产权方面有商标信息581条,专利信息1442条,此外企业还拥有行政许可13个。

来源:金融界

相关推荐