平安科技申请情感语音转换专利,实现音频风格转换

360影视 2025-01-31 13:11 2

摘要:国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“情感语音转换方法、装置、设备及介质”的专利,公开号CN 119380733 A,申请日期为2024年10月。

金融界2025年1月31日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“情感语音转换方法、装置、设备及介质”的专利,公开号CN 119380733 A,申请日期为2024年10月。

专利摘要显示,本发明涉及人工智能技术领域,公开了一种情感语音转换方法、装置、设备及介质,方法包括:根据输入的原始音频波形转换提取原始音频特征表示,其中,原始音频特征表示为原始梅尔频谱图或SSL表示;根据输入的原始音频波形转换提取原始音频HuBERT表征作为真实单元序列;对提取获得的原始音频特征表示进行风格分解后结合目标风格进行风格重构,获得目标风格编码特征向量;通过交叉注意力机制根据情感单元输入的情感特征向量结合目标风格编码特征向量聚集上下文信息,并压缩至单元级;对上下文信息分别进行单元级风格化和帧级风格化;根据目标风格向量、单元级风格化后的上下文信息及帧级风格化后的上下文信息创建目标语音梅尔频谱图。

天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币,实缴资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目276次,知识产权方面有商标信息75条,专利信息5000条,此外企业还拥有行政许可19个。

来源:金融界

相关推荐