科大讯飞申请一种语音分离专利,提高目标语音分离效果

360影视 欧美动漫 2025-04-10 17:41 2

摘要:国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“一种语音分离方法、装置、存储介质及设备”的专利,公开号CN 119785817 A,申请日期为2025年1月。

金融界2025年4月10日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“一种语音分离方法、装置、存储介质及设备”的专利,公开号CN 119785817 A,申请日期为2025年1月。

专利摘要显示,本申请公开了一种语音分离方法、装置、存储介质及设备,该方法包括:首先获取待分离的混合语音和目标视频;并提取混合语音的声学特征;然后将混合语音的声学特征和目标视频包含的目标用户唇形的图像输入多模对齐模型,得到目标用户的唇形特征;接着将混合语音的声学特征和目标用户的唇形特征输入多模VAD模型,得到混合语音的分离概率;再根据混合语音的分离概率,结合波束形成算法,计算混合语音对应的多模波束特征,进而可以将混合语音的声学特征、目标用户的唇形特征、多模波束特征输入多模语音分离模型,并根据模型输出的掩蔽信号,从混合语音中更为准确的分离出目标语音,从而提高了对于目标语音的分离效果。

天眼查资料显示,科大讯飞股份有限公司,成立于1999年,位于合肥市,是一家以从事研究和试验发展为主的企业。企业注册资本231173.4185万人民币,实缴资本128450.0991万人民币。通过天眼查大数据分析,科大讯飞股份有限公司共对外投资了130家企业,参与招投标项目5000次,财产线索方面有商标信息2678条,专利信息5000条,此外企业还拥有行政许可57个。

来源:金融界

相关推荐