西湖心辰申请基于大模型的语音风格识别系统专利,提高泛化能力

360影视 2025-01-28 18:10 2

摘要:国家知识产权局信息显示,西湖心辰(杭州)科技有限公司申请一项名为“基于大模型的语音风格识别系统”的专利,公开号 CN 119360830 A,申请日期为2024年12月。

金融界2025年1月28日消息,国家知识产权局信息显示,西湖心辰(杭州)科技有限公司申请一项名为“基于大模型的语音风格识别系统”的专利,公开号 CN 119360830 A,申请日期为2024年12月。

专利摘要显示,本申请涉及智能语音识别领域,其具体地公开了一种基于大模型的语音风格识别系统,其通过接收由麦克风采集的目标用户的语音输入信号,然后从中提取出梅尔频谱,并采用基于深度学习和大模型的信号分析和处理技术来对提取出的语音输入信号梅尔频谱图进行分块处理和多尺度语义编码,以此根据编码得到的各个上下文梅尔频谱局部编码特征之间的动力学特征聚合表示来智能地生成语音风格识别播报语音。通过该方式,系统能够确保复杂风格得到充分表征,并且能够更好地适应不同说话人在发音方式、语速、音调等方面的显著差异,提高泛化能力。

天眼查资料显示,西湖心辰(杭州)科技有限公司,成立于2021年,位于杭州市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本260.419527万人民币,实缴资本37.996万人民币。通过天眼查大数据分析,西湖心辰(杭州)科技有限公司共对外投资了5家企业,参与招投标项目2次,知识产权方面有商标信息25条,专利信息6条,此外企业还拥有行政许可3个。

来源:金融界

相关推荐