摘要:国家知识产权局信息显示,中山大学·深圳、中山大学、深圳广电数字科技有限公司申请一项名为“基于广播新闻的方言语音识别模型语料库构建方法和装置”的专利,公开号CN119851652A,申请日期为2024年12月。
金融界2025年4月22日消息,国家知识产权局信息显示,中山大学·深圳、中山大学、深圳广电数字科技有限公司申请一项名为“基于广播新闻的方言语音识别模型语料库构建方法和装置”的专利,公开号CN119851652A,申请日期为2024年12月。
专利摘要显示,本发明公开了基于广播新闻的方言语音识别模型语料库构建方法和装置,方法包括:获取广播新闻视频,所述广播新闻视频中具有第一字幕;对所述广播新闻视频进行音轨提取,得到广播新闻音频;根据所述广播新闻音频,计算静音点列表;根据所述静音点列表,计算自然语音起止时间列表;根据所述广播新闻视频,计算关键帧时间轴;根据所述自然语音起止时间列表和所述关键帧时间轴,生成初始语料数据集;根据所述初始语料数据集,构建方言语音识别模型语料库。本发明实现了语料库构建,提高了效率和准确率,降低了语料库管理成本。本发明可广泛应用于模型语料库技术领域。
来源:金融界