杭州智元申请具有多尺度注意力的视觉跟踪系统及方法专利,提高跟踪器对尺度变化的敏感性

摘要:国家知识产权局信息显示,杭州智元研究院有限公司申请一项名为“一种具有多尺度注意力的视觉跟踪系统及方法”的专利,公开号CN 119151991 A,申请日期为2024年9月。

金融界2024年12月21日消息,国家知识产权局信息显示,杭州智元研究院有限公司申请一项名为“一种具有多尺度注意力的视觉跟踪系统及方法”的专利,公开号CN 119151991 A,申请日期为2024年9月。

专利摘要显示,本发明提出一种具有多尺度注意力的视觉跟踪系统及方法,该系统采用Siamese框架,包括:线性投影层,基于模板图像和搜索区域图像的图像块序列生成对应的图像块;特征提取模块,用于从模板图像和搜索区域图像中提取不同尺度的特征信息;信息融合块,通过注意力机制将模板图像块和搜索图像块在不同尺度特征上进行融合,生成包含关键目标位置信息的图像块;预测头,根据包含关键目标位置信息的图像块预测目标的位置。本发明提出了一种新颖的多尺度注意力机制,该机制从各种尺寸的特征图中捕获模板和搜索区域之间的全局依赖,从而提高了跟踪器对尺度变化的敏感性,在建模小尺寸特征依赖之前采用注意力引导,有效地优先关注主要目标信息。

来源:金融界

相关推荐