湘潭大学胡凯课题组多项研究成果被人工智能领域国际顶级会议录用

摘要:近期,湘潭大学计算机学院胡凯教授课题组多项研究成果成功被人工智能领域国际顶级会议——神经信息处理系统大会(NeurIPS)以及人工智能促进会(AAAI)录用。

近期,湘潭大学计算机学院胡凯教授课题组多项研究成果成功被人工智能领域国际顶级会议——神经信息处理系统大会(NeurIPS)以及人工智能促进会(AAAI)录用。

“基于渐进风格迁移无监督域自适应的多序列肾脏肿瘤分割方法” (One-to-Multiple: A Progressive Style Transfer Unsupervised Domain-Adaptive Framework for Kidney Tumor Segmentation),针对多序列磁共振成像中肾脏和肿瘤分割需逐序详细标注、耗时费力等问题,提出了一种高效的一对多渐进风格迁移无监督域自适应(PSTUDA)框架。该框架通过多级风格字典显式存储每个目标域的风格信息,实现了内容与风格的解耦;同时采用级联风格融合模块结合逐点实例归一化方法,逐步重组内容与风格特征,显著提升了跨模态特征对齐与结构一致性。在两个CT和MRI肾脏及肿瘤数据集上的实验结果表明,PSTUDA的图像生成和分割性能均优于现有方法,同时大幅减少了浮点计算量和模型参数量。该成果被2024年12月在加拿大温哥华举办的NeurIPS会议录用。

PSTUDA算法流程图

“基于多视图掩码对比表征学习的内窥镜视频分析”(Multi-view Masked Contrastive Representation Learning for Endoscopic Video Analysis),针对已有方法缺乏细粒度信息考量导致对像素级预测任务不友好等挑战,提出了一种面向内窥镜视频预训练的多视图掩码对比表征学习(M2CRL)框架,采取多视图掩码策略,对全局和局部视图执行掩码建模,增强内窥镜视频中细粒度表征的捕获。又将多视图掩码建模与对比学习相结合,使模型具备细粒度感知和全局判别力。M2CRL在7个内窥镜视频数据集上开展预训练,并在3个数据集上进行下游任务微调。结果表明,M2CRL在分类、分割和检测任务上均优于现有方法。该成果被2024年12月在加拿大温哥华举办的NeurIPS会议录用。

M²CRL算法流程图

在语义分割任务中,基于知识蒸馏(KD)的方法往往侧重于引导学生在同构架构中模仿教师的知识。为了利用不同归纳偏差架构包含的丰富知识,课题组首次提出从异构角度进行语义分割的通用知识蒸馏方法,命名为 HeteroAKD。为消除特定架构信息影响,将教师和学生中间特征巧妙地投射到了一个对齐的Logits空间中。为利用来自异构架构的丰富知识,提供给学生所需定制化知识,引入了师生知识混合机制(KMM)和师生知识评估机制(KEM)。在三个主流数据集上的广泛实验表明,所提HeteroAKD在促进异构架构蒸馏方面优于最先进的知识蒸馏方法。“基于异构架构知识蒸馏的语义分割方法”(Distilling Knowledge from Heterogeneous Architectures for Semantic Segmentation)将于2025年2月在美国费城召开的AAAI会议录用。

HeteroAKD算法流程图

神经信息处理系统大会(NeurIPS)是全球机器学习、人工智能和计算神经科学领域最具影响力的顶级学术会议之一,与国际机器学习大会(ICML)和国际学习表征会议(ICLR)并列为“机器学习三大顶会”,也是CCF推荐的A类国际学术会议,每年吸引了大量高水平论文投稿。人工智能促进会(AAAI)是人工智能领域的主要国际学术组织之一,AAAI年会是国际顶级人工智能学术会议之一,是CCF推荐A类国际学术会议,在人工智能及自然语言处理领域享有较高学术声誉。

胡凯教授讲课中

胡凯教授是湘潭大学“人工智能”研究团队核心成员,长期从事人工智能、计算机视觉和医学图像分析领域的教学和科研工作,已在国内外高质量学术会议和期刊上公开发表论文80余篇,指导本科生获“第18届挑战杯”黑科技赛道全国特等奖等国家级、省部级学科竞赛奖励30余项,指导研究生获得湖南省优秀硕士学位论文奖2项、研究生校长奖2项,2023年入选“芙蓉学者奖励计划”青年学者,2024年获湖南省生物医学工程“青年人才奖”。

来源:湖南教育发布

相关推荐