摘要:第五届全国人工智能大赛,由鹏城实验室主办,新一代人工智能产业技术创新战略联盟(AITISA)承办,华为技术有限公司、华为云计算技术有限公司、中国移动通信集团有限公司、鹏城实验室科教基金会协办。
第五届全国人工智能大赛,由鹏城实验室主办,新一代人工智能产业技术创新战略联盟(AITISA)承办,华为技术有限公司、华为云计算技术有限公司、中国移动通信集团有限公司、鹏城实验室科教基金会协办。
大赛设200余万元奖金,围绕真实产业难题发布赛题,吸引了来自中国、美国、德国、新加坡等全球10余个国家5346名选手参赛,在“AI+图像编码”、“AI+增强视频质量评价”、“AI+数智创新”三大赛道中产生了一批创新成果。赛后,大赛组委会对获奖团队进行了采访。本期,我们一起看看三等奖团队的参赛分享。
细心研究,大胆探索|“CompressBit”团队
“CompressBit”团队队长陈搏,是电气工程博士,出于对“AI+图像编码”赛道技术领域的兴趣选择独立参赛。他已多次参加全国人工智能大赛,曾在第四届大赛获得“AI+视觉特征编码”赛道冠军的好成绩。
“CompressBit”团队在决赛现场
“在复赛最后几天,大家突然发力、疯狂冲榜,原来实时排行榜前三的团队甚至都被冲击到十几名之外,竞争非常激烈。研究排行榜分布后,我决定使用田忌赛马的策略,短期内放弃PSNR和SSIM指标,但努力把LPIPS和DISTS分数拉到很高,使总名次适当提升。”这个比赛策略,使陈搏得以顺利入围决赛。他继续补充说:“深刻理解大赛规则、比赛任务是获奖的关键,在初赛、复赛期间,我并没有一味追求客观分数,而是重点致力于提高人眼感知质量,最终在决赛取得了不错的MOS评分。”
为了提高开发效率,陈搏在本次比赛中创新性地探索了大模型和Agent工具的使用,保证短时间内能够深入理解赛题、充分开展试验。“这次比赛让我加深了对图像压缩问题的理解,发现可学习图像压缩算法较传统算法在比特率上有明显超越、潜力巨大。”陈搏表示会继续研究,争取为该领域进步做出贡献。
以赛促研,潜力无限|“风调雨顺”团队
“风调雨顺”团队的王阔音是气象领域的一名高级工程师,也是独立参赛。
“风调雨顺”团队在决赛现场
在初赛快结束时,王阔音才决定投入更多精力深入探索“AI+图像编码”赛道,因为时间紧张,那几天他几乎通宵加班。经过对模型参数的不断调试、持续优化压缩效果,最终在最后一刻完成了作品提交。他说:“虽然过程很累,但看到结果达到预期、成功晋级复赛时,真的非常激。这段经历让我深刻体会到坚持和专注的力量,也让我更加相信自己的技术能力。单人参赛虽然压力大,但也锻炼了我的独立思考和解决问题的能力。”
王阔音的研究方向是气象卫星与雷达数据压缩应用,他表示,本次大赛让他更深入掌握了图像压缩核心技术,对他的研究具有重要价值。他期待压缩算法在保障质量的前提下进一步提升效率,尤其看好深度学习在该领域的潜力,相信其在复杂数据处理和高压缩需求场景中必将超越传统方法,推动行业迈向更高水平。
志同道合,灵活迁移|“不知道叫啥”团队
不同于前两个团队的孤军奋战,“不知道叫啥”团队,由4名志同道合、热爱AI与编码的小伙伴组成。他们在科技园机缘巧合下认识,相互学习、分享技术。大家都密切关注端到端图像与视频压缩的前沿发展,留意到“AI+图像编码”赛道并投入研究,希望能够让AI改变生活。
“不知道叫啥”团队代表在决赛现场
“我们能获奖的关键主要是成员们齐心协力,思维都比较开放,愿意积极探讨。”团队队长宋杰强调,团队参赛时应该尽可能发挥每个成员的能力,让效率最大化,避免交叉冗余。要通过合理的安排,让大家在有限的时间里尽可能多地做尝试和实验。
宋杰还表示,打比赛一定要有灵活迁移的能力。了解工业界、学术界的最新方法后,要结合赛题任务不断思考,多考虑多尝试其它方向的方法。迁移过来,也许就能有奇效。他举例说:“面对低复杂度的要求,要不断压缩模型性能。为了在满足复杂度的情况下包保持压缩性能,我们团队尝试了很多方法,最终是在超分领域相关的文章中受到启发,最终解决了问题。”
临危不乱,以赛促学|“最是人间留不住”团队
“最是人间留不住”团队获得了“AI+图像编码”赛道优胜奖。该团队是由西安电子科技大学、华东交通大学组成的高校联队。成员学科背景多样、知识结构互补,具备良好的科研素养与实践能力。
“最是人间留不住”团队在决赛现场
“打比赛要目标清晰、分工明确、快速迭代,不仅要完成赛项任务,更要在效果和工程实现之间找到最优平衡。”团队队长聂佳睿分享说:“一定要临危不乱、快速调整!”比赛时,他们发现原模型在新测试数据上的表现很糟糕。时间紧迫,紧急讨论后,我们果断决定推翻原有方案并重构模型。经过连续几天的高强度调整,终于在提交截止前做出了效果更好、运行更快的版本。”这段独特经历,也让他们真正体会到了团队协作和技术应变的力量。
聂佳睿说:“通过比赛,我不仅加深了对图像编码技术和人工智能融合应用的理解,也切实提高了自己在模型设计、数据处理和工程实现方面的能力。以往在课堂上学习的图像处理和深度学习知识,大多停留在理论层面,而这次比赛让我有机会将它们应用到实际项目中,从数据预处理到模型训练,再到性能评估与优化,每一个环节都让我感受到技术与实际需求之间的紧密联系。”
理性备赛,深度思考|“ABS-AITeam”团队
“ABS-AITeam”团队参加了“AI+增强视频质量评价”赛道并获得三等奖。团队成员来自国家广播电视总局广播电视科学研究院和中国传媒大学,主要开展视频质量评价关键技术研究,具备扎实的理论基础与丰富的实践经验。
“ABS-AITeam”团队代表在答辩现场
谈及比赛经验,团队队长刘庆同说:“我们团队采用理论建模、数据优化、算法迭代的技术攻关策略。在模型架构设计阶段,通过构建多尺度时空注意力机制,有效融合视频的局部细节与全局语义特征。针对训练数据不足的挑战,基于数据特性进行旋转、压缩、超分等数据增强方法扩充训练样本。”
刘庆同还分享了他对技术的发展思考:“本次参赛,推动了我们团队在视觉感知建模领域的理论突破。从技术发展角度看,视频质量评价正呈现三个趋势:(1)从全参考向无参考范式演进;(2)评价指标与编码标准的深度融合;(3)个性化QoE预测成为新方向。期待未来能建立开放动态的基准平台,支持基于用户行为反馈的评价模型持续进化,推动5G+8K时代超高清视频技术的标准化进程。”
剖析任务,持续领先|“CMIT001”团队
“CMIT001”团队来自中移(动)信息技术有限公司智能交互数字人研发团队。他们人员结构合理,技术能力全面,全面掌握了产品设计、架构规划、AI算法研发等全流程的研发能力。
“CMIT001”团队代表在答辩现场
该团队在“AI+数智创新”赛道的“AI+数智人能力及客服应用”赛题中获得三等奖。团队成员符殷铭说:“我们团队的策略是尽可能地提高赛题中的客观分数部分,着重优化渲染生成图像的人脸相似度、声音复刻模块的生成速度等关键指标。”符殷铭继续补充道:“我们在初赛阶段就保持了较高的实时榜单分数,说明我们的策略是成功的。”
符殷铭对大赛赛道设置评价很高,他说:“本赛道赛题对于AIGC技术在3D数字人生产管线的生产应用具有很高的价值,相当于是对自动化生成3D数字人的Demo应用开发,也是对AIGC技术在3D数字人生产应用的可行性探索。”
双线作战,一举智胜|“MediaAILab”团队
“MediaAILab”团队非常特别,在队长薛子育的带领下,同时参加了“AI+增强视频质量评价”和“AI+数智创新”赛道的“AI+数智空间”赛题,均获得三等奖。
“MediaAILab”团队由国家广播电视总局广播电视科学研究院、南开大学、中国传媒大学组成,专注于广播电视和网络视听领域人工智能关键技术的研究与应用,根据赛项的不同调整队伍成员组成与分工。
“MediaAILab”团队代表在答辩现场
双线作战避免不了时间的紧张,队长薛子育坦言,时间管理是最大的挑战。“尤其是在决赛阶段,需要在有限的时间内完成功能实现、优化和答辩准备。我们通过细化任务清单、每日进度复盘来提高效率,同时合理分配精力,避免过度消耗。尤为关键的是,保持冷静的心态,以应对突发问题。”薛子育说:“当然,也会造成一些遗憾。比如AI+增强视频质量赛道,未能尝试更优的解决方案;AI+数智空间赛题中,团队语义分割引导的纹理生成模块未能充分优化。面对时间不足,只能做出妥协和选择。”
薛子育表示本次比赛对他的学习和工作都有很大帮助,不仅提升了技术实践能力,还锻炼了团队协作和抗压能力。“更重要的是,这次比赛彻底刷新了我对三维数字化的认知!”他继续补充说:“参加数智空间赛题,让我不仅掌握了神经辐射场(NeRF)、高斯泼溅(Gaussian Splatting)等前沿技术,还惊喜得发现三维重建正从‘几何还原’转向‘语义理解’。”
智胜之后:创新永不落幕
第五届人工智能大赛,既是一场技术比拼的盛会,也是一个观察当代青年技术人才的独特窗口。从独立攻关的孤勇者到多学科融合的联合团队,从传统算法突破到生成式AI的深度探索,从实验室理论推演到产业痛点的精准破解——这些获奖团队的故事,无不体现着锐意创新与坚持不懈。
现场决赛选手合影留念
拼搏向前过、全力以赴过,获得什么奖项已不是最重要的,毕竟参与大赛的经历本身就是一份特别的礼物。期待所有大赛选手,用数据与代码编织智能时代的经纬线,为中国人工智能技术发展与创新继续前行!
来源:科技新知讯