YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览

360影视 2025-02-05 10:27 1

摘要:众所周知,YOLO系列一直是计算机视觉领域的研究热点。作为其最新力作,YOLO11在2025年无疑将成为各大顶级会议的焦点。原因在于,一方面,YOLO系列的其他版本改进空间已趋于饱和,而YOLO11问世不久,尚有广阔的创新空间。另一方面,YOLO11在保持高准

众所周知,YOLO系列一直是计算机视觉领域的研究热点。作为其最新力作,YOLO11在2025年无疑将成为各大顶级会议的焦点。原因在于,一方面,YOLO系列的其他版本改进空间已趋于饱和,而YOLO11问世不久,尚有广阔的创新空间。另一方面,YOLO11在保持高准确度的同时,计算效率得到了显著提升,尤其在资源受限的环境中表现出色。然而,它也面临着模型复杂度较高、对标注数据质量和数量的依赖等问题,这也为进行学术创新提供了契机。

为让大家能够紧跟领域前沿,小编将分享多篇关于YOLO11改进的论文供大家参考学习。

模型算法下载

Coovally AI Hub模型算法」,即可获取!

YO-CSA-T: A Real-time Badminton Tracking System Utilizing YOLO Based on Contextual and Spatial Attention

题目:YO-CSA-T: A Real-time Badminton Tracking System Utilizing YOLO Based on Contextual and Spatial Attention

论文链接:

摘要

羽毛球拉力机器人在人机竞技中需要毽子的三维轨迹,这就要求毽子具有高精度的实时性能。然而,由于毽子的飞行速度快,加上各种视觉效果,以及容易与环境元素(如球场线和灯光)相融合,给快速准确的二维检测带来了挑战。在本文中,我们首先提出了 YO- CSA 检测网络,该网络通过结合上下文和空间注意机制对 YOLOv8s 模型的骨干、颈部和头部进行优化和重新配置,以增强模型提取和整合全局和局部特征的能力。接下来,我们将检测、预测和补偿三大子任务整合到实时三维毽球轨迹检测系统中。具体来说,我们的系统利用立体视觉将 YO-CSA 提取的二维坐标序列映射到三维空间,然后根据历史信息预测未来的三维坐标,并将其重新投影到左右视图上,以更新二维检测的位置约束。此外,我们的系统还包括一个补偿模块,用于填补缺失的中间帧,确保轨迹更加完整。我们在自己的数据集上进行了大量实验,以评估 YO-CSA 的性能和系统效果。实验结果表明,YO-CSA 的准确率高达 90.43% mAP@0.75,超过了 YOLOv8s 和 YOLO11s。我们的系统性能卓越,在 12 个测试序列中保持了超过 130 fps 的速度。

LW-YOLO11: A Lightweight Arbitrary-Oriented Ship Detection Method Based on Improved YOLO11

题目:LW-YOLO11: A Lightweight Arbitrary-Oriented Ship Detection Method Based on Improved YOLO11

论文链接:

摘要

由于遥感图像分辨率高、成像清晰度差、目标尺寸差异大等问题,面向任意方向的船舶探测已成为一项挑战。现有的大多数船舶探测方法很难同时满足高精度和高速度的要求。因此,我们在 YOLO11 网络中设计了一种轻量级、高效的多尺度特征扩颈模块,以实现对遥感图像中任意方向船舶的高精度检测。首先,利用多尺度扩张注意力有效捕捉遥感图像中船舶的多尺度语义细节。其次,利用跨阶段局部阶段实现遥感图像空间信息与低分辨率船舶特征语义信息的交互。最后,引入 GSConv 模块,最大限度地减少船舶特征语义信息在传输过程中的损失。实验结果表明,所提出的方法具有结构轻巧、精度高的优点,船舶检测性能优于最先进的检测方法。与 YOLO11n 相比,它在 HRSC2016 数据集上提高了 3.1% 的 mAP@0.5 和 3.3% 的 mAP@0.5:0.95,在 MMShip 数据集上提高了 1.9% 的 mAP@0.5 和 1.3% 的 mAP@0.5:0.95。

YOLOV11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS

题目:YOLOV11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS

论文链接:

摘要

本研究对 YOLOv11 进行了架构分析,YOLOv11 是 YOLO(只看一次)系列物体检测模型的最新迭代版本。我们研究了模型的架构创新,包括引入 C3k2(核大小为 2 的交叉阶段部分)块、SPPF(空间金字塔池化--快速)和 C2PSA(具有并行空间注意力的卷积块)等组件,这些组件有助于从多个方面提高模型的性能,如增强特征提取。本文探讨了 YOLOv11 在各种计算机视觉任务中的扩展功能,包括物体检测、实例分割、姿态估计和定向物体检测 (OBB)。我们回顾了该模型在平均精度(mAP)和计算效率方面与其前代产品相比所取得的性能改进,并重点讨论了参数数量与精度之间的权衡。此外,研究还讨论了 YOLOv11 在不同模型尺寸(从纳米到超大型)上的通用性,以满足从边缘设备到高性能计算环境的各种应用需求。我们的研究深入探讨了 YOLOv11 在更广泛的物体检测领域中的地位及其对实时计算机视觉应用的潜在影响。

Integrating YOLO11 and Convolution Block Attention Module for Multi-Season Segmentation of Tree Trunks and Branches in Commercial Apple Orchards

题目:Integrating YOLO11 and Convolution Block Attention Module for Multi-Season Segmentation of Tree Trunks and Branches in Commercial Apple Orchards

论文链接:

摘要

在本研究中,我们将卷积块注意力模块(CBAM)与 YOLO11 架构相结合,开发了一种定制的实例分割模型。该模型在休眠期和冠层期苹果园图像的混合数据集上进行了训练,旨在提高全年不同季节条件下树干和树枝的分割能力。在两个季节收集的混合数据集上训练 YOLO11- CBAM 后,在休眠期和树冠期图像上对模型进行了单独验证。此外,还在开花前、开花期、疏果期和收获期对模型进行了测试。YOLO11x- seg-CBAM 和 YOLO11m-seg-CBAM 的召回率和精确度分别最高。特别是,使用 CBAM 的 YOLO11m-seg 在树干类的训练中显示出最高的精确度(0.83),而不使用 CBAM 的 YOLO11m-seg 在树干类的精确度为 0.80。同样,对于树枝类,使用 CBAM 的 YOLO11m-seg 的精确度最高,达到 0.75,而不使用 CBAM 的 YOLO11m-seg 的精确度为 0.73。在休眠期验证中,YOLO11x-seg 的精确度最高,为 0.91。树冠季验证凸显了 YOLO11s-seg 在所有类别中的卓越精度,树枝精度达到 0.516,树干精度达到 0.64。该建模方法在休眠期和冠层期两个季节的数据集上进行了训练,证明了 YOLO11-CBAM 集成在全年所有季节变化中有效检测和分割树干和树枝的潜力。

YOLOv11 Optimization for Efficient Resource Utilization

题目:YOLOv11 Optimization for Efficient Resource Utilization

论文链接:

摘要

文章研究了YOLOv11的优化,提出了六种针对不同尺寸目标的修改版本,通过剪枝不必要的层和重构主架构来提高计算资源的利用效率。这些修改版本在保持原始YOLOv11准确性的同时,显著降低了模型大小和推理时间,并在某些情况下提高了检测性能。文章还介绍了一个对象分类器程序,该程序可为给定数据集识别最合适的修改版本。我们在各种数据集上对所提出的模型进行了评估,并与原始的 YOLOv11 和 YOLOv8 模型进行了比较。实验结果凸显了计算资源效率的显著提高,提出的模型保持了原始 YOLOv11 的准确性。此外,提出的模型还缩小了模型尺寸,缩短了推理时间。

Evaluating the Evolution of YOLO (You Only Look Once) Models: A Comprehensive Benchmark Study of YOLO11 and Its Predecessors

题目:Evaluating the Evolution of YOLO (You Only Look Once) Models: A Comprehensive Benchmark Study of YOLO11 and Its Predecessors

论文链接:

摘要

本研究对从 YOLOv3 到最新版本的各种 YOLO(只看一次)算法进行了全面的基准分析。这是首次对 YOLO 家族的最新成员 YOLO11 的性能进行全面评估。它对三个不同数据集的性能进行了评估:交通标志(对象尺寸各不相同)、非洲野生动物(对象长宽比各不相同,每张图像至少有一个对象实例)以及船舶和船只(对象尺寸较小,属于单一类别),确保在具有不同挑战的数据集上进行全面评估。为了确保评估的稳健性,我们采用了一套全面的指标,包括精确度、召回率、平均精确度 (mAP)、处理时间、GFLOPs 计数和模型大小。我们的分析强调了每个 YOLO 版本的独特优势和局限性。例如 YOLOv9 的准确率很高,但在检测小物体和效率方面却很吃力;而 YOLOv10 由于架构选择的原因,准确率相对较低,影响了重叠物体检测的性能,但在速度和效率方面却很出色。此外,YOLO11 系列在精确度、速度、计算效率和模型大小方面始终表现出卓越的性能。

YOLO11m 在准确性和效率之间取得了显著的平衡,在交通标志、非洲野生动物和船舶数据集上的 mAP50-95 分数分别为 0.795、0.81 和 0.325,而平均推理时间为 2.4ms,模型大小为 38.8Mb,平均 GFLOPs 约为 67.6。这些结果为工业界和学术界提供了重要启示,有助于为各种应用选择最合适的 YOLO 算法,并为未来的改进提供指导。

若您对YOLO11改进系列文章仍有浓厚兴趣,欢迎大家私信或评论,小编会继续努力帮大家寻找文章,为您探寻更多精彩内容。

来源:小码科普君

相关推荐