摘要:春夏季节是落水事故的高发期,恶劣天气、复杂海况和低能见度环境对搜救工作构成严峻挑战。据统计,2024年仅美国海岸警卫队(USCG)就执行了7,651起搜救任务(SAR),其中前6个月部署了超过1,322架次SAR直升机,突显了海上救援的高需求。为提升复杂环境下
春夏季节是落水事故的高发期,恶劣天气、复杂海况和低能见度环境对搜救工作构成严峻挑战。据统计,2024年仅美国海岸警卫队(USCG)就执行了7,651起搜救任务(SAR),其中前6个月部署了超过1,322架次SAR直升机,突显了海上救援的高需求。为提升复杂环境下的检测鲁棒性,本研究提出基于YOLO的增强训练方法,通过合成数据模拟极端天气(如暴雨、雾霾、夜间)及海浪干扰,优化算法在不同光照和气象条件下的泛化能力。
Enhancing Robustness of Human Detection Algorithms in Maritime SAR through Augmented Aerial Images to Simulate Weather Conditions
论文链接:
一、摘要
YOLO利用CNN对输入图像应用一系列卷积层和池化层,其中卷积层能够提取图像的主要特征。这样,YOLO模型就能学会区分不同的物体,从而大大提高其准确性,并可能通过提高检测准确性来提高合成孔径雷达操作的效率。本文旨在通过评估包含不同海拔高度和地质位置的强大数据集,以及通过模拟不同天气和光照的数据增强,提高模型在海上合成孔径雷达中的人体检测精度。我们观察到,在增强数据集上训练的模型优于未增强数据集的模型,其中人类召回分数从0.891到0.911不等YOLOv5l模型的改进率为3.4%。结果表明,这些模型在不同天气、亮度、色调和对比度的真实世界条件下表现出更强的鲁棒性。
二、引言
在这些错综复杂的水域中,商业船只和游艇的数量不断增加,再加上复杂的沿海环境,突出了在发生海上事件或事故时对全面有效的 SAR(搜索与救援)服务的需求。从2024年1月1日到6月1日,仅美国就报告了超过7,651次搜救任务,拯救了 2,430条生命。此外,传统的救援方法往往受到天气、人员和船只的存在以及漂流情况的限制,可能导致救援任务的延误。由于生还率在最初的18小时内呈指数级下降,因此寻找失踪人员可能被证明是一项行动最重要和最具挑战性的方面。因此,利用深度学习处理无人机(UAV)拍摄的图像,可能会彻底改变搜救行动。
因此,我们的目标是通过创建一个稳健高效的基准来解决这一问题,该基准可以从不同类别的船只、皮划艇和浮标中准确识别和区分人类。
我们的贡献如下:
强大的数据集: 我们开发了一种在不同环境条件下创建稳健数据集的综合方法。通过数据增强过程,我们能够模拟不同的地质地点、天气条件和照明。提高 YOLO 模型的鲁棒性: 我们使用不同的 YOLO 模型,旨在突出 YOLO 模型在使用增强数据集和非增强数据集进行训练时的性能差异。三、相关工作
到目前为止,YOLO模型等深度学习算法已在搜救领域展现出广阔的前景。由于YOLO在分析视觉数据方面很先进,因此适用于监测水生环境中的活动,并在使用航空图像检测水中物体方面显示出了有效性。
Bachir和Memon评估了YOLOv5l在陆地搜救行动中探测人类的性能。在论文中,作者发现YOLOv5l在晴朗阳光条件下识别人类的性能非常出色,达到了很高的召回率和精确率。然而,当人类处于阴影区域时,YOLOv5l的性能就会下降,在使用混合了阴影图像的数据集后,召回率从0.932降至0.893。这一观察结果凸显了YOLOv5l对光照和天气条件的敏感性,表明其在现实SAR场景中常见的挑战性环境中缺乏鲁棒性。
四、Coovally平台助力:从实验到应用一站式打通
如果你也想要使用模型进行训练或改进,Coovally平台满足你的要求!
Coovally平台还整合了国内外开源社区1000+模型算法和各类公开识别数据集,无论是YOLO系列模型还是Transformer系列视觉模型算法,平台全部包含,无论是学术研究中的小规模探索,还是产业项目中的快速落地,Coovally都能大幅提升开发效率,加速成果转化。
为了满足研发与应用需求,Coovally平台即将推出全新能力:
SSH直连Coovally云端算力,无需繁琐配置;全面支持VS Code、Cursor、windsurf等主流开发工具:实现云端代码实时调试与训练;支持YOLO、YOLOE、Transformer类模型自由微调与二次开发;弹性算力资源:根据实验规模灵活扩展,无论是小样本调试还是大规模微调均可应对。平台链接:
如果你想要另外的模型算法和数据集,欢迎后台或评论区留言,我们找到后会第一时间与您分享!
五、方法
数据集
在本研究中,合并了两个公开可用的数据集,其中包括沿海地区、湖泊和海洋等不同水域的航空图像。这两个数据集的所有图像都是使用无人机高空鸟瞰拍摄的。第一个数据集AFO(漂浮物航空数据集)包含水生环境中常见的各种漂浮物图像,如人类和无生命物体,包括船只、冲浪板、帆船和皮划艇。同时,第二个数据集捕捉了人类游泳和漂浮的图像。综合数据集包括 13,282 幅原始航空图像,每幅图像的压缩分辨率为 640 像素。
方法
YOLO与训练图 1:数据集扩充示例
在本研究中,我们使用了四种不同的算法进行训练:YOLOv5s、YOLOv5l、YOLOv10s和YOLOv10l。所有YOLO算法的基本框架都使用边界框、CNN(卷积神经网络)和类概率来一次性进行预测,而YOLOv10则利用非最大抑制(NMS)来去除重复的边界框。此外,小模型和大模型分别在速度和准确性之间进行权衡。该程序首先要获取一个稳健的数据集,其中包含不同天气条件、地质位置、海拔高度和光照的增强图像。然后,按照70-15-15的比例将图像分成训练集、验证集和测试集,以确保对模型进行稳健的评估。在训练过程中,我们确保每个合成增强图像在训练集、验证集或测试集中只出现一次。这样,我们就能成功地分割数据,而不会出现可能导致意外偏差的数据泄漏。然后,我们使用 每次训练使用52个历元和32个批次,学习率为0.01。
评估指标我们能够对模型的结果实现不同的评估指标,即精确度、召回率、F1、mAP@0.5、mAP@0.5-0.95,然后用这些指标来评估模型的性能。我们高度评估了人类和无生命物体的性能,以确保模型适用于在不同环境中检测人类,因为如果没有不同的物体类别或没有人类的图像,模型更容易将无生命物体错误地归类为人类。即便如此,我们的研究还是通过训练过程优化了召回准确率,因为将人误判为无生命物体(如船)可能导致生命损失的后果要比将无生命物体误判为人严重得多。
六、实验结果
使用增强数据集模型训练的YOLO模型(YOLOv5l、YOLOv5s、YOLOv10l、YOLOv10s)的性能使用精确度、召回率、F1分数和平均精确度(mAP)进行评估。表1列出了每个模型的评估指标。
总体而言,我们的YOLO模型在检测人类对象方面非常有效,整体人类召回率在0.86到0.91之间,其中 YOLOv5l 是测试模型中表现最好的,YOLOv5s则是表现最差的。此外,YOLO 模型在召回率和精确度之间取得了很好的平衡,这意味着在识别人类方面具有很高的准确性和完整性。YOLOv5l 的平衡性最好,F1得分为0.94,而YOLOv5s的平衡性最低,F1得分为0.89。另一方面,YOLO模型在检测无生命物体方面也表现出色,召回率从0.85到0.95不等。
如图 2 所示,与基准YOLO模型(未经数据集增强训练)相比,我们的YOLOv10l-AD明显优于其基准模型,人类召回率从0.87提高到0.91。此外,与另一项在非增强型AFO数据集上训练YOLOv5l的研究相比,我们的YOLOv5l在检测人类对象方面的表现优于其基线版本,召回率从0.89提高到0.91。出现这种改进的一个可能原因是,增强型数据集增强了模型对亮度、色调和对比度等图像属性变化的鲁棒性,这可能是它们在处理陌生条件时整体性能提高的原因。
结论
本研究旨在通过增强航空图像来模拟各种天气条件和光照,并结合具有不同地理和海拔特征的不同数据集,从而提高YOLO 模型在海上搜救行动中的性能。我们的研究结果表明,与使用非增强数据集训练的基准YOLO模型相比,使用增强数据集训练的YOLO模型更为出色。具体来说,对于YOLOv5l和YOLOv10l,使用增强数据集提高了人类对象的召回率。我们的YOLOv5l扩增数据集的召回率为0.91,而其基准版本为 0.89;我们的 YOLOv10l扩增数据集的召回率为0.91,而其基准版本为0.87。
未来的研究可以探索整合CycleGAN等先进的生成模型,以增强描述模拟天气条件的增强航空图像的真实感。这些模型善于学习不同天气情况下的映射,生成的图像表现出细微的变化和自然感。通过利用这些技术,我们的目标是增强模型在不可预测的环境设置中保持稳健性能的能力。
来源:小码科普君