摘要:当珊瑚礁的"海底交响乐"遭遇人工解码困境,人工智能为海洋生态监测开辟新航道。传统依赖专家人工标注的声学监测方法,每分钟录音需消耗20分钟分析时间,严重制约全球珊瑚礁健康评估效率。在一项发表于《美国声学学会杂志》的新作中,美国海洋学家们创新性引入视觉识别领域的Y
本文约2530字,阅读约5分钟
引言
当珊瑚礁的"海底交响乐"遭遇人工解码困境,人工智能为海洋生态监测开辟新航道。传统依赖专家人工标注的声学监测方法,每分钟录音需消耗20分钟分析时间,严重制约全球珊瑚礁健康评估效率。在一项发表于《美国声学学会杂志》的新作中,美国海洋学家们创新性引入视觉识别领域的YOLOv5神经网络架构,在美属维尔京群岛珊瑚礁区实现日均12TB声学数据的智能解析,将鱼类叫声检测效率提升25倍,为濒危生态系统的实时监测提供科技利器。
珊瑚礁作为至关重要的海洋生态系统,为众多生物提供了丰富的栖息环境,有力地支撑着广泛而多样的生物种群得以繁衍生息 。然而,由于科学家从水下声景中收集的声学数据量巨大,有效监测珊瑚礁的健康状况往往具有挑战性。
1992年在埃及沙姆沙伊赫(Sharm El Sheikh)的红海一带潜水时所拍摄的鱼群、珊瑚礁。摄影:王敏幹(海湿顾问) ©绿会融媒·“海洋与湿地”(OceanWetlands)
“海洋与湿地”(OceanWetlands)小编注意到,马萨诸塞州伍兹霍尔海洋研究所的Seth McCammon、Nathan Formel、Sierra Jarriel和T. Aran Mooney团队在《美国声学学会杂志》上发表的最新研究提出了一种新颖的方法,即使用卷积神经网络(Convolutional Neural Network,CNN)快速检测珊瑚礁声景中的鱼类叫声,从而实现对珊瑚礁录音中鱼类叫声的自动化检测,大幅度提升检测效率。
珊瑚礁不仅是海洋的"热带雨林",更是生物声学的"活体实验室"。研究表明,健康的珊瑚礁日均产生约1000种可识别声学事件,其中鱼类叫声占比高达60%。这些声音承载着繁殖信号、领地宣示等重要生态信息,但其检测长期依赖人工标注;每分钟录音需耗费专家20分钟分析,形成严重的数据处理瓶颈。
珊瑚礁作为海洋生态系统中的关键组成部分,具有多种重要的生态功能。它不仅是众多海洋生物的“家园”,还为沿岸地区提供保护,抵御波浪的侵蚀。此外,珊瑚礁还参与了全球碳循环,对调节气候变化也起着重要作用。上图是潜水所摄珊瑚礁。©摄影师:赵宇 | 绿会融媒·“海洋与湿地”(OceanWetlands)
此前,声压级(Sound Pressure Level,SPL)等测量声波在水中传播的强度,在水中较密集的介质特性增强了低频传播的传统测量方法,在复杂珊瑚礁环境中表现差强人意。美国国家公园管理局的长期监测显示,仅凭SPL指标来判断珊瑚礁健康状态,从而产生误判的案例占比高达37%。由于鱼类叫声具有显著的种间差异性与环境适应性,单一物理指标难以捕捉其多维特征。
为了加强对珊瑚礁声学事件的检测,McCammon研究团队专门使用了一种传统上用于视觉对象检测的YOLOv5卷积神经网络;通过调整,使其能够从美属维尔京群岛圣约翰附近珊瑚礁收集的三个不同的音频频谱图中高效识别鱼叫声。他们的数据集包括超过55,000条人工标注的鱼叫声,代表了不同的声学类别——“脉冲”(Pulse)、“音调”(Tonal)和“群体”(Chorus)声,以及非生物声音,如船只声和环境噪音。
美属维尔京群岛圣约翰鱼叫声数据集验证集中的人工标注(上)和自动检测(下)的“脉冲”和“音调”鱼叫声示例。其他标签类型的示例:“合唱”、“船”和“其他”在补充材料中显示。从左到右:(1)对多个脉冲信号的高精度检测。(2)CNN未能检测到两个人工标注的脉冲信号。(3)检测器发现了两个人工标注者遗漏的脉冲信号。(4)与人工标注者相比,检测器将脉冲序列中的多个脉冲信号错误地归为一组。
通过对于数据的分析,研究者们在美属维尔京群岛的珊瑚礁中发现鱼类的“脉冲型”叫声在黎明和黄昏时段显著增加,形成明显的生物合唱现象(crepuscular choruses)。这一节律与以往的生物声学研究一致,表明鱼类在日出和日落时最为活跃,可能与觅食和社交行为有关。此外,研究进一步揭示,“音调型”叫声(Tonal)主要集中在150-700Hz低频段,并在夜间达到峰值。这些声音可能与鱼类的繁殖、社交或领地防御行为相关,尤其在某些珊瑚礁区域表现出特殊的“晚间合唱”(nighttime chorus)。
圣约翰礁地图。标注了CL、TK和YA礁的数据用于训练。用训练过的探测器分析了这些礁以及JS和BR礁的数据。
以增强准度为目的,他们特别设计了128×128像素的频谱图输入方式,同步融合了时域包络特征与频域能量分布特征,有效捕获了鱼类叫声的时空特征。此外,他们还开发了多尺度检测机制,尤其针对毫秒级的短时信号进行了优化,最小能够识别仅为12毫秒的脉冲信号。
此外,研究人员还利用了轻量化的多尺度检测头,并融合了时空特征以确保模型能够准确捕捉和识别快速且微弱的信号。值得一提的是,通过改进的训练方法,同步提取时域包络和频域能量特征,以及多尺度融合检测头的设计,模型实现了在±2kHz带宽范围内显著提升的检测精度。
针对高效处理海量数据的需求,McCammon研究团队采用了先进的数据增强技术来提升模型的泛化能力。通过在频谱图上进行时空特征融合,他们有效解决了短时脉冲信号检测的难题。最终实现了在单个GPU上每日可处理高达12TB的数据,这种高效能处理能力显著超过传统的人工标记方法。
这种检测方法不仅以平均为63%的效率高效识别了鱼类叫声,还比此前的实时录音的分析时间缩短了整整25倍,并且在美属维尔京群岛之外的地区进行类似的检测仍然具有一定的稳定效率和准确性,实现了跨礁区的泛化可用能力。尽管珊瑚礁声景非常复杂,但YOLOv5卷积神经网络能够有效地将鱼类的叫声与背景噪音区分开来,即使存在船只噪音等人为干扰也是如此。
开曼群岛坐落在加勒比海西北部,由大开曼、小开曼和开曼布拉克三岛组成,其生物多样性以独特的海洋与陆地生态系统闻名。群岛周边环绕着全球保存最完好的珊瑚礁系统之一,覆盖超过300种珊瑚和700种鱼类,包括濒危的玳瑁海龟、加勒比礁鲨以及色彩斑斓的鹦嘴鱼和神仙鱼。陆地上,大开曼岛独有的蓝岩鬣蜥(Cyclura lewisi)是西印度群岛最大的陆生爬行动物,被列为极危物种;红树林湿地和干旱灌木林中还栖息着特有鸟类如开曼绿鹦鹉和开曼秧鸡。此外,群岛的深海热泉与水下洞穴系统孕育了独特的微生物群落,成为国际海洋研究的焦点。尽管旅游业与气候变化对生态构成压力,开曼群岛通过严格的海洋保护区、物种恢复计划和珊瑚礁再生工程,致力于守护这片“加勒比生态方舟”。©赵宇 | 绿会融媒·“海洋与湿地”(OceanWetlands)
将卷积神经网络整合到生态监测中为快速、准确地追踪珊瑚礁的健康状况提供了有前景的方法,为机器学习在海洋生态学领域的进一步创新应用打开了大门。未来的改进可能集中在扩大数据集和优化检测方法上,这将为监测全球珊瑚礁生态系统提供一种更强大的工具;尽管仍然存在限制,但是这种速度和可扩展性的增强,对于实时生态评估和指导保护工作至关重要,特别是在气候变化和人类活动对珊瑚礁生态系统造成日益严重的威胁的情况之下。
感兴趣的“海洋与湿地”(OceanWetlands)读者可以参看全文:
Seth McCammon, Nathan Formel, Sierra Jarriel, T. Aran Mooney; Rapid detection of fish calls within diverse coral reef soundscapes using a convolutional neural network. J. Acoust. Soc. Am. 1 March 2025; 157 (3): 1665–1683. https://doi.org/10.1121/10.0035829
思考题·拓展思维
Q1,文中提到该技术在特定珊瑚礁环境中取得了显著成果,但考虑到全球珊瑚礁生态系统的多样性和复杂性,这种基于机器学习的鱼鸣声检测技术在应用于其他类型珊瑚礁、不同海洋区域时,是否会面临数据偏差、环境噪声等问题?如何确保该技术在全球范围内的有效性和可靠性?
Q2,我们可以思考一个有关生物多样性监测的深度与广度的问题:上面这个研究利用鱼鸣声作为评估珊瑚礁健康状况的指标,但鱼类发声行为受多种因素影响,如季节、水温、人类活动等。仅依靠声学数据,是否能全面反映珊瑚礁的生物多样性?在未来的研究中,如何将声学监测与其他生态监测手段(如水下摄像、DNA分析)相结合,以更准确地评估珊瑚礁生态系统的健康状况?
Q3,该研究主要依赖于被动声学监测,被动声学监测在长期监测方面具有优势,但缺乏对声源行为的直接控制。主动声学技术(如水下声呐)可以提供更精确的声源定位和行为分析。未来的研究中,如何将主动声学与被动声学相结合,以实现对珊瑚礁鱼类行为和群落动态的更深入理解?
全球环境治理·海湿前瞻
Mainstreaming OceanWetlands
(注:本文仅代表资讯,不代表平台观点。欢迎留言、讨论。)
作者 | 黄希林(Allen Huang)
审核 | Linda
排版 | Samantha
关于作者
黄希林(Allen Huang),毕业于美国雪城大学媒体研究专业,重点关注可持续发展目标(SDG)相关动态,新能源生态发展,以及国际社会减少塑料污染方面的进展。中国生物多样性保护与绿色发展基金会国际部、“海洋与湿地”(OceanWetlands)志愿者。
引
用
本
文
黄希林. AI听觉解码珊瑚礁"声纹密码":神经网络技术实现鱼类叫声精确捕捉. 海洋与湿地. 2025-03-20
海湿资讯·欢迎评论
OceanWetlands
斑海豹©摄影:王敏幹(John MK Wong) | 绿会融媒·“海洋与湿地”(OceanWetlands)
海洋与湿地·小百科
第三届联合国海洋大会
【海洋与湿地·小百科】2025年联合国海洋大会将于2025年6月在法国尼斯举行,由法国和哥斯达黎加共同主办。此次大会的主题是“加速行动,动员各方力量保护和可持续利用海洋”,旨在推动实现联合国可持续发展目标14,即保护和可持续利用海洋资源。会议将汇集各国政府、国际组织、科研机构、非政府组织及私营部门等利益攸关方,共同探讨海洋生物多样性保护、可持续渔业、海洋污染治理、蓝色经济等关键议题。作为大会的特别认证机构,中国生物多样性保护与绿色发展基金会“海洋与湿地”工作组将组建代表团赴法国参会。(封面图:海草床©摄影:王敏幹)
来源:中国绿发会