近日,第九届国际权威声学场景和事件检测及分类竞赛(Detection and Classification of Acoustic Scenes and Events, DCASE 2023)在其官方网站上公布了比赛结果。西北工业大学航海学院-迅声环境声音感知联合实验室(JLESS)算法团队在竞赛任务4B(基于软标签的声音事件检测)中获得国际第一名的好成绩!这也是学校首次获得该比赛项目第一名。
团队在任务4B中获第一名
本次比赛由西工大航海学院-迅声环境声音感知联合实验室主任陈建峰教授指导,博士研究生白吉生、贾亚飞、张董哲,硕士研究生尹涵、黄思维、杜雨桐参与。此外,团队还在任务2(无监督机器异常声音检测)中获得国际第五名的成绩;在任务3(声音事件检测和定位)中获得国际第六名的成绩。
DCASE竞赛由电气和电子工程师协会(IEEE)声学信号处理技术委员会(AASP)组织,该比赛是音频场景和事件识别领域的权威竞赛。本次竞赛涵盖了智能音频信号处理领域内七项任务,包括声音场景分类、异常声音检测、声音事件检测及定位、声音事件检测、生物事件检测、音频字幕及检索以及拟音合成。
此次竞赛吸引了来自世界各地众多顶尖声学研究机构和企业共123支队伍积极参与。涵盖了清华大学、中国科学技术大学、中国科学院大学、新加坡南洋理工大学、英国萨里大学、美国佐治亚理工学院、卡内基·梅隆大学等多所顶尖高校,同时还包括了业界的佼佼者,如谷歌、META、三星、腾讯、科大讯飞等大型企业。
接下来,让我们一起了解下本次获奖的三项任务。
任务4B:基于软标签的声音事件检测
声音事件检测是指从复杂的声学环境中自动识别和分类特定的声音事件,并给出这些事件实例的时间定位。团队成员提出使用带有注意力和信息交互机制的掩码双分支模型结构,在不使用任何外部数据和预训练模型的情况下,团队提交的4个系统取得了前四名的优异成绩,并在主要指标F1MO分数上远超第五名8.71%。
任务4B示意图
任务2:无监督机器异常声音检测
机器异常声音检测是人工智能领域的重要发展方向。本次任务的难点是训练和测试的机器类型完全不同。针对这一问题,团队成员提出基于机器工作条件的数据生成技术进行无监督异常声音检测,在不使用模型集成和预训练模型的情况下,取得了国际第五名的好成绩。
任务2示意图
任务3:声音事件检测和定位
声音事件检测和定位任务的难点是需要对重叠率较高的声音事件及声源来波方向进行估计,繁杂的任务目标对模型参数量和带标记数据量提出了更高要求。针对上述难点,团队使用了基于CNN和Conformer的网络结构,结合空间数据增强方法,最终获得了国际第六名的好成绩。
任务3示意图
据悉,西工大航海学院-迅声环境声音感知联合实验室(JLESS)成立于2021年9月。实验室算法团队成员已连续6年参与DCASE挑战赛,在历届比赛中多次斩获前三甲,用实力彰显了团队在智能音频技术领域的巨大优势。团队还致力于促进智能音频算法在实际场景中的落地应用,研发的相关空气声呐产品已成功应用于违法鸣笛抓拍、工业设备异常声音诊断等安防、电力、石化及煤炭多个领域。此前,在第七届中国国际“互联网+”大学生创新创业大赛中,团队的“机器听觉——智能空气声呐系统”获得总决赛金奖;在2023年中俄工业创新大赛中国赛区决赛中,团队的“智能空气声呐声音监测系统”获得中国赛区决赛一等奖。(白吉生 尹涵 白婧熠)