侵权投诉
订阅
纠错
加入自媒体

厉害了!NEC宣布开发出“声音状况识别技术”

2016-12-30 09:44
Timeless落尘
关注

近日,NEC宣布开发出“声音状况识别技术”,作为NEC最先进的AI技术群“NEC the WISE” 的技术之一,该技术可根据声音判断事态。

声音具有可跨越障碍物和人群,把握目不可及之处状况的优势,因此很早之前NEC就开始研究声音识别技术。然而,当识别范围很大时,会混入很多环境杂音,因此检测灵敏度和识别精度不高成为一个课题。

本次开发的“声音状况识别技术”将麦克风收集到的目标音与环境杂音分离开,使用从目标音中抽取细小构成音的构成音抽取技术与根据构成音的组合模式判断事件有无的事件判别技术,可以从需要辨别的若干事件中判断正在发生的状况。

NEC通过“声音状况识别技术”可以监测公共设施、旅游景点等地的犯罪和事故,也可以实现对老年人的默默守护,总而言之可以在不同环境下高度感知危险状况。

值得一提的是,此技术在国际声音检测大赛DCASE2016中,在噪声中的日常声音检测类别荣获第一名的好成绩。此外,NEC的验证实验也证实,此技术可以检测5倍于原来检测距离的声音。

背景

近年来,作为安心,安全的举措,在摄像头难以拍摄的地点用声音来判断情况的技术不断开发改进。

原来的技术是通过在不同环境下大量学习目标音,从而实现声音检测。然而,在大范围检测目标音时,因为混入很多环境杂音,对于远处发生的很小的目标音的检测精度下降,需要在各个环境下学习目标音等,因而难以导入未知环境成为课题。

本次开发的“声音状况识别技术”,可以从麦克风收集到的声音中将未知环境杂音分离,可以高精度的监测不受环境影响的构成音,并通过对构成音的组合模式来判断是否有事件发生,从而解决了过去面临的课题。

新技术的优势

1、可高灵敏地检测细小声音的构成音抽取技术

例如,“玻璃碎了”这种情况发生的时候,因环境而异可能会发出“哐当”“啪”“嘭”等声音。而构成音抽取技术则可提前学习麦克风采集的声音,分成“哐”“当”“啪”“嘭”等不受环境影响的更细小的构成音,将不需要学习的声音划入环境杂音,从而在不受环境杂音影响的前提下抽取构成音。

2、可判断发生事件性质的事件判别技术

事件判别技术可以将不受环境影响的构成音“哐”,“当”“啪”以及“嘭”等组合作为新的事件模式提前学习,通过构成音抽取技术高精度地抽取构成音,并进行比对,从而判断是否出现了目标事件。通过这种检测方法,即便是在大范围内也可以在存在各种杂音的环境下高敏感度地检测出微小的声音,且无需逐一学习在不同环境下的目标声音,因此可以轻易导入到未知的环境当中。

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号