为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

几种异常声音的一种实用识别方法

2011-12-03 3页 pdf 101KB 39阅读

用户头像

is_886625

暂无简介

举报
几种异常声音的一种实用识别方法 现 代 电 子 技 术 1999矩 几种异常声音的一种实用识别方法 台下对 “锯”、“磨”等异常声音信号识别中的实验应用 ,进行了可靠性分析 ,证明识别的正确率 在强干扰情况可 达 92 以上 。 关键词 曼堕型 堑 竖 声音识别 A Practical Recognition M ethod of Several AbnormM Acoustics Signals Zhang Haiyong Teaching and Research Section of Communication、Dalian...
几种异常声音的一种实用识别方法
现 代 电 子 技 术 1999矩 几种异常声音的一种实用识别方法 台下对 “锯”、“磨”等异常声音信号识别中的实验应用 ,进行了可靠性 ,证明识别的正确率 在强干扰情况可 达 92 以上 。 关键词 曼堕型 堑 竖 声音识别 A Practical Recognition M ethod of Several AbnormM Acoustics Signals Zhang Haiyong Teaching and Research Section of Communication、Dalian Naval Academy,Da[ian、 11 6018) Abstract Combined with a specific example.the paper describes the method of feature extraction based on the variance of relative parameters of a number of AR models in the use of the recognition of sev— eral abnormal acoustics signals under specific environments,and gives the analysis of reliability. Key words AR model,characteristic parameter,variance,acoustics recognition 1 问题 的提 出 目前 ,语 音识别的研 究越来越受 到人 们的重视 。 随着科 学技 术的高速发展 ,各种语音处理技术 及复 杂的算法都相继出现。然而,在现实生活中,在特 殊 场台 下 ,对几种 异常声 音的识别 找出某 种方便 、快 速、实用的算法并及时报警.这无疑具有很高的实 用价值 和社会 效益 。例如 ,公安系统 ,在重 型犯 人 判决之前 的临时看守所里 ,据有关部门多年 的经 验 和统 计 ,在犯人 出逃之前 ,常 常发 生某 种异常声音 。 如 :“锯 ”的声音——使用在被关押之前藏于 身上的 锯条 锯断窗子的铁棍 ,然后破窗而 出;“磨 ”的声 音 — — 利用 房间内的现有铁器(如窗子的插 销等)磨 成 利器,伺机 刺伤 看守人员破 门而 出;“砸”的声音—— 在犯 人预谋集体 出进之前常相互敲打墙壁 传 递信 息 ,本 文 就 是 在 此 背 景 下 ,针 对 几 种 异 常 声 音 【”锯”、“磨”、。砸”)进 行分析 ,提 出了一种方便 、 快 速 、实用 的 分 析方 法 ,把 它 们从 正常 声 音 (如 “说 话”、“唱歌 ”、无声音 时的 “噪音”)当中快 速 识 别 出来 .并及时报警 这对公安 系统来说 ,不仅能 保障工作人员 的人身安全 ,而且 也极大地提高 了看 守人员 的工作效率 。类似 的特殊声 音识别与报警在 其他领域 ,如保安 、监狱 、甚至商店、银行等 的防 盗等都有 着极其广 阔的应用 前景 。 2 AR模型对声音信号的模拟 对于一个平稳,零均值的时间序列 { ),f一1, 2,⋯Ⅳ,一 定能对它拟台 一个 如下形式的随机差分 方 程 : 五 一 r 1一 纯 2一 ⋯ 一 体 一 : 一 n , 一 ±q 2一 ⋯ 一 n~ 式 中,‘ 是 时 间序列 { }在 f时刻 的元 素 ; ( :l,2,⋯ , )称 为 自回归参 数 ; (,一l,2,⋯ ,m) 称 为滑动 平均参数 ;珥称为残差 。上式称 为 一阶 自回 归 m 阶滑 动平均模 型,记为 ARMA(”,m)模 型。 在上式中,当0r:0时 ,模型 中没有滑动平均部 分 ,称 为 ”阶 自回归 模 型 ,简 称 AR 模 型,记 为 AR( )。其形 式为; 一 一 一 Ⅲ 氅 一 D 要 维普资讯 http://www.cqvip.com 第 l期 张海勇 :几种异 常声 音的一种实用识别方 法 一 三 噼 卜】十 n ,n ~ NID(0, ) 一 1 语 音信 号是 时变 参数 信号 ,但其参数 随时间 的 变化非 常缓 慢 。对 大多数 语音 来说 ,可以合理 地认 为 ,在 10ms~20ms的时间内 ,激励信 号和声道参 数是 保持 不变 的。因此 ,声道可用一短 时线性非 时 变 网络来模拟 。对于大多数语音来说 ,可 以很 好心 用 全极点 ‘AR)模 型来 描述 。虽然有个别 的声 音需 加 入零点 ,即要用 ARMA模型 +但是 ,由于 ARM A 模型可以用高阶 AR模型来近似,所以,多数情况 下 人们就 用 AR模 型来模 拟声道特性 3 特征参数的提取与声音识别 3.1 截取声音信号 敖取来 自声 音信号处理 板 中的离散 声音信号 , 并将其分 成连续的若干个长 度相等的数据段 (M 段 ),其 中每个数 据段 都包含 Ⅳ 个数据 ,构成一组处 理数据 (共 MXN 个 )。在本实 验 中,取 一Ⅳ一 128 若信 号处 理板 的采样 频率 为 11.025 kHz,则 128个采样数据大 约为 l2 ms。 3.2 建 立 AR模 型 建立 AR模 型 ,包括两部分 内容 ,其一是模 型 阶 数 的确定 ,其二是模型参数 的估计 。由于 Burg递 推 算法的计 算速度 比较快 ,而且参数估计 的精度也 比 较高 ,因此 ,采 用 Burg递 推算 法进 行参数估计 。而 模 型阶数的确定 ,则采用最终预 报误 差准则作 为定 阶准则 J。 由于语音信号是时变信号 ,所 以,对 于不 同的 声音信号 、不 同的数据段 ,采用 上述 方法进行 最佳 阶数确定时而得到 的最佳 阶数 可能不 同 而在 本文 的声音信号 分析方法 中 ,要求 每一个数据段选 用相 同 的模 型阶数 (这样要求是合 理的 ,参 见本文 4.1 节的讨论 ),以便后续 的分析与处 理,这样 ,在确 定 最后的模型阶数时,必需兼顾到每一声音信号的不 同数据段 。本 文对 待识别 的几种 特殊声音 (“磨 ”、 “砸”、“锯” 以及 “说话”、“唱 歌”、无 声时的 噪 音”)信号采用上述定 阶方法进行 了大量 的实验 (实 验数据略 )。最后取实验结果 的平均值 ,作 为这种方 法 中每一数据段 的模 型阶数 (”)。 按 照上 述方 法建立 AR模 型 ,得到 一组 处理数 据 (MXN) 的 AR模 型如图 l所 示。 3.3 特征参数 的提 取 由于声音信号是非平稳的,所以,即便是由同 个声音信 号的不 同数据段 而得到 的模 型参数估计 值也 是不一致 的 。显然 ,仅 凭此信 息很 难找 出待识 别 声音信 号的特征 ,然 而 我们可 以考查 由同一个 声音信号 的若干个数据段 而得到 的相应模 型参数估 计值 的变化情 况 ,也 即相应模 型参数 估 计值的波动 大小 。这 ~波动大小也正好反 映 了该 声音信号接近 平 稳的程度 。离散数 据的方差反映 了样 本的波动情 况 。因此 ,我们可 以用方差来描 述上述性 能。即如 图 l所示 ,分别计 算 竹 一 ⋯⋯特, 的方 差 (n为 模 型阶数 ),其 中 一1⋯M 。 数 据段 ( 个) AR模 型的 系数 第 1个数 据段 : 朔 l 2 ⋯ ⋯ . 第 2个 数据 段 : ⋯一·- 第 3个 数据 段 铀 。 ⋯ ⋯ 第 肘 个 数据 段 : 伽 .。 娜 . ⋯⋯ 吼 竹. 的方 差 骨. 的方 差⋯ 竹. 的 方差 图 1 若 干 个 数 据 段 的 AR模 型 的参 数 估 计 值 及各 模 型 相应 参 数估 计值 的方 差计 算示 意 图 由上述方法编写 的程 序,对待识别 的各 种声 音 信号进 行分析 ,通 过大量的实验 (数 据略 ),其结果 是 :由这种分析方法而得到 的 磨”、“锯 ”异常声 音 信 号 的 “方 差” 明显 小 于其 它声 音信 号 的 “方 差”。 因此 ,以这 种 方法 而得 到 的声音 信号 的 “方 差”可作 为识 别的~种特 征参数 。 3.4 声音识 别 根据上述的结果 ,我们仅仅 通过 对上述方 法而 得到 的声 音信 号 的 “方 差”设 置 ~个 闲值 便 可 把 “磨”、“锯”异常声 音信号与其 它声 音信号 区别开来 。 4 实验研究 与讨 论 4.1 M、N、 的讨论 Ⅳ 为每一数 据段 的数据个数 .它 的取值 应考虑 信 号处理板的采样频率 ,Ⅳ 的取值 应 以其所 代 的 声音信号 的长 度 不大于 20 ms为宣 (参 见本文第 2 节 )。 为数据段 的个数 ,它的取值 比较灵 活 ,对结 果影响不大 ,但是 , 越大 ,则处 理时间越 长 为模 型阶数 ,在这种分析方法 中 ,其取值无需 (下 转 第 l2页 ) 维普资讯 http://www.cqvip.com 2 现 代 电 子 技 术 1 999正 End Sub Function myfunctioncx(theta As Double)As Do uble myfuncfioncx = 3 * COS(theta)一 COS(3 * theta) End Function Function myfuncti0ncy(theta As Do uble)As Double myfunctioncy一 3 * sin(theta)一 sin(3 * theta) End Function Function myfunctionjr(theta As Do uble)As Do uble myfunctionjr— Exp(0.2 *theta) End Function )I 图 1 用本程 序编 绘的 函数 图形 读者 只需 建立一 个新 的窗 El(form),根据需要 构造 myfunctioncx(),myfunctioncy()函数或 myfunc— tionjrO函数,进而确定 pole为 0或非 0。选择参数取值范围period及伸缩率r,将程序粘贴到代码的general 部分 ,运 行该程序 之后 ,用 鼠标单击窗 口的任意位置 ,即可看 到所 需图形 出现在 鼠标单击位 置为原点的坐 标系 中,换一个位 置再 次单击 鼠标 ,图形又会出现在新 的坐标 系中 。 如果需 要 ,我 们可以通过在 pset()函数后加上 ,rgb(0,0,255) 等画出各种彩色 曲线 图画 。 3 例 图 1是上述程 序绘制的极坐标函数 : r—e 和参数 方程 函数 : 一 十6)COSt— beos(妇 +6)/b)t Y一 +b)sint— bsin(妇十6)/b)t 叠印在一起 的图形 。 参 考 文 献 1 Robert W Stewart.Visual Basic图形程序 .北 京 :清华 大学 出版社 ,1995 2 东箭工作室 编著 .Visual Basic 5.0中文版程序 设计 .北京 :清华大学 出版社 (上接 第 9页) 太严格 。例 如 ,在对上述 待识别声音信号进行实验 时 ,取 一11, 一9与 =13对结果 几乎 没有影响 。 4.2 可靠性分析 该识 别方 法对 “磨”、“锯 异常声音信号识别 正确率极 高 ,在无强干扰情况下 ,几乎 为 100 ,而 在强 干扰 (如 大声 吵阉等)情况 下,其识 别正确率 也 达 92 以 上 。 该方法 对识别 砸 ”异常声音信号效果不明显 。 4.3 结 论 该方法虽 然是 由对 以上几种 声音信号的研 究而 得到 ,但对其 它的声音 信号也不 失为一 种简捷 、实 用的识别方法 。同 时,也正 象其 它的声音识 别方法 一 样 ,一种方法不 可能解决所有的声音识别 问题 ,因 此 ,解决 该问题 ,通过增加其它 的分 析方法 ,即多 种分 析方法结 合使 用乃是 一种可行 的。例如 ,在 上述 方法 的基 础上 ,结 合微分法便 可把 。砸”异常 声音 信号 与其 它正 常声音信号 (“唱 歌”、“说 话”、 无声 时的 “噪音”)识 别出来。 参 考 文 献 1 肖先赐 .现代谱估计—— 原理 与应用 .哈尔滨 : 哈尔摈 工业 大学 出版社 ,1991 2 胡光锐 .语音处理 与识别 .上海 :上 海科 学与技 术文献 出版社 ,1994 3 杨叔 子 .吴 雅 等著 .时 间 序 列 分 析 的 工 程 应 用 .武汉:华中理工大学出版杜.1991 维普资讯 http://www.cqvip.com
/
本文档为【几种异常声音的一种实用识别方法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索