为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 防录音回放功能的语音识别软件的设计与实现.doc

防录音回放功能的语音识别软件的设计与实现.doc

2017-09-25 5页 doc 17KB 22阅读

用户头像

is_014457

暂无简介

举报
防录音回放功能的语音识别软件的设计与实现.doc防录音回放功能的语音识别软件的设计与实现.doc 防录音回放功能的语音识别软件的设计与实现----录音艺术论文 -->第一章绪论 1.1研究背景及意义 说话人识别任务根据识别方式的不同,可分为三类[3]:(1)说话人辨认(SpeakerIdentification),是指从给定用户集中把测试语音所属的说话人区分出来;(2)说话人确认(SpeakerVerification),是针对单个用户,即通过用户测试语音来判断其是否是所声称的用户身份;(3)说话人探测跟踪(SpeakerSegmentationandCluster...
防录音回放功能的语音识别软件的设计与实现.doc
防录音回放功能的语音识别软件的与实现.doc 防录音回放功能的语音识别软件的设计与实现----录音艺术论文 -->第一章绪论 1.1研究背景及意义 说话人识别任务根据识别方式的不同,可分为三类[3]:(1)说话人辨认(SpeakerIdentification),是指从给定用户集中把测试语音所属的说话人区分出来;(2)说话人确认(SpeakerVerification),是针对单个用户,即通过用户测试语音来判断其是否是所声称的用户身份;(3)说话人探测跟踪(SpeakerSegmentationandClustering),是指对一段包含多个说话人的语音,正确标注在这段语音中说话人切换的时刻。前两个问题在某种程度上是相通的,即如果把说话人确认问题看做是一个两类的说话人识别问题,则基本算法是一致的。在进行说话人识别时,按被输入的识别测试语音的内容来分,说话人识别一般分为[4~5]:(1)文本无关(Text-Independent),不规定说话内容的说话人识别(识别时不限定所用的语音的语句内容);(2)与文本有关(Text-Dependent),规定内容的说话人识别(只能用规定内容的语句进行识别)。在现代社会中,结合计算机(puter)、自动控制(Control)、通信(munication)、图像显示(CRT)等“4C”技术的门禁考勤、司法侦查、远程身份认证等领域的应用越来越普遍,如:金融机构出入安全认真、企业出入考勤、司法调查监控语音、远程身份确认等。将说话人识别技术运用到这些领域具有以下的优势[3]:(1)说话人识别有着天然的优点:以声音作为识别特征,因其非接触性和自然性,用户容易接受。(2)说话人识别所用设备的成本低。对语音输入设备麦克风等没有特殊要求;声音的采样和量化对芯片的要求也不高;特征提取、模型训练和匹配等算法也便于实现。(3)其他生物识别技术较之说话人识别各有劣势。指纹、掌纹、手掌静脉等的识别需要手指接触传感器,存在卫生问题;虹膜、视网膜识别技术精确度高,但设备昂贵,同时需要把眼睛凑到传感器上;DNA验证技术准确率极高却最昂贵最花时间;笔迹、步法等识别则可靠性低,用户使用感觉差。因此,说话人识别的优势更加明显。然而,说话人识别也面临着伪造语音攻击的问题。伪造语音主要来自以下几方面。(1)来自于其他说话人的刻意模仿(如口技等技艺)。(2)来自于录音设备(录音笔、MP3播放器、PDA等)的录音回放,即在某种场合时录下说话人的声音,并通过回放录音文件来攻击说话人识别系统。(3)现代的语音合成技术合成的逼真的语音。可以说,这些伪装、伪造语音是说话人识别的一大 克星,如果系统不具有防伪性,那么说话人识别在实际应用中将变得毫无意义。而这么多种伪造语音中,录音设备获取的伪造语音最为简单直接最为普遍,因此,开发具有防录音回放的说话人识别系统具有重大的实用意义。 1.2说话人识别以及针对防假冒攻击的研究现状 1.2.1说话人识别研究的现状 1.研究历史 1966年,美国法院第一次采用人耳听辨的方法进行了取证。Bell实验室的S.Pruzansky提出的基于模板匹配和统计方差分析的说话人识别方法,引起信号处理领域许多学者的注意,掀起了说话人识别研究的一个高潮。其间的工作主要集中在各种识别参数的提取、选择和实验上,包括从声学角度,对反映语音特征的物理参数的提取方法进行研究,最早使用的特征有谱包络系数、基音轮廓、线性预测系数等。1969年LuckJE首先将倒谱技术用于说话人的识别,得到了较好的结果,BSAtal将线性预测倒谱系数LPCC用于说话识别,提高了识别系统的精度。Doddington提出利用共振峰进行说话人确认,1972年Atal用基频轮廓进行识别。将数字信号处理技术应用到语音信号处理上,人们提取了间接反映语音特征的参数,如LPC谱系数、LSP谱系数、部分相关系数。从20世纪70年代末至80年代末,声纹识别的研究重点转向对各种声学参数的线性或非线性处理上,StevenB.Davis最早提出了美尔倒谱系数(MFCC)的概念。MFCC由于考虑到了人耳的听觉感知机理,具有较好的识别效果和噪声鲁棒性,因此成了语音识别中使用的主流参数[3]。 第一章绪论...........1 1.1研究背景及意义...........1 1.2说话人识别以及针对防假冒攻击的研究现状.........3 1.3论文的主要工作以及章节安排.................5 第三章说话人原始语音以及回放语音数据库的建设.................19 3.1说话人识别语音库以及回放语音库的简介...............19 3.2说话人原始语音以及回放语音库建设............ .....21 3.3本章.................27 第四章具有防录音回放攻击功能说话人识别系统设计与实现...........28 4.1系统总体结构设计.................28 4.2特征提取模块的设计实现...........30 4.3模型训练模块的设计实现......... .......37 4.4测试识别模块的设计实现...........47 4.5本章小结................. ..54 第五章系统性能评估...............55 5.1运行效率测试................. ......55 5.2测试识别效果的评估......................58 5.3系统拓展.....................61 5.4本章小结...........................63 结论 生物特征用于身份识别认证正慢慢的成为潮流。其具有个体上的独特唯一性,群体上的普遍存在性,给身份识别提供了更高的安全性。语言作为人类相当普遍的能力,个体间的差异性同样显著,每个人的发声器官不同造就了每个人独特唯一的语音。同时语音还兼具长期稳定、收集设备简易低成本、用户易接受等优势,因此,语音作为身份识别的主要特征或者辅助特征将成为一种趋势—说话人识别的应用将越来越普遍。 但与此同时,说话人识别面临着仿冒语音的攻击,其中最普遍最简单易行的就是通过录音设备偷录说话人的语音并回放,尤其是在现代录音产品录音性能愈加优秀且价格不高的背景下,录音回放攻击说话人识别系统更加容易。因此,如何让说话人识别系统具备防录音回放的功能成为语音研究的一大要务。本文针对这一课题开展了以下工作。1.根据实际的研究需要,本文开展了原始语音以及回放语音库的建设工作。首先设计了科学合理的语料,包括了短词、短句、长段三类语音,语料内容的字、音节、因素合理分布,符合人们日常用语的习惯。实际中的语音库包含了原始语音、录制语音、回放 -->语音三大子库,为研究提供了丰富多样的数据。录音人数达到35人,性别比例合理,每人进行了两次录音,每次录音每个录音人产生92个语音。该语音库的建设为研究、实验打下了坚实基础。 2.本文提出了一种防录音回放的方法——通过识别信道模式噪声来区分原始语音以及原始语音。提出了采用长时统计帧作为信道模式噪声的表征,并提出了基于SVM的信道模式噪声识别方法。 3.本文设计并实现了离线的具有防录音回放功能的说话人识别系统。在系统的总体框架方面,主要有特征提取模块、模型训练模块以及测试识别模块,进一步构建了具备通用性质的语音特征库以及识别模型库,使得各模块既相互独立又相融相通。系统的实现是通过MFC/C++编程技术实现的,预留了重用性强的函数接口,提供了可视化的操作简便的界面,为研究实验提供了极大的方便。 4.本文的还对所建系统进行了全面的性能评估,包括运行、运算效率以及识别效果的评估。在运行、运算效率的评估中,在CPU以及内存资源消耗较小且稳定的前提下,主要进行了耗时测试,以为后续在线系统的构建提供重要参考;在识别效果的评结论65估中,分别测试了单独的说话人辨认、单独的回放语音识别以及两者融合的防回放说话人辨认,均取得了优异的识别效果,证明了防回放研究的实际应用意义以及可行性。最终在评估结果的基础上,在基于GMM-UBM的说话人确认系统中搭载防回放模块并证明能满足实际应用的需求。 当然,说话人识别防回放的研究仍然存在进一步拓展的需要。1.本文采用的回放语音的录制来自于单一的录音设备,接下来的工作应该是进一步加强语音库的建设,增加更多来自不同录音设备的回放语音,以此来测试防回放算法的适用性,同时也将使相关研究更全面也更深入。2.在离线系统提供了真实可靠的实验数据作为参考的前提下,可以向在线系统的构建进发。这将对系统的效率、人际交互等方面工作提出更高的要求。
/
本文档为【防录音回放功能的语音识别软件的设计与实现.doc】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索