交通标志特征提取及分类算法研究(可编辑)
摘要
论文
目:交通标志特征提取及分类算法研究
学科名称:计算机系统结构
研究生:王鹤东
签名:
指导教师:石争浩副教授 签名:
摘要
道路交通标志识别作为智能交通系统一个重要的组成部分,在驾驶安全方面有着重要
作用。近些年,道路交通标志识别问题的研究引起人们关注重视。围绕交通标志识别问题
本文进行了如下工作:
首先针对现有的特征提取方法的不足,提出了一种改进的特征提取方法,即通
过对的
化阶段引进类内均值的方法,改善了特征提取方面的不足。并且在
此基础上进一步提出了改进结合的交通标志特征提取方法,实验证明这种方
法能有效克服传统特征提取的不足,该方法是有效和高效的。
其次提出了一种基于多分类器集成的分类方法,在该方法中采用、神经网络、
基于类中心的欧式距离法三种分类器作为集成分类器的基分类器,投票表决法作为集成规
则。从实验结果可以看出,该方法可以集成各个分类器的优点,抑制它们各自韵缺点,与
已有的单分类器相比该方法有更好的分类效果。
最后设计了一个具有数据采集、特征提取、分类识别功能的原型系统,该系统验证了
本文涉及的算法,具有准确性好,效率高的特点。
关键词:交通标志识别;特征提取;主成分分析;神经网络;多分类器集成西安理工大学硕士学位论文
:
:
:
:
:.,
,
, . :
.’
, ,,
. 也
.
.
,
’.
,
, . , . ., ?
.,
,
, ., .
.
:
; ;;
; 西安理工大学硕士学位论文目录 目 录
:者论
.背景?.
.课题研究动机及意义.
.交通标志分类国内外研究现状及技术难点.
..交通标志分类算法研究现状? ..主要技术难点?
.本文研究内容和章节安排.? ..本文的主要研究内容? ..本文的结构安排
.交通标志识别技术理论基础??。
.交通标志的基本知识.
.交通标志识别系统的基本框架??.
.预处理技术?
.特征提取与选择技术
.交通标志分类识别算法.本章小结交通标志图像的特征提取 .交通标志特征的特点
.线性特征提取?.?..
..
算法的基本原理.
..基于改进的特征提取?
.改进的结合的特征提取
..
判别准则
..经典的线性判别分析方法?.
..改进的结合的交通标志特征提取??.
.本章小结基于多分类器集成的交通标志分类算法研究??. .基于分类方法
.基于神经网络分类方法?:.基于多分类器集成的分类方法..多
分类器集成的基本概念?.
..集成学习研究的基本问题?.
..多分类器集成的系统架构?.西安理工大学硕士学位论文
..分类器设计方法??. ..多分类器集成的主要算法?. .本章小结实验结果及分析? .交通标志图像库介绍
.实验环境和性能指标
.特征提取对比试验?
.交通标志分类算法对比试验 .本章小结系统与实现??.. .系统平台整体框架?
.系统
图?
.系统实现.系统运行环境
.本章小结总结与展望?。 .工作总结.展望?
致谢。
参考文献?
附录..绪论
绪论
本章首先简述了课题的研究背景、研究目的及意义,重点论述了
交通标志识别的国内
外研究现状,最后介绍了本文的主要工作和结构安排。
.背景
随着社会经济和科学技术的发展与进步,当代交通十分发达,道
路交通的地位已经占
据了主导。交通安全和效率问题随之而来并逐渐成了严重的社会问题。然而传统的方法如
修建更多的道路、扩展路网规模已经不能解决现有问题。因此从上世纪八十年代开始,美
国、日本以及欧洲的很多发达国家就先后在智能交通系统 ,
研究方面展开了工作。
智能交通系统主要由智能交通工具、智能道路系统、和驾驶员这三个主体组成。为了
使车辆行驶更加机动和安全,往往通过先进的计算机控制和电子通信技术将这三者结合起
来。在以往,智能交通系统领域的专家普遍认为在智能交通工具能力的提升,驾驶员和智
能交通工具交互的水平,智能交通工具相互间的通信,以及一个基础的智能交通实施等方
面智能交通系统将取得进展。在智能交通工具的研究中,需要考虑一些必要的辅助系统,
例如:道路状况的监控,行驶过程中驾驶员的精神状态监控,以及交通标志的识别等。而
包含道路交通重要信息的交通标志,已经成了智能交通研究的重要对象。道路交通标志识
别
,系统是智能交通系统研究领域中还未解决的困难之一,
也是一个难度很大的实景图像识别问题。对于车载视觉系统,如何能有效地识别出交通标
志是一个具有挑战性的工作。
.课题研究动机及意义
作为道路交通系统中必不可少的一个部分,交通标志在指示方向,提醒司机操作,保
障交通安全方面起着重要作用。在驾驶过程中信息完全是基于视觉处理的,交通标志作为
一种视觉语言,它把一些十分重要的信息实时实地提供给驾驶员、自动或半自动驾驶系统
以及其他智能设备以使他们的驾驶更加安全。它可以帮助驾驶人员获得当前所处条件下的
信息,例如说:禁止驶入、禁止停车、禁止鸣笛、禁止右转、禁止左转、以及危险警告等。
为了便于识别交通标志被设计成特殊的形状和颜色,它所包含的信息对驾驶的安全起
到非常重要的作用。驾驶员在驾驶的过程中的注意力时常会被其它一些事情所干扰,如手
机提示音、路边充斥的广告或者自身的大意,而没有观察到路边的交通标志。设计一个能
自动识别路边的交通标志并为驾驶员提供实时道路信息的交通
标志识别系统,将为驾驶带
来安全与轻松。交通标志自动识别系统在许多领域可以得到应用,例如车辆辅助驾驶系统,
自动驾驶系统等。而且对于不断发展的军事设备,该系统也能对其起到关键的信息提示作
用;稍加改变还可应用在盲人出行的辅助系统里。可见研究交通标志自动识别有很广泛的西安理工大学硕士学位论文
意义。
交通标志识别是使用图像
技术从背景图片中检测出交通标志然后再对其进行分
类识别的研究领域,它的研究结果是辅助驾驶系统中重要的支撑子系统。而驾驶员可以通
过辅助驾驶系统从所处环境里得到当前信息,并根据得到的信息对危险做出预测。这样驾
驶员就能在很大程度上提高驾驶的安全性。
总之,由于许多重要的交通信息都包含在交通标志中,如在驾驶过程中前方路况的改
变、对于速度的限制、驾驶行为的限制等信息。能够实时给驾驶员提供这些信息,对驾驶
员做出及时反应,保证驾驶的安全,避免发生交通事故是有利的,因此对交通标志识别的
研究不但有重要的理论意义而且有很大的实用价值。
.交通标志分类国内外研究现状及技术难点
..交通标志分类算法研究现状
交通标志识别作为智能交通系统重要的技术基础,人们对此进行了大量研究,总的说
来交通标志分类方法可分为下面四种;统计学的分类方法、句法分类法、神经网络分类方
法、集成分类方法,下面加以详细介绍。
、统计分类方法:该方法是以数学上的决策为理论基础,在这种理论上建立统计学
的识别模型。其基本思想是大量对待研究的图像进行统计分析,根据得出的规律性认识,
抽象出能反映图像特点的本质特征来进行识别,并输出识别结果。该方法具有成熟,抗干
扰、噪声等优点。其缺点是抽取复杂模式结构的特征比较困难。这类方法有完善的理论,
也有很多方法,在交通标志识别应用中,等人通过计算标准的交通标志模板与
待识别交通标志图像的欧氏距离,然后根据最近邻原则,即待识别样本的类别属于与其距
离最近的那一类模板来进行分类?,但由于这种方法对克服矢量间的相关性存在困难,
因此分类结果会存在很大偶然性。.等人在待识别交通标志和模
板交通标志之间
引入相对系数,通过计算相对系数来判别待识别交通标志和模板的相似性,即相似系数越
大相似性的概率越大文献【,,】采用的思想与其相同,用相互关系来描述待识别
交通标志与模板交通标志间的相关性。这种分类方法是基于聚类分析的,思想简单、方法
直观、适用于类别复杂的分类,但对于维数较高的交通标志图像,会增大计算量,使它在
交通标志识别的实际应用中受到了限制。与单分类器分类相比较,多层决策树分类有更快
的分类速度和更高的分类精度,而且特征信息可以分解到各层,能简化基分类器设计。因
此,也有许多研究者提出基于多层决策树的分类方法,文献【,】提出基于形状、颜色
和图元的三层决策树分类的方法,树的每个节点均为一个统计分类器,分类器的结构采用
的是高维特征空间的加权距离矩阵,分类器对训练样本进行聚类分析从而得到参数。文献
对彩色交通标志、文献【对黑白交通标志,分类均采用这种分层决策树的方法
来进行,根据交通标志的颜色特征和形状信息进行逐层的分解:
如对于彩色的圆形交通标绪论
志分类,在第一层依据颜色特征可分为红白黑、红蓝、蓝白三类;在第二层可细分红白黑
标志为红自黑禁令标志和红白禁令标志,以此类推即可得出交通标志准确具体的分类。对
于分类器的设计,文献【】采用的是分类器,即采用密度对贝叶斯规
则中未知的条件密度进行估计,而密度函数采用形式。这类基于多层决策
树的分类方法多采用并行结构,可依靠计算机并行算法来实现,能大幅度提高处理速度,
但决策树的优化设计是个难点,当前,基本上依据先验知识,而且如何选择分类器参数也
十分复杂。.等人在多层决策树的思想上,进一步提出了支持向量机分类器的分类
方法,它采用三层决策树的结构,第一层,将背景中其他对象和可能含有交通标志的区域
分开;第二层,根据交通标志的颜色特征和几何形状,将可能含有交通标志的区域进一步
归类;第三层,使用支持向量机识别交通标志的类别。在国内朱金好等人也对这一领
域展开了研究支持向量机是一种针对数据库的优化分类模型,他
基于最小化结构风
险的原理,具有简单的结构、优异的泛化能力等优点,但它只对线性可分的情况适合,并
且处理时间还较长,识别准确率不够高另外,..等人提出通过匹配投影的方法
进行分类,即通过训练阶段离线对测试样本进行匹配投影,从而找到能代表交通标志的一
组基元,这样就可以用这些基元来表示所有的交通标志,即用相应基元的系数向量来描述
每个交通标志。分类过程,对输入的观测图像用这组基元在线进行分类。和模版匹配方法
不同之处是:它不需要将输入的图像与所有模版一一进行比较来找到最佳的匹配,而只需
与组合而成的基元模版进行匹配,因此它的处理速度有很大的提升这类方法有抗干
扰性差,计算量大的缺点。
、神经网络分类方法:目前在交通标志分类算法研究的领域中,研究和应用最多的
一类算法是神经网络分类方法,并取得了很多成果。其优点是可以处理具有复杂环境信息、
模糊背景知识、不明确推理规则的问题。对样本的缺损、畸变有很好的鲁棒性。其缺点是模型在不断丰富完善中。
等人首先将图像尺寸归一化为个像素,然
后把该图像的全部像素作为输入特征,使用感知器网络作为分类器。整个网络取或
层,输入层、输出层和或层隐含层。其输入层节点个数为;输出层节点数为
个,对应种不同的交通标志和一个非交通标志;隐含层选取了或层,分别讨论了节
点数为、/、/三种情况,实验结果表明第三种网络具有最好的分类效果巧。
黎群辉等人提出采用改进概率神经网络进行交通标志图像识别的新方法,这个算法分两步
实现:首先对交通标志图像提取它的不变距作为图像的特征;然后采用改进的概率神经网
络进行识别。仿真实验表明,提出的方法比以前的方法有更好的效果 .选取
交通标志的特征为其规则化的值,采用的分类器为三层感知器网络,输出为四种
情况:速度标志、停止标志、绕道标志及横过标志。隐含层节点数由经验
计算可得,
为输入层节点数和输出层节点数乘积的平方根这类采用多层感知器的分类方法只能
针对简单的分类,并且没有很好的鲁棒性和抗干扰能力。目前三
层前馈神经网络也是
类比较常用的交通标志分类方法?,,文献【.以尺寸归一化后的交通标志包含西安理工大学硕士学位论文
的所有像素作为特征,文献【】交通标志图像的特征选取为模糊化训练集,文献
【.,中交通标志图像选取其不变距作为特征,一般根据经验公式来进行隐含
层节点数的选取。这类分类采用神经网络的方法,因为训练集规模很大,所以收敛速
度不快,而且训练细微的变化,对神经网络也要从新进行训练,更重要的隐含层层数
以及隐含层节点数目不好确定,导致很难有很高的分类精度。.等人提出一种改进
的径向基神经网络分类方法,径向基函数没有采用传统的高斯函数而是采用了线性斜坡函
数,在训练过程中,参考向量是利用聚类算法在特征空间中得到的,而线性斜坡函数的参
数通过类内的最近参考向量与类别间的最近参考向量确定,径向基神经网络的映射
能降低维度,可以很好的提高处理速度,并保证系统的实时性,但它的难点是选择一个合
适的基函数,另外这种网络没有很好的泛化能力。杨修铭等将侦
测到的交通标志机型正则
化处理,如调整图片解析度,去除污点等,将其配合离散余弦转换函数得到特征输入类神
经网络,即可判断正确的答案。其识别成功率在%以上此外,细胞神经网络作为
一种大规模非线性模拟电路能高速、实时并行处理信号,它具备易于的实现、能快
速并行处理信息的特点;也初步在如何应用到交通标志分类领域展开了研究。
、句法分类方法:当目标过于复杂时,仅仅由数值特征构成的特征向量。很难对其
进行全面描述,因为对于目标的结构信息数值特征是无法反映的。而句法模式识别正好能
解决这一问题,它对目标的描述和识别是依靠目标的结构特征来进行的,因此在交通标志
分类领域这种方法也是人们研究点之一。其基本思想是用一个简单的子模式组合来描述一
个模式,对于其中的子模式又可以用一个更简单的子模式来描述,最终得出的结构描述为
树形,我们成底层的最简单的子模式为模式基元。对于基元的选取问题等价于决策理论中
的特征选取问题。一般情况下我们需要的是能对模式的机构关系
有一个紧凑反映的基元,
当然也要易于用非句法的方法抽取。从中我们可以看出,对于单一的基元不包含重要的结
构信息。一个模式要用一系列基元的组合关系进行描述。对于句法识别的构成,即为对鉴
定出的基元进行句法分析的过程,对于给定的模式语句符合某类语法时即被分入该类。这
类方法的优点是识别方便,其过程是从简单基元开始,由简入繁。可以从结构特性上来反
映模式,因此有较强的抗图形畸变能力。其缺点是在存在噪声和干扰的环境下,很难抽取
基元,且易出现误差。.等人基于交通标志几何形状、色彩、基本图元以及其相
互位置建立语义网,通过语义网来对交通标志进行描述,在符号化工作站上使用语
言编程实现。对交通标志分类通过采用证据理论融合的方法进行目前,对怎么样用
计算机表示交通标志的先验知识、结构的分析以及语义的构成、算法的时间效率等方面还
需要进一步研究。
、集成分类方法:为提高识别的准确率,集成以上方法中的几种的思想也被提出,
如.等人提出集成最近邻域和神经网络的方法来对交通标志分类更多的这
类方法可参考以下文献,.这类集成方法的主要的局限性是系统的实时性限制很
高。
绪论
..主要技术难点
综上所述对于实时条件的复杂场景中交通标志识别技术的主要难点在于问题本身的
未知性和针对系统实用性提出的要求,主要体现在以下几点:
.背景复杂。大量人造物体和自然景物存在于背景中形成干扰,如景观树、车辆、
路边的建筑物、宣传牌等;
.由于光源和天气的变化,难以确定标志的颜色。如光照变化、大雾天气、逆光条
件等;
.不确定的标志形状。本来各类型标志无统一的形状,此外还有多个标志相连、标
志牌倾斜、扭曲等情况出现;
.标志的大小很难确定。各类标志没有统一的大小,另外,随着车辆的行进,标志
的大小也在不断的变化;
.获取正面图像十分困难。对于车载拍摄设备,拍摄出的标志图像经常会产生一定
侧角;
.识别准确率要求高。交通标志其的作用是辅助提醒和控制指导,如果不准确容易
造成误导而酿成事故;
.要求较高的实时性。实际的应用中需要给驾驶员或控制设备留出反映和处理的时
间。
上面这些问题正是本文研究提出的主要依据。
.本文研究内容和章节安排
..本文的主要研究内容
本文对交通标志识别算法进行了探讨和研究,提出并实现了几种交通标志特征提取算
法和交通标志分类识别算法,并对它们的识别准确率和识别时间进行了分析。概括起来本
文主要取得了以下几个方面的研究成果:
.提出了一种基于改进的结合的特征提取方法。
在对几种传统方法探究的基础上,提出了基于对引进类内均值然后结合
的特征提取算法,利用进行了仿真,对其性能进行了分析,得出其性能是可靠的。
相关的技术论文:“”被“
”录用发表,检索
.提出了新的交通标志分类识别算法。
通过分析现有的分类识别算法,综合考虑各个算法性能的优缺点,提出了一种基于多
分类器集成的交通标志分类算法,在算法中我们采用多种不同的分类器进行集成,主要思
想是利用每个分类器对交通标志进行分类,然后对所得到的结果进行两种处理,一种是把西安理工大学硕士学位论文
结果进行与运算,一种是对结果进行投票运算。经过对其性能的分析,可以得出我们的算
法是有效和高效的。
.系统实现
本文设计并开发了一个交通标志识别原型系统,开发工具采用 .,通过实际
验证,该系统具有简单,交互性强的特点,该系统也在一定程度上证明了我们提出算法的
有效性和高效性。
..本文的结构安排
本论文主要以交通标志分类算法的研究作为主要内容,共分为章,文章结构以及各
章主要内容组织如下:
第一章,简要介绍课题的背景、研究动机,指出了交通标志识别的研究目标和意义,
并回顾了交通标志识别技术的研究现状,最后给出本文的组织结构。
第二章,详细介绍交通标志识别涉及到的基础理论,主要包括交通标志的基础知识、
交通标志图像的预处理、交通标志的特征提取以及交通标志的分类识别。为后续章节的展
开打下理论基础。
第三章,介绍各种原有的特征提取算法,分析其优缺点,提出了本文的改进算法,对
引进类内均值后结合的特征提取方法。
第四章,依据当前的研究现状验证了几种原有的交通标志识别方法,根据其优缺点,
提出了本文的多种分类器集成的交通标志识别方法。
第五章,针对不同特征提取方法和不同的分类方法给出的不同组合进行了详细的实验
对比,给出了详实的数据分析,从性能上证明本文提出方法的有效性。
第六章,系统实现,设计并实现了一个交通标志识别系统,该系统实现了本文所涉及
的相关的特征提取技术和分类识别技术,并给出了系统框架图、
模块流程图和部分系统界
面截图。
第七章,主要总结本文的研究工作和指出下一步的研究方向。
交通标志识别技术理论基础
交通标志识别技术理论基础
关于交通识别,一方面,是以模式识别理论为基础,另一方面,作为一个具体的识别
对象,交通标志本身有着特殊的性质。如果在交通标志识别中充分利用这些交通标志的特
点,对识别的准确度和速度会有很大的提高。因此,深入理解交通标志的相关知识是有必
要的。在本章中,我们首先对交通标志基本知识加以介绍,接着对交通标志识别的关键技
术展开探讨,并在这个基础上设计交通标志识别框架。
.交通标志的基本知识
目前,对于不同国家交通标志标准是不尽相同的,本文是以我国现行的交通标志标准
为基础。交通标志是通过文字与图像的结合来传递交通信息的标志,通过其显著的色彩和
几何形状起到提示、指示、警告的作用。我国在年首次颁布了交通标志的设置标准
.,于年进一步修订,升级为.。现行的标准即为年修订后,
主要包括指路标志、警告标志、指示标志及道路标志等几类。其中和交通安全相关有三类
交通标志,供给种不含可派生标志。具体分为:个禁令标志、个指示标志及
个警告标志。基本样式如图.、.、.。已有的研究绝大多数是针对这三类标志进
行的。下面我们对交通标志做简明扼要的介绍。
一一一。一?一?一 一一一。一?一一 一一。一一?一。一 一?一一?一?一
一?一?一?一?一。一 一?一?一?一?一。一
攀黢囊
蔫蠢纛麓基蠢 豢拳瓣蠢静攀?静尝牟 抒黛鹫棼肇
图禁止交通标志?
西安亚.大学硕士学位论文
??
??
??
??
??
企?
爨 ?一?一?一?一?一?一? ?一?一?一?一?一?一企 ?一奎一?一?一一?一? ?一?一?一?一?一?一?
蠢翻热爆巷糍瓣辑
爱番鞯嚣 递擞爨豫 撼鸯毂霸
图警告交通标志?
??”?一圈一圈 ?~一圜一圄一日
砖薅摊燕
麓辅警警蒲 雾裁穗辈瓤疑 擎魂耨车鞯熹
图 指示交通标志
?
各类交通标志具有不同的颜色特征,如警告标志为黄色的颜色特征、禁令特征
交通标志识别技术理论基础
标志为红色的颜色特征、指示和指路标志为蓝色的颜色特征等,因此对交通标志的初步分
类可以依据其特征颜色来进行。
交通标志的标准中详细的规定了其轮廓、规格大小和内部包含的数字、字符、几
何图形等。例如警告标志的形状为等边三角形,其顶角朝上;禁令标志与指示标志的形状
为圆形,并且这些图形都具有对称性的特点。
交通标志安装位置通常在道路的右边,距离路边米到.米的位置。
一般情况下交通标志是成对安置的,例如个或个交通标志上下或并排放置在
一起。
.交通标志识别系统的基本框架
作为交通标志识别的重要技术和理论基础,模式识别在交通标志识别中起到举足轻重
的作用。因此从模式识别着手,我们将进行以下分析。
由模式识别的一般理论可知,典型的模式识别系统由数据处理、预处理、特征提
取、分类决策四个部分组成,其框图如下图.:
图?模式识别框图
对于交通标志识别来说,其过程大致与模式识别过程相仿,其中数据采集是在自然
场景下通过车载的摄像头或数码相机拍取交通标志图像,预处理过程包含图像的增强、交
通标志的分割、标准化等过程,接下来对处理后的交通标志进行特征提取,最后根据所选
的分类决策设计分类器进行分类识别,其框架图如下所示图.:
图像采集和预处理两个步骤目的是为了使获得的交通标志便于识别。由于交通标志
识别对实时性的要求,因此要解决交通标志采集和预处理的实时性问题,对于待识别交通
标志其本质的、固有的、能反映它特性的特征要通过特征提取来解决,在这个过程中还要
注意尽可能降低特征的维度以便更好的改进系统的效率。分类阶段采用合适的方法对把已
提取的特征作为输入的交通标志进行分类,得到分类结果。
西安理工大学硕士学位论文
图交通标志识别系统框图.预处理技术
交通标志识别过程中的预处理主要有两个方面,一是背景图像中交通标志的提取;二
是改善分割出来的交通标志图像。二者都对交通标志的准确识别有着重要意义。下面将从
这两个方面加以分析。
交通标志的分割技术主要包含两个方面,彩色空间的选择和分割算法。主要的彩色空
间包括:、、、、等,目前在交通标志识别领域中主要是在、
、彩色空间上进行的。对于这三种彩色空间,在运行时间和分割效率两方面都有
不足,如何找到一个合适的彩色空间依旧是需要研究的问题之一。
现有分割算法大体包括:基于区域的方法、阈值分割法、基于边缘检测的方法、特征
空间聚类法、神经网络的方法、模糊集合的方法。对于实时性要求高的交通标志识别问题,
一般选用阈值法。阈值分割方法的基本思想是根据统计实验设定
一个我们期望的阈值,然
后针对不同的特征维数或不同的彩色空间下的图像实际像素数值与设定值比较,即可得到
所需的区域。
为了方便后期的主成份分析、特征提取等,我们需要对交通标志进行灰度化处理,得
到其一维空间矩阵。另外,在交通标志的采集过程中,由于拍摄角度、拍摄距离等原因,
获得的交通标志图像尺寸、长宽比例是不一致的,这就给我们后期特征的提取和交通标志
的分类识别工作带来了不小的麻烦,因此对于原始交通标志图像要进行统一的尺寸归一化
处理。本文用到的尺寸归一化只是将采集到的交通标志图像都调整到统一的大小,调整大
小的时候是通过一种特定的插补方法来实现的,插补方法包括近邻插补运算、双线性插补
运算、双立方插补运算三种,本文用到的是近邻插补运算,关于插补运算的具体算法细节
这里不做具体介绍。
.特征提取与选择技术
在模式识别中,经常面临一个问题就是怎么样进行特征提取以及如何选择较好的特征
交通标志识别技术理论基础
作为分类器的输入。模式识别的过程是个把样本空间映射到类别空间的过程,因此为了降
低分类器的设计难度,必须选择能全面反映类别本质的特征。所以对于模式识别问题特征
的提取和选择十分重要。
伴随着特征提取技术研究的发展模式识别学科也有了极大的发展,得益于特征提取取
得的理论成果模式分类在很多领域的应用也取得了巨大的成功。特征提取最主要的作用有
两方面,一是为了能使某类模式能最大程度的区别于其他类,而找出这类模式的最有区分
性的描述;二是对某类模式的数据描述进行适当的维数压缩,这一点对原始数据空间维数
较大的模式是十分有意义的。
特征的提取和选择虽然没有固定的标准,但仍有一些指导性原则。我们提取的特征应
当是具备可靠性、可区别性、独立性的低维特征。
对于一个好的特征,应具备以下性质:同类图像内部具有相同性,而不同类图像之间
具有相异性。对于本文的识别对象交通标志一般具有四种特征,几何形状特征、灰度值的
统计特征、代数特征及变换系数特征。虽然各种交通标志特征都能表示和识别图像,但其
反映的图像特性是不同的,因此在识别过程中使用不同的特征性能是不同的。为了使交通
标志识别得到最好的识别效果,我们就需要根据交通标志识别应用的环境和需要选择不同
的特征。
对于交通标志识别问题,识别的对象交通标志拥有较高的维数,我们很难在原始图像
上进行处理,因为这样会大大增加分类算法的复杂度。因此,寻求一个好的交通标志特征
提取方法是交通标志识别中最为基本的问题之一,提取和选择有效的特征是解决问题的关
键。
交通标志特征提取的基本思想是找到一个能反映样本本质的低维特征空间,把原始样
本映射到这一特征空间,得到我们所需的低维特征,这样样本的存储量会明显减少,处理
速度也会提高。特征提取后样本的可分性更好,分类器也更加容易设计。本文将在第三章
会重点介绍图像特征提取和选择方法。
.交通标志分类识别算法
一个完整交通标志的识别系统一般包含三个部分,第一部分是采集和获取交通标志;
第二部分对交通标志图像进行预处理与;最后一部分即为交通标志的识别分类过程。
对于交通标志的分类算法,目前主流技术可分为:统计分类方法、神经网络分类方法、
句法分类方法、集成分类方法等。各种方法的基本思想和优缺点在研究现状里已经给出了
基本的介绍,因此这里就不再加以复述了。
为了进一步提高分类效果,本文将在第四章提出改进的分类算法,并加以详细的介绍。
.本章小结
本章详细阐述了关于交通标志的一些基础知识,并全面和系统的给出了交通标志识西安理工大学硕士学位论文
别的基本原理和其中的关键性技术,提出了交通标志识别的理论框架,为后续各章节工作
的展开奠定了一个很好的基础。交通标志图像的特征提取
交通标志图像的特征提取
上一章介绍了交通标志识别的一些基础理论,在本章中将针对其中的特征提取技术
做出详细的介绍。首先我们将对传统的进行介绍,然后针对传统的的缺点,对
算法进行了改进,最后提出了使用对改进的进行优化,得出最终的交通
标志图像特征提取算法。
.交通标志特征的特点
在对目标分类和识别的过程中,原始数据会产生一组原始的基本特征,这样的原始特
征一般都处在一个高维的空间中,包含很大的数据量,对于分类器原始特征带来的计算负
担是沉重的。但是通常情况下,人们会认为特征获取的越多,会有越好的分类效果,但是
恰恰相反,根据的丑小鸭定理 ‘,过分的编入充分多
冗余特征,会造成两个类别的模式过度相似,分类效果更差。因此,理想的特征应具备以
下优点:
、简约性:可以用很少的能保持原有信息的特征来对目标进行识别。
、可分性:来自同一类的模式特征有良好的相同性,但不同类别模式的特征有良好
的相异性。
、可靠性:提取的特征有一定的抗噪声或其他干扰的能力,即具有良好的鲁棒性
。
只有这样的特征才能简化分类器的设计,从而得到更有效和可靠的分类结果。
为了提高对对象识别的精度和效率,我们需要对特征进行选择和压缩,特征选择经常
面临着选择哪些,放弃哪些特征的抉择,一般情况下我们由多到少来进行尝试。因为在初
期阶段,应尽可能充分利用各种有用信息,所以要尽可能多的保留与分类有关的各种相关
特征,以便提高识别精度。但如果特征保留过多会造成信息的重复和浪费,加大识别复杂
度,因为大量特征中会有许多彼此相关的因素。
特征选择通常分为两部分:一是首先对每个特征进行评价,然后对评价得出的结果进
行排序,选择有最大贡献的那些特征;二是在原有的大量特征上提取出一个新的识别特征
空间,通过把原始样本映射到新的特征空间上得到少量有效特征,这种方法为降维映射。
从根本上来说他们的任务都是从众多特征中找到能够区分不同类别的有效特征,以便达到
降低特征空间维数的目的。通过映射变换得到的特征即为二次特征,这种对原始数据进行
线性或非线性变换从而得到有利于分类、反映本质、低维度的综
合性新特征的过程为特征
提取。这些经过提取和选择的特征即可代替原始的特征对目标进行分类和识别。
作为模式识别中关键问题之一的特征选择和提取方法,对于不同领域的分类识别问
题,所采取的特征提取和选择方法是不同的。某种特征提取方法对一类问题可能很有效,
但对其它问题可能无效,因此采用何种特征提取方法应该根据领域的不同区别对待。一般西安理工大学硕士学位论文
情况下根据使用的不同映射方式我们可以得到线性特征或非线性特征,前者是使用线性映
射的线性特征提取方法而后者是采用非线性映射的非线性特征提取方法。
.线性特征提取
传统的线性特征提取方法有主分量分析 ,、投影
,等。;
寻踪 ,、奇异值分解
方法中,由于在降低维度和特征提取方面的有效性,因此本文将采用基于的特
征提取方法,并对其优点进行保留,缺点进行改进,提出了一种基于引进类内均值的
结合的新的特征提取方法,下面将进行详细的介绍。
..
算法的基本原理
主成分分析法 其目的是在数据空间中找到一组
向量以尽可能地解释数据的方差,从而达到用低维向量保存原有数据中的主要信息,以便
数据容易处理。主要原理就是基于对原始数据机型统计分析,然后利用线性变换对高维数
据进行分析与压缩。由于交通标志的相似性,当把交通标志图像样本进行归一化并抽象成
一个高维向量后,这些图像在高维空间中不是随机或散乱地分布的,而是存在一定的规律。
主成分分析是将分散在一组变量上的信息集中到某几个综合指标上的探索统计分析
方法,以便利用主要成分来描述数据内部的结构,实际上就是起到降低维度的效果。
具体讲,模式就是我们对样本进行转换,得到的那组能表达它们特征的矢量形式
的数据,即”..,。,其中的第均匡,称为该模式的第种特征。一般情况特征的
个数很大,最少也有几百维乃至数千维,因此我们希望能设计一种变换丁,使得模式经
丁变换后可以得到能保持原模式大体的本质信息而维数较少的
新特征。根据以往的经验我
们可以知道根据数据在一个变换空间各维度上方差的分布来选择新特征是可取的。特征
.的协方差越大,就说明模式在第维度上的信息量越大;而对于方差小的特征,则
说明全部的样本在这一维上没有什么区别,所以这样的特征就可以舍弃掉。因此,主成分
分析法在通信理论中也叫.变换就是根据以下的思想提出的:找到一个
可逆线性变换丁,使在均方误差意义下的截断最优,我们把在变换后方差最小的分量
淘汰掉就能实现这一目标。
设为维随机向量其均值为零,变量为维单位向量。于是从上面的基本
思想可知,我们需要找到一个单位向量:使在方向上的投影方差具有稳定的极大值,
此时所指的方向即为特征方向。
详细的求解过程我们将通过下面给出:
在所求单位向量上的投影为: .
则投影么是一个随机变量,其方差可描述为:
交通标志图像的特征提取
.
仃】目丁】.
其中,随机矢量?的相关矩阵为:。
从中可以得出,投影么的方差盯是关于单位矢量的函数,因此可表示为:
.
仃
由于投影彳的方差必须具有稳定的极大值,那么对于单位矢量的一个任意小的变化国,
都应使下式成立:
.
国
经推理即得:
.
国
这证明变量国和一定是正交的,因此允许在的垂直方向上加以改变。
通常单位向量是没有量纲的物理意义,我们引入五作为尺度因子使得式.关
矩阵尺中的元素具有同一量纲。于是,得到国励一兄国,其成立的充要条件是:
.
幻
由公式.,我们可以知道的确定问题可以通过对相关矩阵求解特征值来解决,此时
在所指向的方向上具有最大的投影方差。
为了求解新特征,我们假设的特征值,...丸各不相同,且如?九
则所对应的特征矢量为唯一值,分别标记为”..,。。依据的原理,只需要对小的特
征值对应的特征矢量进行淘汰,保留前,个特征矢量,,...,,。我们将在”..,,上投影
得到的:?,作为新的特征,称这些特征为主成分,即:
,...,, .
反之,由主分量可以重构原始数据,即
.
.
?口,?待,...,
综上所述,主成份是对样本数据集所属的输入空间坐标系做正交变化,使其有最小的西安理工大学硕士学位论文
均方差截断误差,新的坐标值就称为“主成分”。由于在许多情况测试样本集用很少的主
成分足以表达清楚,因此不但用于特征提取、数据统计分析,还能应用于数据降维、
图像处理。
下面我们将简单介绍下算法的计算过程,假设训练样本的维数
为,,类数为三,
每一类样本中的样本个数为?,??札,这类的样本集就可以表示成:
。,:,...,丸,其中;?”,。表示类中的样本个数。因此整个样本集就可以表
示成,,:,...,。则利用计算过程由下面五个步骤完成:
计算训练样本的平均值:
三
.
专善?菇
使用公式.得到的样本均值对整体样本进行标准化:
杉。。? .
计算标准化后的样本的协方差矩阵:
.
??。。
计算协方差矩阵的特征值和特征向量,选择矩阵的符合条件的个最大的
特征值对应的特征向量,表示为彬,,...,,由此我们就可以得到变换矩阵形,形可
以用式子形%%?既‖?“”船来表示。
类中的每一个训练样本向变换矩阵进行投影即可得到我们需要的特征:
.
‖形旷
测试样本为蛐,,首先对测试样本进行标准化,然后对测试样本进行投影,得到测试样本
的所需特征。耐 删
船,形
..基于改进的特征提取
基于的特征提取是统计最优的,它使得压缩前后的均方差最小,且变换后的低
维空间有很好的分辨能力。但的方法有一定的缺陷,首先,作为一种数据的统计方
交通标志图像的特征提取
法,图像中的所有像素被赋予了同等的地位,可是角度、光照、尺寸及扭曲等干扰会导致
识别率的下降。其次交通标志在特征空间的分布近似高斯分布,而且普通交通标志位于均
值附近,而特殊交通标志位于分布边缘,因此越相似的交通标志越难识别。虽然我们提出
的交通标志特征空间抓住了交通标志的统计特性,但好的表达能力不等于好的区分能力。
因此为了提高特征空间的区分能力我们对原有的算法进行了改进,首先为了增加不
同类别样本之间的不同,减小相同样本之间不同,在对样本进行标准化时引进了类内均值。
当经过计算得到特征空间后,为了使分类识别在同一条件下进行,在进行特征投影时,对
所有样本使用整体均值进行标准化,最后把经过标准化的样本投影到所得到的特征空间上
就得到了我们所要求解的特征。改进的计算过程步骤如下
计算样本的类内均值:专仁,,..。
接下来使用类内均值对所有的类训练样本进行标准化:
.
?羌?。,...,?,,...,
计算训练样本的西方差矩阵:
. .
:?
??矿笋‖
?杪/”‖ 。
、
计算协方差矩阵的特征值和特征向量,选择矩阵的符合条件的个最大的特
征值对应的特征向量,表示为形,扛,,...,,由此我们就可以得到变换矩阵矿,矿可
以用式子%%...既】?“”玎来表示。
计算所有训练样本的平均值:
专善善;.
对训练样本使用.得到的均值进行标准化:,?, , ,..., ,?,菇菇一,,...,, ; ?,
将标准化的训练样本在特征空间上进行投影得到所需的训练样本特征:
.
形
;,,..?,。,,..,
将测试样本使用.得到的均值进行标准化,然后将标准化的测试样本在特
征空间上进行投影,得到测试样本特征:
.西安理工大学硕士学位论文
?
..
删‖。
.改进的结合的特征提取
通过上面本文对进行的改进在一定程度上能克服本身固有的缺陷,但是还
不能完全改善的缺陷。技术虽然在均方差意义下对图像的表示是最佳的,但它
所提出的分类信息却不一定是最有效的。却可以找出最有利于分
类的特征投影空间,
充分利用已知的训练样本类别信息来进行更好的分类。下面我们将对进行介绍,并
指出的缺点,以及改进办法,即我们提出的基于改进的结合的特征提取
方法。
标准的以判别准则作为判别函数,所以也称为。它在年由
‘提出,基本思想找到一个向量以使准则取得极大值,这个向量即为最佳投影方
向,经过投影后的样本具有极小类内离散度以及极大类间离散度,这是一种有效的特征提
取方法,因为投影后样本有良好的可分离性。但它有仅适用于两类分类问题的局限性。因
此基于思想的基础,和各自提出了判别矢量集的概念,即用一组判别
矢量构成一个投影子空间,在该子空间上样本可以得到一组投影向量作为最终的特征向
量。该方法被称为经典线性判别分析方法,可以解决多类分类问题。当前图像识别
领域中该方法有广泛的应用,以下将详细介绍判别准则及经典的线性判别分
析方法
..拳另准贝
假设有一组属于两个类的具有维的刀个样本,:,...。?,其中前
面确个样本属
于类缈。,后:个样本属于类:,所有样本都服从同协方差矩阵的高
斯分布。样本的均
值向量为;:
’一 ,,’、
??一
?../..、
丢薹玎磊
样本类内离散度矩阵,和总的样本离散度矩阵。如下: ,
.
,?一聊,,
。 .
样本类别间离散度矩阵瓯如下:
聊?研 .
交通标志图像的特征提取
我们现在想把两个类分开要做的就是找到一个最佳的超平面,则
只需要将所有样本在此超
平面的法线方向上做投影?,:
,... .
,
我们可以得到以个标量。,:,...。?,这门个标量属于的相应集合和,并且和艺有
很好的可分离性。
为了能找投影方向以达到最好的分类效果,定义了一个准则函数:要求选择
的投影方向能使维度降低后的和两类具有最大的类别间距离与类内距离比:
.
?罱警
其中可以用两类均值之间的距离两一来表示类别间距离,用每类样本距其类均值
距离的和表示类内样本间的距离,即为:墨露。
其中瓦为降维后各类样本均值:
,
音薹
墨,是维度降低后每类样本类内离散度,霹为总的类内离散度昂:
, .
墨?一瓦
.
。墨
类别间离散度表示为甄一。但公式.准则函数并非的显函数,因此
不
能据此求解,于是要进行修改准则函数:
,?以,贝:
因为
瓦击荟 去?朋
则
瓦一一
.
聊聊?
’
同样墨江,也能推出和的关系:
西安理工大学硕士学位论文 墨一瓦?聊;
削。?。
.
?,
?.
因此
.
夏夏。
则最终以即可表示为: .
圳%筹‰万
根据.准则函数,要寻找一组投影向量,使山最大化,我们对按 变量求导并使之为零:
甜?‘而万.
逊%铲
则需
.
。计一。
。
则令以兰兄,于是
.
。
这是一个广义特征值问题,若。非奇异,则:
.
。墨
因此可以通过对。~。进行特征值分解,将具有最大特征值的向量
作为最佳投影方向。
在上进行投影就能得到我们要提取的特征向量。 ..经典的 线性判别分析方法
由于准则只能用于解决两类分类问题,而对多类分类问题没有很
好的效果,针
对这一问题提出了判别矢量集的概念,形成了经典的线性判别分
析方法。
交通标志图像的特征提取
指出,对于类问题,则需要一个上面本文介绍的线性判别函数,也 就是需要由一个投影向量组成的投影矩阵?出’,将样本在这个
投影矩阵上进行
投影,从而可以得到一维的特征矢量。针对类问题,则样本的统计
特性需要推广到类
上。
样本的总体均值为:
聊?吉和,
样本类内离散度矩阵:
.
。??,,
:
样本类别间离散度矩阵:
.
。?刀砌。,
将样本空间投影在变换矩阵形上,得到一维特征向量,: .
其中?出‘卜,?。~。投影后的样本统计特性也相应的推广到类: 投影后总样本均值向量:
.
丽寺莩耘瓦
样本的类内离散度矩阵:
瓦??一瓦一瓦 .
巧
样本的类别间离散度矩阵:
瓦?瓦一丽瓦一丽 .
准则也推广到类问题:
.
?量而
为了使准则取得最大值,参考两类分类问题,矿需满足:。
.
若。非奇异,则。,则‖的每一列为的前一个较大特征值对应
的特征向量。
..改进的结合的交通标志特征提取
我们介绍准则,当。非奇异,可以通过对。进行特征值分解,从而求出
最佳的转换空间形,但当用于交通标志特征提取领域,由于转化后图像列向量维数
太大,很大程度上超出了样本数,会造成。奇异,这样就很难用。。来求解最
佳的投影空间。针对这类小样本问题我们提出了改进结合的方法,这样不但
能克服自身的缺点,也能解决计算量大,计算复杂,容易引起累计误差的缺
点。我们首先利用改进的将样本维度降到?维,这样经过降维过程的样本
类内离散度矩阵。可逆。此时可以对经过降维处理的样本直接利用标准的技术
将维数降到一维。算法的具体步骤如下:
对训练样本进行转换,使其成为列向量五,...,。?,对其进行标准化:全部减
去各自的类内均值。计算其类内离散度矩阵。?叔,类间离散度矩阵?出。
计算样本的协方差矩阵墨?叔,对其特征值分解,按照特征值的大小对特征
向量进行降序排列,取前?个特征向量组成×?的投影矩阵形?。
计算样本投影到形一得到投影结果的类内离散度矩阵。...,?卜×肛?和类间
离散度矩阵’??一州肛。:
.
’。阿名。。形名。’。阡,。陟名。
此时因:非奇异,可逆,所以根据基本原理,通过对。:进行特征分
解,可以寻找到最佳的投影空间。
将:卅文得特征向量按特征值的大小降序排列。根据理论:
.
:?。。,
因为瓯的最大秩为一,:..的秩为?,而一般?一,则:。:的秩最大
为一。我们取瓯。:得前一个特征值对应的特征向量组成投影矩阵%?。卜。’。
最后我们将算法和算法特征子空间进行融合,获得.算法的
融合特征空间形?彬出作为最后的投影空间。
将所有样本”矗。?使用全部样本的均值进行标准化,经投影变化全部投影到
矽上,从而为每个样本提取了?个特征得到:,:,...,:?’:交通标志图像的特征提取
.
;吃%置
将测试图像?标准化,同样投影到矽上,提取?个特征得’?’:
.
,’一所‰’‰’
.本章小结
本章首先介绍了交通标志特征的特点,然后介绍了主成分分析法,并详细给
出了如何使用算法进行交通标志的特征提取,但是技术有其自身的缺点,首先
图像中的所以像素被赋予了同等的地位,可是角度、光照、尺寸
及扭曲等干扰会导致识别
率的下降。所以提出了引进类内均值进行样本标准化的改进算法,其次是图像
在均方差意义下的最佳表示,但不一定能提供最有利的分类信息,因此我们又详细描述了
以分类为目的的基于准则的线性判别分析算法,分析了此方法用于交通
标志特征提取时的问题,并针对其问题提出了改进方法,即用改进的结合的
交通标志特征提取方法,即的方法。西安理工大学硕士学位论文
基于多分类器集成的交通标志分类算法研究
基于多分类器集成的交通标志分类算法研究
交通标志分类是本论文的关键工作。在分类算法中,目前主流技术包括:统计分类方
法、神经网络方法、句法分类方法、集成分类方法。在交通标志识别中,目前多采用统计
分类方法或神经网络等前向型神经网络进行分类。在本章中将介绍分类方法和
神经网络分类方法,针对其缺点,将提出基于多分类器集成的交通标志分类算法,作
为最后分类的交通标志分类方法。
.基于分类方法
最近邻分类方法就是对未知的测试样本与每一个训练样本计算其距离,全部距离计算
完毕后,根据决策规则,我们可以把要测试的样本归类于与其距离最小的那个测试样本所
属于的类中。计算两个样本距离的方法有如下几种:欧氏距离、曼哈