为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 基于Gabor滤波和纹理分析的票据手写体字符鉴别

基于Gabor滤波和纹理分析的票据手写体字符鉴别

2018-03-24 7页 doc 28KB 15阅读

用户头像

is_842972

暂无简介

举报
基于Gabor滤波和纹理分析的票据手写体字符鉴别基于Gabor滤波和纹理分析的票据手写体字符鉴别 摘 要: 特征提取是模式识别技术中的重要环节, 在图像特征提取方面有很多的算法。利用手写体字符具有的纹理 特征, 在经过必要的预处理操作之后, 通过构造Gabor滤波器对票据手写体字符进行纹理分析, 在获得字符图像的特 征向量之后, 选用支持向量机对结果进行分类。该方法在由六十个人的手写体笔迹样本组成的集合上进行试验, 取 得了很好的识别效果。 关键词: Gabor滤波; 纹理分析; 预处理操作; 支持向量机; 决策机制 中图分类号: TP309 文献标识码: A 文...
基于Gabor滤波和纹理分析的票据手写体字符鉴别
基于Gabor滤波和纹理分析的票据手写体字符鉴别 摘 要: 特征提取是模式识别技术中的重要环节, 在图像特征提取方面有很多的算法。利用手写体字符具有的纹理 特征, 在经过必要的预处理操作之后, 通过构造Gabor滤波器对票据手写体字符进行纹理分析, 在获得字符图像的特 征向量之后, 选用支持向量机对结果进行分类。该方法在由六十个人的手写体笔迹样本组成的集合上进行试验, 取 得了很好的识别效果。 关键词: Gabor滤波; 纹理分析; 预处理操作; 支持向量机; 决策机制 中图分类号: TP309 文献标识码: A 文章编号: 1672- 7800( 2008) 09- 0173- 02 是进行特征提取的对象。将目标区域和背景分割开来, 去除噪 0 音干扰, 对字符作归一化处理, 产生统一纹理等是特征提取前 引言[ 3] 必需的预操作。 手写体字符识别作为光学字符识别OCR的一类, 较印刷体 预处理可以对票据图像进行二值化处理, 设定一个阈值 , 识别研究更有意义: 它可以对书写者的身份进行鉴别、认定, 但 按表达式( 1) 规定的操作将图像变成只有0和1两个灰度值的二 处理的工作量较后者而言, 也增加了很多。本文以金融票据为 值图像。 例, 用Gabor滤波和纹理分析的方法, 对有限字符集中的手写体 进行了特征提取和分类识别。 0, f( x, y) ?T ( 1) ( , ) fxy= "金融票据手写体的研究对象定义在有限字符集上, 可以节 1, f( x, y) >T 约样本训练所需的时间。但书写过程中的不规范因素, 如字符 将二值化后的图像f( x, y) , 如表达 式( 2) 描 述, 分别 在X和 的大小不一致、字符间位置间距不确定等会使得后续的特征提 [ 4] Y方向上做投影操作, 可以得出黑象素的统计直方图。 取和分类的难度加大, 此外, 票据纸张本身的底纹、污点等噪音 信息也会对特征提取造成干扰。 2) ( ( ) ( , )Hx=txy# y 为了增强图像的处理效果, 可 以 将H( x) 和高 斯 函 数G( x) Gabor变换实际上就是对二维图像求卷积, 卷积运算的效做卷积操作, 如表达式( 3) 所示: 率直接决定了Gabor变换的效率。Gabor变换在提取纹理图像的 2 2 - t /!特征向量时相对其它特征提取方法的优势明显, 被广泛应用于 ( 3) H( x) $G( x) = H( x- t) G( t) dt G( t) =e %[ 1] [ 2] 人脸、虹膜、文字等图像识别领域。用Gabor变换方法进行票 在X方向投影统计直方图上, 两个相邻峰之间的间距对应于 据图像的识别, 具体过程可用图1描述。 [ 4] [ 5] 行间的空白, 相邻两个波谷之间的间距对应于一行字的高度。 同样在Y方向直方图上, 可以得出字的宽度和字间间距。票据 的背景纹理一般为等间距、规则性条纹, 在直方图上呈现出周 期性波峰, 因此将背景与目标区分离并不是一件困难的事情。 由于纸张表面污染、印章等原因, 使得扫描后得到的图像 会存在噪音, 成片的噪音还可能会被误认为是汉字点阵。对图 像进行去噪处理, 方法又很多。对于成片的噪音, 需要划定目标 [ 6] 图1 文字图像识别流程 区的边界; 对于随机噪音, 就可以用图像平均法有效地减少。 设含有噪音图像g( x, y) 是由原图像f( x, y) 和噪音图像e( x, y) 叠 1 图像预处理操作加生成的: 票据图像经扫描进入计算机后, 字符点阵所在的目标区域 基金项目: 安徽省高校教师科研项目基金( 2007oq1188[0]) 作者简介: 陈念(1978,), 男, 安徽池州人, 硕士, 池州学院讲师, 研究方向为图像处理与模式识别; 李小新(1976,), 男, 安徽怀宁人, 硕士, 池州学院讲 师, 研究方向为图形图像处理; 徐际宏(1941,), 男, 安徽芜湖人, 安徽师范大学教授, 研究方向为数据计算; 沈佐民( 1957,) , 男, 安徽芜湖 人, 池州学院教授, 研究方向为模式识别。 g( x, y) =f( x, y) +e( x, y) ( 4) , 缩短了特征提取的时间, 减少了数据之间 了特征信息的维数[ 9] 的冗余性 。通过将N幅图像g( x, y) 相加求平均得到一幅图像: i N 1 5) ( ( , ) ( , )gxy= g xy !i 3 实验结果及分析N i=1 随着图像数量N的增加, 在各个位置上象素的噪音影响会 本文通过对60份票据手写体进行实验, 其中40份作为训练 逐步减少。 样本( 图2所示为一个训练用样本) , 20份作为测试样本。Gabor 归一化操作就是根据直方图中获取的字符高度、宽度信息 0 0 0 0 将书写时大小不等的字符统一到一个尺寸。字间、行间的空隙 滤波器中心频率分别采用2、4, 方向参数采用0 、45 、90 、135 , , 在归一化操作中也一并去 对于字符图像识别是没有意义的分别构成一个G( 2×4) 的滤波器组和两个G( 1×4) 的滤波器组。 除。在提取手写体字符图像特征向量之后, 用SVM方法构造最优分 类超平面进行分类识别。表1给出了通过上述方法进行实验之 后的部分数据。2 Gabor 滤波器进行笔迹特征提取 2.1 Gabor 滤波器 Gabor滤波器是一个高斯包络函数所限定的正弦平面波。 Daugman在分析了信号在空间频率和方向上的不确定联系后, 得 Gabor滤波器能达到不确定准则理论下界的结论, 这些结 论出 图2 本文实验用训练样本 [ 7] 。 被广泛应用在纹理分析、数据压缩、边缘检测等领域中不同Gabor 滤波器组的图像识别率 表1 本文选用的Gabor滤波器的数学表达式为: 不同 Gabor 滤波器组的样本识别率 测试样本编号 G( 1×4) f=2 G( 1×4) f=4 G( 2×4) h( x, y) =g( x, y)?cos[ 2!f( xcos"+ysin") ]e( 6) " 1 0.826 0.835 0.856 h( x, y) =g( x, y)?cos[ 2f( xcos"+ysin") ]! o2 0.805 0.816 0.858 表达式( 6) 中h, h分别是奇、偶形式的Gabor滤波器, 式中g eo3 0.775 0.805 0.805 ( x, y) 可表示为: 4 0.768 0.794 0.816 2 2 x +y1 - 5 0.757 0.801 0.815 ( 7) g( x, y) = ?exp $# 2 2 2# 2# !6 0.815 0.843 0.854 上面表达式中f, ", #分别为空间频率、方向和空间常数, 频 7 0.836 0.855 0.869 率f和方向"是Gabor滤波器的两个重要参数。选用不同的频率 8 0.766 0.795 0.812 - p9 0.785 0.828 0.844 m- 1) , $= 2 和不同的方向%=q/n( q=, !尺度f=f$( p=0, 1, % max 10 0.805 0.835 0.858 0, 1, , n- 1) 即可构成滤波器组, 在设定的频率尺度和方向上 [ 4] 提取字符图像的Gabor特征。图像I( x, y) 的Gabor特征可用表 表1所示的实验结果是在采用的Gabor滤波器数目较少的 达式( 8) 所示卷积的形式描述: 前提下得出的, 所以识别率不是很高。但实验结果可以反应出 以下几个方面: 首先, 采用的中心频率f较大时( f=4) , 平均识别 8) ( G( x, y) =I( x, y) *&( x, y, f, %) mn率达到82.07%, 其识别效果要好于f=2时的79.38%; 其次, 多尺 & ( x, y, f, %) 为Gabor 滤 波 器 组 , 卷 积 输 出 为 复 数 形 式 , 复 mnGabor滤波器较单一尺度滤波器而言可以更好地反映字符图 度数量值即为Gabor特征值。 像的特征, 因此可以获得更高的平均识别率83.87%; 另外, 从表 2.2 滤波器选择与特征提取 1可以明显看出不同的测试样本在同一组滤波器下的识别率差 选用数量过多的Gabor滤波器对预处理后的字符图像进行 别也很大, 这就说明, 字符图像自身的质量是影响识别效果的 特征的提取, 不仅会造成向量维数过高、计算量加大、数据冗余 一个关键因素。的可能性变大, 而且在中心频率很小时提取的大尺寸纹理不能 , 因此没有必要选用覆盖整个频率空间 很好地反应笔画的特征[ 8] 的Gabor滤波器组。 对手写体字符的特征提取可以采用m个中心频率尺度和n 4 结束语个方向参数构成Gabor滤波器组。本文选用的中心频率分别为 2、4、8、16, 考虑到Gabor滤波器在频域具有共轭对称性, 方向参 本文以票据中的有限字符集手写体为例, 探讨了用多尺000000数可在0: 180之间选取。本文选取0、45、90、135四个方向参 度、多方向Gabor滤波器进行图像纹理特征提取, 并加以识别的 数, 这样就形成了16个Gabor 滤 波 通 道, 每 一个Gabor 滤 波 器 通 , 既要避免特 方法。中心频率及方向的选择是一个关键的环节[ 5] 。这种局部滤波器 道输出的均值和方差作为纹理图像的特征征数据提取过多带来的计算量、存储容量加大、数据冗余等不 利因素, 也要兼顾到特征数据的完整性, 要有足够的特征量来 DES对称加 要: 分析了考试系统的特点, 然后在数据加密技术的基本原理和要求的基础上, 着重研究了包括摘 密算法、RSA非对称加密算法、数字签名等诸多加密技术。针对远程考试系统数据安全性要求较高的特点, 在系统设 计和实现中采用了多层次的安全技术, 如访问控制、数据加密、数字签名等。 关键词: 数据加密; DES RSA; 数字签名 中图分类号: TP309 文献标识码: A 文章编号: 1672- 7800( 2008) 09- 0175- 03 要有进一步的安全措施——数据加密。 0 引言 1 密码算法综述 基于Internet 的 考 试 是 随 着计 算 机 技 术 的 深 入 和 普 及 , 尤 其是Internet的应用普及而产生的。但是随着计算机及网络技 1.1 密码学术的发展, 计算机安全已是当前社会非常关注的突出问题。而 所谓加密就是利用密码学的方法对信息进行变换, 使得未 数据库系统担负着存储和管理计算机系统中数据信息的任务, 授权者不能识别和理解其真正的含义, 也不能伪造、篡改和破因而, 如何保证和加强数据库的安全性和保密性, 已成为目前 坏数据。 迫切需要解决的热门话题。作为一个良好的考试系统, 如何保 在密码学中, 伪装前的原始信息称为明文( Plaintext) , 伪装 证考试成绩的客观性和公正性尤为重要。因此, 基于Internet的 后信息称为密文 ( Cippertext) , 伪装的过程称为加密( Encryp- 考试系统的安全问题非常值得人们关注。 tion) 。加密在加密密钥( Key) 的控制下进行, 加密和解密组成加 当前, 一般流行的大型数据库系统都提供了许多安全技 密系统。 术, 它基本能够满足一般的数据库应用需求。但考试系统的数 对于每一确定的密钥k=( k, k) , 加密算法将确定一个具体 ed据库安全性不同于其它系统, 尽管在系统功能上设计了不同用 的加密变换, 解密算法将确定一个具体的解密变换, 解密变换 户的使用权限, 也不能保证敏感数据的保密性。例如DBA拥有 是加密变换的逆过程。 最高权限, 可知晓试卷的内容。为了保证考试的公正性, 这就需 ( 1) 加密算法: 在加密密钥k的控制下, 将明文M加密成密 e 法[ J] .电子学报, 2002( 9) . 度, 即兼顾速度和精度的平衡。 [ 6] LEE TS. ImageRepresentationUsing2D GaborWavelets [ J] . IEEE- 参考文献:Transactions on Pattern Analysis and Machine Intelligence, 1996 ( 10) . [ 1] 边肇祺, 张学工.模式识别( 第二版) [ M] .北京: 清华大学出版社, 傅一平, 李志能, 袁丁.基于优化设计Gabor滤波器的边缘提取方 7] [ 2000. 法[ J] .计算机辅助设计与图形学学报, 2004( 4) . 陈传波, 金先级.数字图像处理[ M] .北京: 机械工业出版社, 2004. [ 2] SU YM, WANG JF. A Novel Stroke Extraction Method for Chinese 8] [ HUO Q, GE Y, FENG ZD. High Performance Chinese OCR based [ 3] Characters Using Gabor filters[ J] . Pattern Recognition, 2003( 3) . on Gabor Features, Discriminative Feature Extraction Andmodel Cortes C, Vapnik V N. Support Vector Network[ J] .MachineLearn- [ 9] Training[ A] . Proceeding ICASSP~2001[ C] . 2001: 1517- 152. ing, 1995( 20) . 朱 勇 , 谭 铁 牛 , 王 蕴 红 . 基 于 笔 迹 的 身 份 鉴 别 [ J] . 自 动 化 学 报 , [ 4] 张忻中.汉字识别技术[ M] .北京: 清华大学出版社, 1992. [ 10] 2001( 2) . ( 责任编辑: 赵 峰) 王学文, 丁晓青, 刘长松.基于Gabor变换的高鲁棒汉字识别新方 [ 5] 作者简介: 张春晖( 1971,) , 女, 广东广州人, 华南理工大学计算机学院硕士研究生, 研究方向为计算机软件。
/
本文档为【基于Gabor滤波和纹理分析的票据手写体字符鉴别】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索