基于对比敏感度和马尔可夫链的注意信息提取算法
基于对比敏感度和马尔可夫链
的注意信息提取算法
张孝临1,2,赵宏伟1,2,王 慧1,2,戴金波1,2,3
(1吉林大学计算机科学与技术学院,吉林长春 130012;
2吉林大学符号计算与知识工程教育部重点实验室,吉林长春 130012;
3长春师范学院计算机科学与技术学院,吉林长春 130032)
摘 要: 借鉴生理学的研究成果,提出了一种新的基于对比敏感度和马尔可夫链的视觉注意信息提取算法.在
注意特征向量提取之前,先用与离心率有关的对比敏感度函数对输入的图像进行加权,用以模拟视网膜神经节的反应
机制;在特征...
基于对比敏感度和马尔可夫链
的注意信息提取算法
张孝临1,2,赵宏伟1,2,王 慧1,2,戴金波1,2,3
(1吉林大学计算机科学与技术学院,吉林长春 130012;
2吉林大学符号计算与知识工程教育部重点实验室,吉林长春 130012;
3长春师范学院计算机科学与技术学院,吉林长春 130032)
摘 要: 借鉴生理学的研究成果,提出了一种新的基于对比敏感度和马尔可夫链的视觉注意信息提取算法.在
注意特征向量提取之前,先用与离心率有关的对比敏感度函数对输入的图像进行加权,用以模拟视网膜神经节的反应
机制;在特征向量上定义马尔可夫链,用它的平稳分布做为活动图上的显著度.算法的平均计算时间和以神经生物学
家的研究成果为标准计算的接受者操作特性曲线下面积证明了算法的有效性.
关键词: 视觉注意;视觉显著性;对比敏感度;马尔可夫链
中图分类号: TP391 文献标识码: A 文章编号: 03722112(2010)2A21305
ExtractingAttentionInformationAlgorithmBasedon
ContrastSensitivityandMarkovChain
ZHANGXiaolin1,2,ZHAOHongwei1,2,WANGHui1,2,DAIJinbo1,2,3
(1CollegeofComputerScienceandTechnology,JilinUniversity,Changchun130012,China;
2KeyLaboratoryofSymbolicComputationandKnowledgeEngineeringofMinistryofEducation,JilinUniversity,Changchun130012,China;
3CollegeofComputerScienceandTechnology,ChangchunNormalUniversity,Changchun130032,China)
Abstract: Inspiredbytheresearchinphysiology,anovelalgorithmforextractingbottomupattentioninformation(integra
tionofcontrastsensitivityandMarkovchain,ACSMC)isproposedinthispaper.Inouralgorithm,theoriginalimageisweighted
withacontrastsensitivityformulawhichisafunctionretinaleccentricitytosimulatethemechanismofretinalganglion.AMarkov
chainisdefinedonfeaturemaps.Theequilibriumdistributionofthischainistakenassaliencyvalues.Theaverageofalgorithmcost
timeandareaunderreceiveroperatingcharacteristiccurve(AUROC)basedontheresearchofneurobiologistdemonstrateitseffec
tiveness.
Keywords: visualattention;visualsaliency;contrastsensitivity;Markovchain
1 引言
视觉注意可以把系统中有限的处理资源优先分配
给少数几个显著的视觉区域上.视觉注意的分配算法对
智能模拟、图像压缩和目标识别等多个领域都具有重要
意义,近几年来,已成为一个热点课题.
目前视觉注意模型在提取自底向上的视觉信息时
大体上可以分为特征向量提取(extraction)、活动图形成
(activation)和整合(combination)三个步骤.目前大多数视
觉注意计算模型在提取特征向量时均采用基于生物学
的研究成果的多通道多尺度滤波器组对图像进行滤波
的方法[1~6].在特征提取之后,一些学者用中央—外围
算子[1~5]来模拟细胞的感受野特性从而获得局部显著
性,也有一部分学者在特征向量上计算附加函数来形成
活动图[6,7],还有学者将协同识别理论引入到这一过
程[8].最后,根据计算得到的活动图用局部最大值[1~3]、
高斯差[4]和多尺度熵[9]等算法来确定注意固定点等信
息.以上模型无论具体采用哪种算法,其中心思想均是
在视觉空间中具有较高的显著性的区域在获得有限的
注意资源时具有优先性.因此,图像显著性的计算在注
意焦点转移的确定中起决定作用.
本文提出了一种新的视觉注意信息提取算法
收稿日期:20090207;修回日期:20090407
基金项目:高等学校博士学科点专项科研基金项目(No.20050183032),吉林省教育厅科学基金项目(No.2004150)
第2A期
2010年2月
电 子 学 报
ACTAELECTRONICASINICA
Vol.38 No.2A
Feb. 2010
更多技术文章,论文请登录www.srvee.com
内容版权归作者所有
ACSMC(AlgorithmBasedonContrastSensitivityandMarkov
Chain),用对比敏感度和马尔可夫链来提高注意固定点
确定的可靠性和计算效率.在构建金字塔之前用与离
心率有关的对比敏感度函数对输入的图像进行加权,
可以更好的模拟视网膜神经节细胞在视网膜不同位置
上对相同的明暗刺激产生不同响应的情况.令质点在
得到的特征向量上做具有反射边界的二维随机游动,
以相邻两点间的差异和距离做为相互游动的可能性度
量,以马尔可夫链的平稳分布做为该点的活动显著值.
具体算法和实验数据如下.
2 基于对比敏感度的特征向量提取
经典的注意计算模型在特征向量提取时通常将原
始视觉图像分为颜色通道、亮度通道、方向通道和纹理
通道等通道分别传递,利用图像金字塔降采样得到不
同等级的特征向量[1~6].图像金字塔降采样可以有效的
模拟感受野的等级特性,然而大多数模型在金字塔的
底层上采用固定尺寸的滤波器进行滤波,它们没有考
虑到在金字塔底层上因视网膜上光感受器、神经节细
胞的分布不均而造成的视网膜神经节细胞对相同的明
暗刺激随着离心率的增加而产生急剧减小的刺激的情
况.事实上,大多数视觉注意的模型在提取视觉显著度
的时候是依靠亮暗、红绿和黄蓝的视觉对比得到
的[1~5],即使有的模型在程序上没有直接做这种视觉对
比,它们在最终获取注意固定点时也是根据全局的显
著度情况来确定的[6,7],全局显著度计算落到神经节的
层次上也应随着离心率的不同而不同.这里,我们用对
比敏感度函数做为视网膜变换的权系数.
对比敏感度为视觉系统能察觉的对比度阈值的倒
数,它描述了人眼区分细微明暗和它们边界的能力.对
比度阈值越低,则对比敏感度越高,视觉功能越好.视网
膜的生理结构决定了,在中央凹区域的对比敏感度是最
高的,当从中央凹往外围测试时,对比敏感度急剧下降.
文献[10]给出了一个符合心理学关于对比敏感度
的实验数据的公式,如下所示
CT(f,e)=CT0exp(αf
e+e2
e2
) (1)
其中,CT是可视对比阈值,f是空间频率,e是视网膜
离心率,CT0为最大对比阈值,α是空间频率衰减常数,
e2是半分辨离心率常数.最佳的参数设置是α=0106,
e2=23,CT0=1/64.
对比敏感度是对比阈值的倒数,
CS(f,e)=1/CT(f,e) (2)
f通常被设置为图像的奈奎斯特频率,这样对比敏
感度函数 CS(f,e)实际上是关于视网膜离心率的函数.
设输入图像为 O:[n]2→R(实际上,文中用到的图像
不是严格正方的,而是矩形的,这时我们取矩形的短边为
n),该幅图像的整个视角为θ,则视距 v是使得图像边缘
的离心率为θ/2的从眼睛到图像的观察距离.可得,
v(θ)=
n
2/tan(
θ
2) (3)
设图像中心点坐标为(x0,y0),则图像上任一点
(x,y)∈[n]2的离心率 e是该点到中心点的距离与视
距之比的反正切.
e(x,y,θ)=tan-1
x-x( )0 2+ y-y( )0( )2 1/2
v(θ( )) (4)
则用对比敏感度函数变换后的图像为
O′(x,y)=O(x,y)CS(e(x,y,θ)) (5)
当θ=55°,f=54cpd时,视网膜变换权系数如图1
所示.在图像正中央视觉敏感度最大,归一化权系数为
1.可以看出,权系数随着该点与中心点距离的增加(离
心率的增加)而减小.
用敏感度对图像进行加权变换可以有效的抑制图
像外围信息在注意显著图形成过程中的活跃性.
本文选择视觉上较为敏感的亮度、颜色和方向这
三类特征参与检测.用文献[1]中特征通道提取方法对
变换后的图像 O′(x,y)分别计算,得到亮度图 I,颜色
通道中红绿特征图 RG、蓝黄特征图 BY,方向通道特征
图 O(θ),其中θ=0°,45°,90°,135°.分别对三个通道的
7幅特征图用 9层的高斯金字塔滤波,得到 I(σ),RG
(σ),BY(σ)和 O(θ,σ),其中σ=0,…,8.选取金字塔的
第二层和第三层并把它们归一化 N(局部平均[1])到统
一尺寸做为特征向量.
3 基于马尔可夫链的活动图形成
在特征向量上定义马尔可夫链,用它的平稳分布
做为活动图上的显著度.在我们之前,文献[6]把特征
图上的所有点做为节点,把两点之间的差异与它们距
离的乘积做为边的连接权值,以此构成完全有向图,并
在完全图上定义马尔可夫链,用马尔可夫链的平稳分
布来估计活动图上的显著度,取得了较好的效果.但文
献[6]中计算在完全有向图上定义的马尔可夫链的平
412 电 子 学 报 2010年
更多技术文章,论文请登录www.srvee.com
内容版权归作者所有
稳分布具有较高的时间复杂度,约为 O(n4).我们对其
定义马尔可夫链的方法进行了改进,在得到注意固定
点效果损失不那么明显的情况下,大幅降低计算所耗
费的时间,改进后的算法时间复杂度约为 O(n2),具体
算法如下:
设特征向量 F的维数为M×N,则在该特征向量上
做具有反射边界的二维随机游动,如果游动点 Q现在
位于任一非边界上的点(x,y)上,则下一时刻 Q只能
位于与当前点Q相邻的周边八个点上(如果当前位于
边界点,则下一时刻 Q只能位于周边五个点上;若位于
角点,下一时刻只能位于周边三个点上),Q向周边点
(x′,y′)移动的概率与两点的向量值差异成正比,与两
点的距离指数成反比.令 p′((x,y),(x′,y′))为未归一
化之前 Q从(x,y)点向(x′,y′)点游动的可能性,则
p′ x,( )y,x′,( )( )y′ = F x,( )y -F x′,( )y′
exp( x-
( )x′2+ y-( )y′2
2σ2
)
其中,|x-x′|≤1,|y-y′|≤1,σ为常数. (6)
由于 Q点向周围八个方向的游动概率之和应为1,
我们归一化 p′,得到
P{Xn+1=(x′,y′)|Xn=(x,y)}
= p′
(x,y),(x′,y′( ))
∑
1
i=-1
∑
1
j=-1
p′(x,y),(x+i,y+j( ))
其中,|x-x′|≤1,|y-y′|≤1 (7)
Q当前位于边界点或角点的情况以此类推.
设置一步转移概率矩阵 P的维数为(MN)×(MN)
维,其矩阵元素
Pij=P{Xn+1=(「j/N?,(jmodN)+N(?j/N」
-「j/N?+1))|Xn=(「i/N?,(imodN)
+N(?i/N」-「i/N?+1))} (8)
其中,i,j=1,2,…MN
此时,其平稳分布π=(π1,π2,…,πMN)为满足方程
组(9)的解.
π=πP
∑
MN
i=1
πi
{ =1 (9)
这个分布给出了经过长时间游动以后 Q点位于某
点的可能概率.用本文方法定义的马氏链,其平稳分布
反映了特征图上该点在竞争过程中获胜的可能性,用
它做为活动图的显著度具有良好的物理意义.
本文整合算法即显著图的生成方法,与活动图生
成方法类似,游动点 Q在活动图上做具有反射边界的
二维随机游动.不同之处是,未归一化之前 Q从(x,y)
点向(x′,y′)点游动的可能性
p′(x,y),(x′,y′( )) = F(x′,y′)
exp((x-x′)
2+(y-y′)2
2σ2
)
其中,|x-x′|≤1,|y-y′|≤1,σ为常数. (10)
显著图的生成方法其它部分与活动图生成方法相
同,由于篇幅限制,不再累述.
4 实验结果及分析
实验原始数据采用 Einhuser等人[11]的数据集.
Einhuser等人测试并
了7个人在自由注视的情况
下对 108幅自然场景图像和它们的修改版本图像(共
972幅图片)进行观察所获得的注意固定点位置.他们
将972幅图片分为18组(每组54幅),7个人分为四组
(前三组二个人,第四组一个人),人物前三组分别对18
组图片中的6组图片进行测试,人物第四组对所有 18
组图片进行测试.这样,每幅图片均有三个人对其进行
测试.我们在测试本文算法性能时只选取 Einhuser等
人的数据集中未被修改的108幅自然场景图片和它们
的三个人的注意固定点位置坐标做为标准数据集,其
中108幅图片只用到其中心位置 600×400像素部分,
对应的视角范围是76°×55°.由于标准数据集中的测试
图片是灰度图,因此实际在计算算法特征图时只选择
亮度通道和方向通道参与检测.把本文算法 ACSMC与
目前被普遍认可的Gbvs[6]和Saliency[2]算法的部分与整
体分别做比较,比较结果如下.
41 活动图形成和整合算法性能比较
为实现比较的公平性,进行这一部分的比较时特征
提取部分采用的方法相同.对亮度通道和方向通道5幅
特征图进行金字塔滤波,选用金字塔的第二层和第三层
共10幅特征图,并把它们分别归一化(局部平均[1])到25
×37尺寸做为特征向量.其中 Centersurround(cs)[2]活
动图生成算法需要做多尺度特征图的相减操作,这里我
们选取的c为金字塔的2层和3层,δ为4层.我们把108
幅自然图片分为11组进行测试(前10组分别含有10幅
图片,第11组含有8幅图片),分别用文中基于马尔可夫
512第 2A 期 张孝临:基于对比敏感度和马尔可夫链的注意信息提取算法
更多技术文章,论文请登录www.srvee.com
内容版权归作者所有
链的活动图形成和整合算法 MB(Markovianbased),
graph[6]和 cs&avemax[2]对它们进行计算得到显著图,
根据 Einhuser数据集中的注意固定点位置计算ROC曲
线下面积(areaunderreceiveroperatingcharacteristiccurve,
AUROC).以图片分组的序号为横坐标,以每组图片的
AUROC平均值为纵坐标的实验结果图如图2所示.
表1给出了这三种算法对108幅图片进行计算得
到的平均 AUROC值和在主频为15GHz,512MB内存的
机器上算法的平均计算时间.
虽然MB算法的平均 AUROC值略低于 graph算法
的平均AUROC值,但 MB算法的平均计算时间大幅小
于graph算法的平均计算时间.以上三种算法的平均计
算时间以 cs&avemax算法为最小,仅为0.097s,但同时
它的平均AUROC值也是最小的.
表1 算法性能测试结果
算法性能
算 法 graph cs&avemax MB
平均AUROC 0.6431 0.5670 0.6364
平均计算时间(s) 11.278 0.097 6.271
42 注意信息提取算法比较
为符合标准数据集中图片对应的视角范围,文中
ACSMC算法视网膜变换部分设置θ=55°.用 ACSMC,
Gbvs和 Saliency算法分别计算测试集中图片的显著图,
并计算它们的 ROC曲线下面积.部分测试结果如图 3
所示.用Einhuser数据集给出的注意固定位置做为评
判性能的标准.为观察方便,在图3中的测试原图上用
黄色“■”标记了相关注意固定点位置.
仍旧把108幅自然图片分为11组进行测试,计算
平均 AUROC值,注意信息提取算法 ACSMC,Gbvs和
Saliency算法的分组测试结果如图4所示.
由图4可知,ACSMC结果曲线略高于Gbvs曲线,且
两者的曲线值均大于Saliency曲线值.图4中Saliency的
检测结果要好于图2中 c-s&ave-max的检测结果,这
可能与Saliency根据原文[2]选择的相减尺度比图2中 c
-s&ave-max选择的尺度多有关系. 这三种算法
对数据集所有图片进行注意信息提取的平均 AUROC
值和平均计算时间如表2所示.
由表2可知,ACSMC的平均 AUROC值略大于 Gbvs
612 电 子 学 报 2010年
更多技术文章,论文请登录www.srvee.com
内容版权归作者所有
且平均计算时间小于 Gbvs,虽然 ACSMC的平均计算时
间大于Saliency,但ACSMC的计算准确度相对于Saliency
要高很多.综合考虑,ACSMC算法的整体性能要好于
Gbvs算法和Saliency算法.
表2 算法性能测试结果
算法性能
算 法
Grbvs Saliency ACSMC
平均AUROC 0.6431 0.5737 0.6541
平均计算时间(s) 15.374 4.728 11.107
5 结论
本文提出了一种新的基于对比敏感度和马尔可夫
链的视觉注意信息提取算法.通过计算以神经生物学
家的研究成果为标准的接受者操作特性曲线下面积和
算法平均计算时间证实,该算法是一种行之有效的自
底向上的注意信息提取方法.
同时,本文算法还存在有待改进之处.算法只估计
了注意固定点的位置,没有对显著区域的尺寸进行估
计.通常上注意模型在得到注意固定点以后以注意固
定点为圆心以一定尺寸范围内的区域做为显著区域,
然而根据心理学的研究发现显著区域的尺寸在注意过
程中会不断发生变化.因此
有效的算法来估计显
著区域尺寸将是下一步工作的方向.
参考文献:
[1]LItti,CKochENiebur.Amodelofsaliencybasedvisualat
tentionforrapidsceneanalysis[J].IEEETransactionsonPat
ternAnalysisandMachineIntelligence,1998,20(11):1254-
1259.
[2]LItti.Modelsofbottomupattentionandsaliency[A].IL.Itti
ed.Neurobiologyofattention[C].SanDiego,CA:Elsevier,
2005.576-582.
[3]CSiagian,LItti.Rapidbiologicallyinspiredsceneclassification
usingfeaturessharedwithvisualattention[J].IEEETransac
tionsonPatternAnalysisandMachineIntelligence,2007,29
(2):300-312.
[4]LItti,CKoch.Asaliencybasedsearchmechanismforovert
andcovertshiftsofvisualattention[J].VisionResearch,2000,
40(10-12):1489-1506.
[5]DParkhurst,KLaw,ENiebur.ModelingtheroleofSaliencein
theallocationofovertvisualattention[J].VisionResearch,
2002,42(1):107-123.
[6]JHarel,CKoch,PPerona.Graphbasedvisualsaliency[J].
AdvancesinNeuralInformationProcessingSystems,2007,19:
545-552.
[7]NBruce,JTsotsos.Saliencybasedoninformationmaximization
[J].AdvancesinNeuralInformationProcessingSystems,
2006,18:155-162.
[8]邵静,高隽.基于协同感知的视觉选择注意计算模型[J].
中国图象图形学报,2008,13(1):129-136.
ShaoJing,GaoJun.Visualselectiveattentioncomputational
modelbasedonsynergeticperception[J].JournalofImageand
Graphics,2008,13(1):129-136.
[9]田媚,罗四维,黄雅平 等.基于局部复杂度和初级视觉特
征的自底向上注意信息提取算法[J].计算机研究与发
展,2008,45(10):1739-1746.
TianMei,LuoSiwei,HuangYapingetal.Extractingbottom
upattentioninformationbasedonlocalcomplexityandearlyvi
sualfeatures[J].Journalofcomputerresearchanddevelop
ment,2008,45(10):1739-1746.
[10]W SGeisler,JSPerry.Arealtimefoveatedmultiresolution
systemforlowbandwidthvideocommunication[J].Human
VisionandElectronicImaging,Proc.SPIE,1998,3299:294-
305.
[11]EinhuserW,KruseW,HoffmannKP,KnigP.Differences
ofmonkeyandhumanovertattentionundernaturalconditions
[J].VisionResearch,2006,46:1194-1209.
作者简介:
张孝临 男,1979年 12月出生于辽宁鞍
山.吉林大学计算机科学与技术学院博士研究
生.主要研究方向:智能信息系统与嵌入式技术.
Email:zxl2257cn@yahoo.com.cn
赵宏伟 男,1962年11月出生于辽宁沈阳.
吉林大学计算机科学与技术学院教授,博士生导
师.主要研究方向:智能信息系统与嵌入式技术、
计算机图像处理与可视化.
Email:zhaohw@jlu.edu.cn
王 慧(通信作者) 女,1982年 12月出生
于黑龙江密山.吉林大学计算机科学与技术学院
博士研究生.主要研究方向:智能信息系统与嵌
入式技术.
Email:email-wanghui@126.com
戴金波 女,1971年10月出生于吉林蛟河.吉林大学计算机科学
与技术学院博士研究生,长春师范学院计算机硬件教研室副教授.主要
研究方向:智能信息系统,思维计算.Email:email-wanghui@126.com
712第 2A 期 张孝临:基于对比敏感度和马尔可夫链的注意信息提取算法
更多技术文章,论文请登录www.srvee.com
内容版权归作者所有
本文档为【基于对比敏感度和马尔可夫链的注意信息提取算法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。