第 36卷 � 第 7期
2009年 7月 计 算 机 科 学Computer Science Vo l. 36 No. 7July 2009
到稿日期: 2008�08�27 � 返修日期: 2008�11�10 � � 本文受国家自然科学基金( 60874069, 60804037) 和湖南省自然科学基金资助项目( 09J J3122)
资助。
朱红求 � 男,博士研究生,研究领域为复杂过程信息处理与优化建模;阳春华 � 女,博士生导师,研究领域为复杂工业过程优化控制、智能自动控
制系统等, E�mail: hqcsu@ csu. edu. cn。
一种净化过程钴离子浓度的混合智能预测方法
朱红求 � 阳春华 � 桂卫华
(中南大学信息科学与
学院 � 长沙 410083)
�
摘 � 要 � 针对锌湿法冶炼净化过程的复杂性, 提出了一种结合粒子群算法和案例推理方法的净化过程 II 段出口钴离
子浓度混杂预测模型。考虑到不同时期案例所起的作用不一样,提出了一种综合加权相似函数。针对案例推理方法
中属性权重选择和近邻个数的选取问题,提出了带有变异的惯性权重自适应粒子群算法优化方法,优化最近邻算法中
特征权重矢量和近邻数,提高案例的检索精度。以净化过程生产数据进行实验验证和对比分析,计算结果
明改进的
案例推理模型精度优于神经网络模型,模型预测结果可以作为过程信息用于净化过程的优化控制。
关键词 � 净化过程,离子浓度预测, 混杂案例推理, 自适应粒子群算法
中图法分类号 � TP273 � � � 文献标识码 � A
�
Hybrid Intell igent Prediction Model of Cobalt Concentration for Purification Process
ZH U Hong�qiu� YANG Chun�hua � GU I Wei�hua
( School of Inform at ion Science & E ngineering, Cent ral S ou th U nivers ity, C hang sha 410083, Chin a)
�
Abstract� A hybr id intellig ent prediction model combining case�based r easoning( CBR) w ith adapt ive par ticle swarm op�
t imization( PSO) was propo sed fo r the cobalt concent ration prediction o f purificat ion pro cess in zinc hydrometallurg y.
Ow ing to the differ ent effect o f the case in different periods, a combined w eighted similar ity functions was pr esented.
Considerat ion of the r etriev al accuracy o f CBR influenced by the feature weighting vecto r selection and the optimal num�
ber o f nearest neighbor s, an adaptive PSO alg or ithm was proposed to optimize these parameters. The experimental v eri�
ficat ion and comparison analysis w ere executed using the industrial pr oduction data fr om purification process. T he re�
sults show that the accuracy o f the hybrid intellig ent model is higher t han the BP neural netw ork model and the pr edic�
t ion results can be used as pr ocess data fo r the operation optimization o f the purification pro cess.
Keywords� Pur ification pr ocess, Cobalt concentr ation prediction, Case�based r easoning , Adapt ive PSO
�
1 � 引言
净化过程是湿法炼锌生产中最为重要的一个过程, 主要
是通过添加锌粉和锑盐去除电解液中铜镉钴等杂质离子。净
液效果的好坏不仅影响电解过程电流效率和电能消耗, 还影
响后续电解过程的产品质量和产量[1]。钴是危害最大也是最
难去除的杂质之一。由于净化过程的长
和大时滞以及离
子浓度人工化验分析时间滞后长, 常规的过程优化方法实验
困难,现场虽然采用 DCS 系统实现了过程参数的集中监视以
及单回路稳定控制,但现场操作仍然采用人工操作的方式,主
管盲目性大,造成过程锌粉消耗大、资源和能源浪费大。
对于这样一类复杂对象, 预测控制是一种行之有效的方
法。在预测控制中, 过程参数预测是其中一个重要的环节。
由于净化过程具有影响因素多、非线性、大时滞等特点。基于
机理分析和过程简化数值模拟方法来研究离子浓度的预测模
型比较困难。现场 DCS 的应用和自动数据采集仪表的应用,
收集和积累了大量现场数据,为基于数据驱动的建模方法提
供了前提条件。人工神经网络具有非线性映射能力和强有力
自学习能力, 在复杂过程参数的软测量问题获得了有效的应
用[ 2, 3]。但神经网络学习算法存在最终解过于依赖初值和过
拟合现象, 训练过程中常陷于局部极小值点, 且收敛速度较
慢, 网络结构难以确定,这些缺点影响了神经网络在实际工程
中的推广应用。
事实上, 在实际复杂的生产过程中,操作人员依据过去的
经验来判断钴离子浓度的变化趋势, 并以此对操作参数进行
优化, 往往可以得到较好的控制效果。案例推理作为一种新
兴的人工智能技术, 在理论模型和领域知识不完全清楚的情
况下能很好地模仿人工操作经验 ,具有简化知识获取、便于知
识积累等优点, 在入侵
、故障预警与诊断、软测量和工业
过程建模、疾病诊断、工程设计、市场规划等领域获得了广泛
的应用[ 4�9]。因此,本文采用案例推理作为钴离子浓度预测主
要的建模工具。然而, 案例推理在实际应用中存在权重指配、
相似函数设计等问题。在线优化属性权重和近邻个数是提高
案例推理精度的一个重要问题。许多学者研究了属性权重的
�234�
自动优化方法,如遗传算法、粒子群算法、层次分析法等多种
方法[10�14]。考虑到粒子群算法具有概念简单、容易实现和计
算效率高等特点,本文提出用粒子群算法优化案例推理中案
例属性权重和最近邻检索中相似案例的个数。此外,考虑到
不同时期样本数据的不同作用, 提出了一种综合加权的相似
度函数。应用现场生产数据对该方法进行了验证, 并与神经
网络模型进行了比较。结果表明, 本文提出模型的精度高于
神经网络模型,相对误差满足净化过程现场对参数预测精度
的要求,预测的结果可以作为过程信息用于净化过程的实时
操作参数优化。
2 � 基于案例推理的钴离子浓度预测模型
案例推理中影响案例检索的关键因素包括知识表示、属
性描述和相似度定义等问题。基于案例推理方法建模的关键
一步是案例的表示和案例库的建立。通过机理分析、现场的
实际情况和数据的相关性分析, 我们选取了和钴离子浓度紧
密相关的变量, II 段入口镉离子浓度( x 1 )、II 段入口溶液温度
( x 2 )、II段出口溶液温度( x 3 )、II 段入口溶液流量( x 4 )、锑盐
流量( x 5 )、锌粉添加频率( x 6)、 段后液钴离子浓度( x 7 )、4#
槽钴离子浓度( x 8 )、5# 槽钴离子浓度( x 9 )和 7# 槽钴离子浓
度( x 10 )等 10 个变量作为案例的输入条件属性 ,以下一时刻
II段压滤后出口钴离子浓度作为案例的决策属性。则案例可
表示为: C i = ( X i , d i ) ,式中 X i 为条件属性的集合, X i = ( x 1 ,
x 2 , !, x 10 ) d i 为决策属性值。考虑到各个参数检测的对应时
间以及数量级存在差异, 对所有的输入输出数据进行了时滞
对应关系和归一化处理。
案例检索是 CBR 的核心技术,它直接决定了案例推理的
速度和精度,本文采用最近邻检索方法, 其关键问题是案例相
似度的定义。考虑到不同时期历史数据所起的作用不一样,
根据∀ 远小近大#的原则, 提出了检索案例与源案例的综合相
似度函数:
Sim i, j = �i ∃ %
10
k= 1
w k ∃ 1- vk , i - v k, jv k max - v k min
%n
k= 1
wk
( 1)
�j = N - jN (�max- �min) + �min ( 2)
其中 Sim i , j 为两者各条件属性的加权相似度, wk 为第 k 个属
性的权重, vk, i和 v k, j 分别为输入案例和源案例第 k 个属性的
值。�j 为案例库中案例 j 的加权系数, 案例产生时间越早,权
系数越小,按照近大远小原则进行线性插植赋值, N 为案例
库中案例的总数,�max和 �min为基于样本时间加权系数的最
大、最小值。
输入的目标案例首先和案例库中的案例进行检索, 根据
K�NN 方法找到最相似的一组案例,求取该组案例的决策属
性加权平均值,其结果就是钴离子浓度的预测值:
out l = %Kn
k= 1
Sim l , k ∃ outk% Sim l, k ( 3)
其中, outk 为案例 k 的输出值, Sim i , k为输入案例 l 和源案例 k
的相似度, kn 为最近邻案例的个数。
3 � 混杂案例推理预测模型
KNN 在实际应用中存在着不可回避的问题: 一是案例特
征权重的确定和近邻个数的选取,二是参数的固定不变。案
例特征权重若不能正确赋值, 将影响 KNN 法的案例检索精
度。许多案例推理系统采用基于领域知识或者基于诸如关联
系数分析之类的数理统计方法。本文提出了基于粒子群算法
的属性权重优化方法。
粒子群算法中迭代和更新的策略就是粒子追随种群中最
优的粒子。如果粒子找到一个局部最优点, 其他粒子会迅速
飞向它。这样, 这些粒子也许会陷入局部最优点而不会再在
全局解空间内搜索, 形成所谓的早熟。实验表明, 无论是局部
收敛还是全局收敛, 种群多样性均严重减少, 种群多样性的匮
乏导致过早收敛的产生。
这里, 我们使用种群平均粒距[ 15]来描述种群的多样性。
设 L 为搜索空间对角最大长度, M 为种群规模大小, D 为解
空间维数, x tid表示第 i 个粒子的第 d 维坐标值, �p d 表示所有
粒子第 d 维坐标值均值, 则定义第 t次迭代时种群的平均粒
距 D( t)如下:
D ( t) =
1
M � L� %
M
i= 1
%D
d = 1
( x tid - �p d ) 2 ( 4)
平均粒距描述了种群中各粒子相互之间分布的离散程
度, D( t)越小, 表示种群越集中。
基于控制种群多样性的思想,这里将给出一种新的带变
异的自适应粒子群优化算法。在种群进化过程中, 该算法根
据最优适应度变化率, 自适应调整惯性权重的取值, 更加灵活
地控制算法的全局与局部搜索能力, 并且当种群多样性下降
到一定程度, 或者全局极值 Pgd较长时间无明显变化时, 对种
群中部分粒子进行变异操作以提高种群的多样性, 从而使种
群得以持续进化, 增大寻找全局最优解的几率。
3. 1 � 自适应惯性权值策略
PSO算法的实际搜索过程是非线性且高度复杂的, 而通
常使用的惯性权值递减的方法由于变化方式单一, 对搜索能
力的调节也就有限。而自适应惯性权值策略则可以改变这种
单一的调节模式, 使之较好地适应复杂的实际环境。
定义最优适应值变化率 k[ 16] ,
k=
f ( t)- f ( t- T )
f ( t- T )
( 5)
其中, f ( t) 为种群第 t 代的最优适应值, f ( t - T ) 为种群第
( t- T )代的最优适应值,则 k 表示种群在最近进化 5 代内最
优适应值的相对变化率。惯性权重 w 的取值随 k 的大小自
适应调整, 如式(6)所示:
w =
�1+ r / 2. 0, k&0. 05
�2+ r / 2. 0, k< 0. 05 ( 6)
其中, r 为均匀分布于[ 0, 1]之间的随机数。当 k&0. 05, 即种
群在进化过程中最优适应值的变化较大,种群处于探索阶段,
此时惯性权重取较大值有利于算法收敛, 其数学期望值 E
( w) = a1+ 0. 25; 当 k< 0. 05, 即种群在进化过程中最优适应
值的变化较小, 种群处于开发阶段,此时惯性权重取较小值有
利于获得精确的解, E (w ) = a2+ 0. 25, 且 a1 > a2。一般取值
a1 为 0. 6, a2 为 0. 2。
3. 2 � 变异操作
PSO算法中, 随着搜索迭代的进行, 种群多样性不断损
失, 使得算法有可能过早收敛。因此,当种群进化到一定程度
时, 执行变异操作以提高种群的多样性,而进行变异操作的这
些粒子将进入其它区域进行搜索 ,在其后的进化过程中, 算法
�235�
就有可能发现新的最优解。如此循环,算法就可以找到全局
最优解。
当种群平均粒距 D( t)小于某个给定的值, 或者全局极值
Pgd较长时间无明显变化时,则对种群中部分粒子按一定的概
率 p m 来执行变异操作 , p m 可以取[ 0. 1, 0. 3]之间的任意数
值。具体的做法为:首先根据适应值的大小对种群所有粒子
进行排序,取适应值最好的 m 个粒子, 对应产生 m 个分布于
[ 0, 1]之间的随机数 r i , i= 1, 2, !, m, 如果 r i < p m , 则按照式
( 7)产生粒子新的位置[ 17] , 但是该粒子迄今为止所找到的最
优位置仍旧记忆,然后进入下一次迭代。
x t+ 1id = x
t
id * ( 1+ 0. 5* ) ( 7)
其中, 是服从 Gauss( 0, 1)分布的随机变量。
使用测试案例集的预测精度这个指标对案例特征权重和
近邻个数等参数优劣的评价, 即 PSO 中适应度的度量。PSO
优化的目标就是寻找最优特征权重向量和近邻个数从而使预
测精度最优。期望值为平均绝对百分比误差 MAPE 小于
10%。优化过程通过对测试案例集进行预测计算, 通过寻找
一组最优的向量 , 使得测试案例集的预测结果与实际值的
MAPE 最优。
4 � 实验验证分析
现场对于模型的精度要求为相对误差小于 5%的样本数
大于总体样本的 85%。粒子群参数优化过程采用多线程技
术后台运行,优化过程结束
为预测精度满足某一设定值,
或者迭代次数以及达到最大次数或由粒子的位置变化引起的
适应度相对误差绝对值小于 0. 5% , 优化过程结束以后更新
案例推力模型中的权重系数和近邻个数等参数值。
通过对净化工段生产过程中两年所积累的生产数据进行
数据预处理,并进行规则间相互相似度计算, 对较相似规则进
行合并,我们最终得到了 3500 个源案例。连续选取生产过程
中的 375组数据,其中 300 组数据作为参考样本用于权重系
数和近邻个数等参数的优化计算, 75 组数据用于该方法的验
证。粒子群算法优化的目标是保证平均绝对百分比误差
MAPE 最小。在粒子群算法初始化中, 粒子的初始值均随机
产生,最大迭代次数为 1000, 种群大小为 80,种群平均粒距最
小限制阈值 Dmin设为 0. 001, c1 和 c2 取 2. 0。优化计算的结
果近邻个数为 4, w = [ 0. 0562, 0. 0613, 0. 1072 0. 0664,
0. 0536, 0. 1092, 0. 1633, 0. 0970, 0. 0664, 0. 2195]。模型预测
的结果及误差分析结果如下图 1 和图 2 所示。
图 1 � 神经网络模型仿真结果
图 2 � 改进案例推理方法仿真结果
通过统计分析, 改进案例推理模型预测结果中相对误差
绝对值大于 10% 的样本 6 个, 小于 5% 的点 54 个, 均方差
MSE( mean square er ro r) 为 6. 9227∃ 10�6 ;而 BP 神经网络模
型预测结果中相对误差绝对值大于 10% 的样本 27 个, 小于
5%的点 37 个, 均方差 MSE 为 5. 6916 ∃ 10- 5。相比之下, 改
进案例推理模型大于 10%的点的个数下降了 19 个, 模型精
度优于神经网络模型,提高了模型的可用性和准确性。从误
差分析图可以看出, 大部分样本误差控制在 5%以内,模型精
度满足现场相对误差小于 5%的样本数大于总体样本的 85%
的工艺要求, 可以为现场技术人员调节炉况提供指导作用。
结束语 � 锌湿法冶炼净化过程是一个典型的长流程复杂
工业过程, 准确预测过程出口钴主子浓度、实现过程的优化,
对于净化过程的节能降耗具有重要意义。本文在深入研究净
化过程机理的基础上, 采用案例推理方法实现了 ∋段出口钴
离子浓度, 并针对案例推理中存在的问题, 提出了改进粒子群
算法优化案例特征权重和近邻个数等参数。通过采用现场生
产数据对所提的方法进行了验证, 并与神经网络建模方法进
行了比较。计算结果表明, 该方法的预测精度要优于神经网
络模型, 除部分出现反溶现象的样本外,预测精度基本上控制
在 5%以内, 预测结果满足现场提出的要求,可以作为过程信
息用于净化过程的实时在线操作优化。
参 考 文 献
[ 1] Boyan ovB S , Konareva V V , Kolev N K . Purif ication of zinc sul�
f ate s olut ions from cobalt and nickel through act ivated cem enta�
t ion[ J] . H ydrometallur gy, 2004, 73( 1/ 2) : 163�168
[ 2] Su H B, Fan L T , Sch lup J R. Monitoring the pr ocess of epoxy/
graphite f iber com posites with a recu rrent n eural n etw ork as a
sof t sen sor [ J ] . Engin eering Applicat ion of Artif icial Intell i�
gen ce, 1998( 11) : 293�306
[ 3] Choi D�J, Park H. A hybrid art if icial neural netw ork as a sof t�
w are sensor for opt imal cont rol of a w astew ater t reatment
process [ J] . Water Research, 2001, 35( 16) : 3959�3967
[ 4] 李玲娟,王汝传.基于规则的 IDS 中的 CBR 研究[ J ] .计算机科
学, 2006, 33( 5) : 117�120
[ 5] Ochi�Okorie A S. Disease diagnosis validation in T ROPIX us ing
CBR[ J ] . Art ificial Intel ligen ce in Medicine, 1998, 12( 1) : 43�60
[ 6] Waheed A, Adel i H. Case�based reasoning in steel bridg e engi�
neering[ J ] . Kn owledge�Based Sys tems, 2005, 18( 1) : 37�46
� � � (下转第 277页)
�236�
图 8 � 军用机场机库检测部分结果
结束语 � 本文将自然语言分析中的统计方法应用于图像
中,得到新的目标语义概率模型。此模型能够实现某一类目
标的识别,并且训练图像在不需要标注和分割的情况下达到
高的识别率。本文还为遥感图像中复杂场景的地物分析提供
了新的思路。基于此模型可以实现对场景中感兴趣区域的识
别和标记,实验结果显示此算法有可行性。
进一步的工作包括:改进特征区域的描述, 采用放射协变
区域代替简单的局部区域,使得区域的表达具有光照、视角等
不变性,实现特征区域的更精确表达; 可以根据具体某类目标
改进目标统计模型,根据目标的结构特征, 在模型中加入空间
信息。通过进一步的算法改进,可以使得识别率更高, 并且可
以实现更加精确的地物局部定位标注。
参 考 文 献
[ 1] Forsyth D, Ziss erman A. Shape f rom Shading in th e Light of
Mutual Il lumin at ion[ J ] . Image and Vis ion Compu tin g, 1900, 8
( 1) : 42�29
[ 2 ] Grim son W , Hut tenloch er D. On the sensit ivity of the H ough
trans form for ob ject recognit ion[ J] . IE EE T ran sact ion s on Pa�
t t ern Analys is and Machin e In telligence, 1990, 12( 3) : 255�274
[ 3] Low e D. Object Recogn ition f rom Local Scale�invariant Features
[ C] (Proc. Intern at ional Confer ence on C om puter Vision. 1999,
2: 1150�1157
[ 4] Rothganger F, Lazebnik S, S chmid C, et al . 3D Object Model ing
and Recognit ion U sing Local Af fin e� invariant Image Descriptor s
and Mul t i�view Spat ial Const raint s [ J] . Proc. Computer Vision
and Pattern Recognit ion, 2003, 66( 3) : 272�280
[ 5] S chneiderm an H, Kanade T. A Stat is ti cal Approach to 3D Ob�
ject Detect ion Applied to Faces an d Cars [ D] . Robot ics In st itu�
t e, Carnegie Mellon University, May 2000
[ 6] Viola P, Jon es M . Rapid Object Detect ion Usin g a Boos ted Cas�
cade of Simple Features [ J ] . Proc. Compu ter Vision and Pat tern
Recognit ion, 2001, 1: 511�518
[ 7] Viola P, Jones M , Snow D. Detect ing Pedest rians Using Pat tern s
of Mot ion and App earance[ J] . Proc. International Conferen ce on
Computer Vision, 2003, 63( 2) : 734�741
[ 8] LeCunY , Bot tou L , Ben gio Y , et al . Gradient� basedLearning
Applied to Documen t Recognit ion[ J] . Proceedin gs of th e IE EE,
1998, 86( 11) : 2278�2324
[ 9] Fergu s R, Perona P, Zisserman A. Ob ject C las s Recogn ition by
Un supervi sed Scale�in variant Learn ing [ J ] . Proc. Com puter Vi�
sion an d Pat tern Recognit ion, 2003, 2: 264�271
[ 10] 叶斌,彭嘉雄.基于结构特征的军用机场识别与理解[ J] . 华中科
技大学学报, 2001, 29( 3) : 1�2
[ 11] H ofman T. Probab ilist ic latent seman tic indexing [ C] (Annual
ACM Conference on Research and Developm ent in Informat ion
Ret rival. 1999: 50�57
[ 12] 石晶,戴国忠.基于 PLSA 模型的文本分割[ J ] .计算机研究与发
展, 2007, 44( 2) : 242�248
[ 13] Ries enhuber M , Poggio T. H ierarchical M odels of Ob ject Recog�
nit ion in Cortex [ J ] . Natur e Neuroscience, 1999, 2 ( 11) : 1019�
1024
[ 14] Linde Y, Buzo A. An Algori thm for Vector Quant izer Des ing
[ J] . IEEE Trans . COM, 1980, 28( 1) : 84�95
[ 15] Laird D A P. Maximum Likel ihood f rom Incompleted Data via
the EM Algorithm[ J ] . Journ al of the Royal S tat ist ical Society,
Series B( Meth od ological ) , 1977, 39( 1) : 1�38
[ 16] Leung B. Component�based Car Detect ion in St reet S cene Ima�
ges [ D] . Dept . of E lectrical Eng. an d Computer Science, Massa�
chu set t s Inst . of T echnology, 2004
(上接第 236 页)
[ 7] Vong C M, L eung T P, Won g P K. Case�based reasoning and ad�
aptation in hydraulic product ion machine design[ J] . En gineering
Applicat ions of Art if icial Intelligence, 2002, 15( 6) : 567�585
[ 8] Kw ong C K , Smith G F , Lau W S . Applicat ion of Case Based
Reasonin g in Inject ion Moulding[ J] . Jou rnal of Material s Pro�
cess ing T echnology, 1997, 63( 1�3) : 463�467
[ 9] Chan gchien S W , Lin M C. Design and implementat ion of a case�
based reasoning system for market ing plans[ J] . E xpert Systems
with Appl icat ions , 2005, 28(1) : 43�53
[ 10] S hin K S , Han I. Case�based reas on ing supported by genetic al�
gorithm s for corporate bond rat ing[ J] . E xpert S ystem s w ith Ap�
pl icat ions , 1999, 16( 2) : 85�95
[ 11] 任江涛,卓晓岚,许盛灿,等.基于 PSO 面向 K 近邻分类的特征
权重学习算法[ J] .计算机科学, 2007, 34( 5) : 187�189
[ 12] Park C S , H an I . A case � based reasoning w ith the featu re
w eigh ts derived by analyt ic hierarch y process for bankru ptcy
predict ion[ J] . E xpert Sys tems W ith Applicat ions, 2002, 23( 3) :
255�264
[ 13] Chiu C. A case�based cus tom er classif icat ion approach for direct
market ing[ J] . Expert System s w ith Applicat ions, 2002, 22( 2) :
163�168
[ 14] 孙翎,张金隆,迟嘉昱.基于粗糙集的 CBR 系统案例特征项权值
确定[ J] .计算机工程与应用, 2003, 39( 30) : 44�46
[ 15] Krink T, Vesterst rom J S , Riget J. Part icle sw arm opt imizat ion
w ith spatial part icle ex tension [ C ] (Proceedings of IEEE Con�
gress on Evolut ionary Computation. H onolulu, H aw aii, U SA,
2002: 1474�1497
[ 16] 张丽平,俞欢军,陈德钊,等.粒子群优化算法的分析与改进[ J ] .
信息与控制, 2004, 33( 5) : 515�516
[ 17] Higasshi N, Iba H. Part icle swarm optim izat ion wi th Gau ssian
mutation[ C] (Proc. of th e Congres s on Evolu tionary Computa�
ti on. Indianapolis, Indiana, 2003: 72�79
�277�