稀有金属 2011,35(05),759-763
基于SVM和BP神经网络的部分稳定氧化锆稳定率预测方法
李东波 刘利军 彭金辉 郭胜惠 陈菓
昆明理工大学冶金与能源工程学院非常规冶金省部共建教育部重点实验室
摘 要:
由于部分稳定氧化锆具有优良的物理化学性能,在冶金及材料中有着重要的地位,稳定率是部分稳定氧化锆产品性能的一个重要指标。而部分稳定氧化锆的制备过程具有非线性、多变量、时变等特点,本文采用了支持向量机(SVM)及BP神经网络方法对部分稳定氧化锆的稳定率进行了预测。将热处理温度、保温时间、降温速率、淬火温度及升温速率5个指标(参数)作为模型输入量,部分稳定氧化锆的稳定率作为输出值,分别以48组实验数据作为学习样本,并建立模型,运用该模型预测了5组部分稳定氧化锆的稳定率。实验结果表明,2种模型均具有较好的预测能力,人工神经网络模型预测结果平均误差为1.48%,支持向量机模型预测结果平均误差为0.68%,并且支持向量机预测部分稳定氧化锆的稳定率精度更高,可在实际生产过程中推广应用。
关键词:
部分稳定氧化锆 ;稳定性 ;预测 ;支持向量机 ;BP神经网络 ;
中图分类号: TG146.414
作者简介: 李东波(1985-),男,陕西榆林人,硕士研究生;研究方向:有色金属冶金; 彭金辉(E-mail:jhpeng@kmust.edu.cn);
收稿日期: 2010-12-29
基金: 国家重点基础研究发展计划(973计划)项目(2007CB613606)资助;
Prediction Method of Stability of Partially Stabilized Zirconia Based on SVM and BP Neural Network
Abstract:
The partially stabilized zirconia demonstrated its importance in the metallurgy and material field because of its excellent characteristics of physics and chemistry.And the stability was one of the most important product performance indexes.However,the process of preparation of partially stabilized zirconia was a non-linear,multivariable and time-varying complicated process.The methods of prediction of stability of partially stabilized zirconia based on support vector machine(SVM) and LM-BP neural network were proposed.The five indicators,including holding temperature,rising rate of temperature,holding time,decreasing rate of temperature and hardening temperature,were taken as input,and the only output was stability.48 experimental data were selected as training sample,and then 5 groups stability of partially stabilized zirconia were predicted.Comparing predicted values with actual values,the results showed that two models both had good prediction ability.More specific,the average relative errors of LM-BP neural network model and support vector machine model was 1.48% and 0.68%,respectively.And the support vector machine model had higher prediction accuracy,which could be applied in practice.
Keyword:
partially stabilized zirconia;stability;prediction;support vector machine;BP neural network;
Received: 2010-12-29
目前, 工业制备部分稳定氧化锆主要是通过向氧化锆中添加氧化物作为稳定剂, 如: CaO, MgO, Y2 O3 等
[1 ,2 ,3 ,4 ,5 ]
, 使之形成完全稳定氧化锆, 破碎后在推板窑或隧道窑中进行热处理来获得。 部分稳定氧化锆与完全稳定氧化锆相比, 具有热膨胀系数低, 抗热震性能好等优点, 广泛地应用于高温侵蚀性介质条件下的抗磨损元件, 如炼用坩埚、 高温熔体流槽、 浇铸口、 热障涂层、 发动机部件等
[6 ,7 ,8 ]
。
稳定率是制备部分稳定氧化锆产品性能的一个重要指标, 直接决定了部分稳定氧化锆产品质量。 而氧化锆的热处理过程是非线性、 多变量、 时变的, 复杂的过程。 在热处理过程中保温温度、 保温时间、 降温速率、 淬火温度、 升温速率、 降温过程等因素都对部分稳定氧化锆的稳定率有着直接的影响。 近年来, 一些预测方法逐渐应用到复杂的冶金及材料的制备过程中, 并在实际生产中得到广泛应用
[9 ,10 ,11 ,12 ]
。
本文对制备部分稳定氧化锆影响因素进行了系统分析, 并采用支持向量机(SVM)和人工神经网络分别建立了热处理制备部分稳定氧化锆的稳定率模型, 并随机选取实验对其稳定率进行了预测, 为制备性能更加优良的部分稳定氧化锆产品提供理论模型及实验依据。
1 实 验
实验选用阿斯创新材料有限公司提供的电熔氧化锆, 其主要化学成分如表1所示。
表1 原料化学成分(%, 质量分数 ) 下载原图
Table 1 Chemical composition of starting materials(%, mass fraction )
表1 原料化学成分(%, 质量分数 )
由表1可见原料为含稳定剂为氧化钙的完全稳定氧化锆, 稳定剂氧化钙的含量为7.1%。
取一定量的原料, 破碎至粒度为10~20 mm, 称取500 g放入电阻炉, 进行热处理。 考察制备部分稳定氧化锆过程中保温温度、 保温时间、 降温温速率、 淬火温度和升温速率等因素对稳定率的影响, 并结合单因素实验方案, 适当调整, 使得尽可能的最大化各因素的影响作用, 因此设计了48组实验方案, 具体方案及实验结果如表2所示。
本文采用工业上普遍认可的“K 值半定量法”计算制备部分稳定氧化锆的稳定率, 其计算公式为:
稳定剂=Intersity of 29.92°/(Intensity of 28.06°+Intensity of 31.24°+Intensity of 29.92°)×100% (1)
式中: Intensity of 29.92°为立方相氧化锆的峰强度; Intensity of 28.06°和Intensity of 31.24°为单斜相氧化锆的峰强度。
表2热处理制备部分稳定氧化锆实验方案及结果
Table 2 Design and results of preparing partially stabilized zirconia
No.
Temper- ature/℃
Holding time/ h
Cooling rate/ (℃·min-1 )
Quenching temperature/ ℃
Heating rate/ (℃·min-1 )
Stability/ %
1
950
4
4
950
4
100
2
1000
4
4
950
4
99.7
3
1050
4
4
950
4
98.6
4
1100
4
4
950
4
98.3
5
1150
4
4
950
4
97.8
6
1200
4
4
950
4
96.9
7
1250
4
4
950
4
95.6
8
1300
4
4
950
4
91.8
9
1350
4
4
950
4
87.5
10
1400
4
4
950
4
82.3
11
1450
4
4
950
4
75.2
12
1450
1
4
950
4
88.7
13
1450
2
4
950
4
82.3
14
1450
3
4
950
4
78.8
15
1450
6
4
950
4
73.5
16
1450
4
1
950
4
57.1
17
1450
4
2
950
4
69.8
18
1450
4
4
950
4
75.2
19
1450
4
6
950
4
84.2
20
1450
4
8
950
4
88.5
21
1450
4
10
950
4
91.3
22
1450
4
20
950
4
93.1
23
1450
4
40
950
4
94.6
24
1450
4
400
950
4
95.8
25
1450
4
4
1450
4
96.5
26
1450
4
4
1400
4
93.9
27
1450
4
4
1350
4
93.1
28
1450
4
4
1300
4
89.3
29
1450
4
4
1250
4
86.1
30
1450
4
4
1150
4
81.7
31
1450
4
4
1100
4
80.4
32
1450
4
4
1050
4
78.5
33
1450
4
4
1000
4
77.1
34
1450
4
4
950
4
75.2
35
1450
4
4
900
4
74.9
36
1450
4
4
850
4
75.6
37
1450
4
4
800
4
75.1
38
1450
4
4
750
4
74.8
39
1450
4
4
700
4
75
40
1450
4
4
400
4
75.3
41
1450
4
4
200
4
75.2
42
1450
4
4
100
4
75.2
43
1450
4
4
50
4
75.1
44
1450
4
4
25
4
75.3
45
1450
4
4
950
1
74.3
46
1450
4
4
950
4
75.2
47
1450
4
4
950
7
75.8
48
1450
4
4
950
10
75.5
2 预测模型
以上述48组实验数据为学习样本, 利用5组实验数据为验证样本, 如表3所示。
2.1BP神经网络学习及改进
BP神经网络主要由输入层、 隐层和输出层组成。 选择隐层神经元个数是BP算法的一个关键, 隐层神经元个数太少, 则网络的自由度不够, 学习空间有欠缺, 容错性差; 隐层神经元个数太多, 自由度过剩, 会使学习时间过长, 误差也不一定最佳
[13 ]
。 本文选择隐层为21层, 所以BP神经网络模型为5×21×1, 如图1所示。
由于标准BP算法的收敛速度很慢, 采用基于数字优化技术对标准BP算法的改进。 Levenberg-Marquardt算法(LM)是牛顿(Newton)法的变异, 具有牛顿法的二次终止性质
[14 ]
。 而BP算法实际上就是要求期望信号与网络输出信号之间的误差平方和达到最小, 因此把LM算法应用到BP算法上是一种很有效的改进途径。
表3验证样本
Table 3 Test samples of model
No.
Temper- ature/℃
Holding time/ h
Cooling rate/ (℃·min-1 )
Quenching temperature/ ℃
Heating rate/ (℃·min-1 )
Stability/ %
1
900
4
4
950
4
100
2
1450
0
4
950
4
95.8
3
1450
4
4
950
4
75.2
4
1450
5
4
950
4
74.5
5
1450
4
4
1200
4
83.5
图1 5×21×1 BP神经网络结构
Fig.1 5×21×1 structure of BP neural network
LM算法用雅可比矩阵来近似代替赫赛矩阵
H =J T J (2)
这时梯度的计算公式为
g =J T e (3)
式中, J 是雅可比s矩阵, 它的元素是网络误差对权值和阀值的l阶倒数; e 是网络的误差向量。 在LM算法中, 网络权值和阀值的调整公式为
x k +1 =x k -(J T J +μI )-1 J T e (4)
当μ 增大时, 梯度的递减量减小。 因此, 当网络的误差减小时, 减小μ 值; 网络的误差增大时, 增大μ 值, 这样就保证了网络的性能函数值始终在减小。
2.2支持向量机学习
支持向量机方法应用于不同领域主要难点集中在核函数与模型参数的选取上
[15 ,16 ]
。 目前, 支持向量机方法中常用的核函数有多项式核函数、 径向基(RBF)函数和Sigmiod函数, 选取普适性较好的径向基(RBF)函数作为预测模型的核函数:
Κ ( x , x j ) = exp ( - | x - x j | 2 σ 2 ) ? ? ? ( 5 )
式中, x 和x j 为样本观测值, σ 2 为RBF函数中的参数。 通过网格化各个参数的取值范围, 利用总误差最小来寻找最优参数。 将3个参数取值空间等分, ε =[0∶0.001∶0.01], C =[0∶1000∶10000], σ =[0.1∶0.1∶3.8], 然后交叉取值, 设计程序计算每组组合参数下支持向量机的预测值, 利用下式来计算总误差, 从而可以优化出稳定率模型的最优参数。
e r r = n ∑ i = 1 ( y i - y ′ i ) 2 ? ? ? ( 6 )
式中, err 为验证样本的总误差; n 为验证样本个数; y i 为样本i 的实际值; y ′i 为样本i 的预测值。
在模型学习之前, 利用下式对实验数据进行归一化处理, 以消除因素之间的单位差异。
x ′ i j = x i j max ( x j ) ? ? ? ( 7 )
式中, x ij 为第i 个样本第j 个因素的观测值; x j 为所有样本第j 个因素的观测值; x ′ij 为第i 个样本第j 个因素归一化后的值。
表4LM-BP神经网络与SVM预测结果与误差
Table 4 Predicted results of LM-BP neural network and SVM and errors
No.
Actual values/%
Predicted values/%
Absolute error
Relative error/%
LM-BP neural network
SVM
LM-BP neural network
SVM
LM-BP neural network
SVM
1
100
100.4
99.0
0.4
1.0
0.4
1.00
2
95.8
91.9
95.6
3.9
0.2
4.1
0.21
3
75.2
75.8
76.2
0.6
1.0
0.8
1.33
4
74.5
74.4
74.4
0.1
0.1
0.1
0.13
5
83.5
85.2
84.1
1.7
0.6
2.0
0.72
图2 LM-BP神经网络及SVM预测值与实际值的比较
Fig.2 Comparison between experiment result and LM-BP neural network and SVM
通过对48组实验数据学习后, 优化出稳定率模型的核函数参数RBF函数σ 值3.5, 惩罚因子C 值10000, 损失函数的参数ε 值0. 0001。
2.3预测结果
分别采用LM-BP神经网络和SVM对上述实验48组数据进行学习, 得到部分稳定氧化锆稳定率模型, 利用模型对5组验证实验样本进行预测, 并与实验值进行比较, 两种预测模型的预测结果及误差如表4所示, 两种模型的预测值与实际测量值的对比如图2所示。
由图2可见, LM-BP神经网络预测部分稳定氧化锆稳定率相对误差最大值为4.1%, 最小值为0.1%, 平均相对误差为1.48%; 验证样本采用SVM预测部分稳定氧化锆稳定率相对误差最大值为1.33%, 最小值为0.21%, 平均相对误差为0.68%。 采用SVM方法比LM-BP神经网络方法预测部分稳定氧化锆的稳定率有更高的准确性。
3 结 论
1. 分别采用LM-BP神经网络和SVM算法建立了制备部分稳定氧化锆稳定率的模型。
2. 通过对验证样本进行预测与实际结果比较表明, 模型具有较好的推广型, 采用SVM预测能较快的建立模型且预测精度较高。
参考文献
[1] Singh A P,Kaur W N,Kumar A.Preparation of fully cubiccalcium-stabilized zirconia with 10 mol%calcium oxide dopantconcentration by microwave processing[J].J.Am.Ceram.Soc.,2007,90:789.
[2] Porter D L,Heuer A H.Microstructural development in MgO-partially stabilized zirconia[J].J.Am.Ceram.Soc.,1979,63:219.
[3] Lin Zhenhan,Lin Gang,Wu Liang,Zhang Lingxi.Phasestructure and transformation of zirconia[J].Chinese Journal ofRare Metals,2003,27(1):49.(林振汉,林钢,吴亮,张玲秀.氧化锆系的相结构和转变[J].稀有金属,2003,27(1):49.)
[4] Shenghui Guo,Guo Chen,Jinhui Peng,Li Jun,Li Dongbo,LiuLijun.Preparation of partially stabilized zirconia from fused zir-conia using roasting[J].Journal of Alloys and Compounds,2010,506:L5.
[5] Wu Yanke,Li Qingbin,Xu Zhigao,Wang Lijun,Xiong Binkun.Reviewof preparation methods of zirconium metal[J].Journalof Rare Metals,2009,33(4):462.(吴延科,李庆彬,徐志高,王力军,熊炳昆.金属锆的制备方法[J].稀有金属,2009,33(4):462)
[6] Lin Zhenhan,Zhang Lingxiu,Lin Gang,Lin Hong,Wu Liang.Study oil particle size of PSZ-3Y powder prepared by spray dr-ying method[J].Chinese Journal of Rare Metals,2001,25(5):336.(林振汉,张玲秀,林钢,林红,吴亮.喷雾干燥法制备PSZ-3Y粉末的粒度研究[J].稀有金属,2001,25(5):336.)
[7] Swain MV,Garive R C,Hannink R HJ.Influence of thermaldecomposition on the mechanical properties of magnesia-stabilizedcubic zirconia[J].J.Am.Ceram.Soc.,1983,66(5):358.
[8] Haque K E.Microwave energy for mineral treatment processes:A brief review[J].International Journal of Mineral Processing,1999,57(1):1.
[9] Chang Ying,Li Xibin.Preparation of ZrO2spherical nanometerpowder[J].J.Cent.South Univ.(Science and Technology),2007,38(1):46.(常鹰,李溪滨.球形纳米氧化锆粉末的制备[J].中南大学学报:自然科学版,2007,38(1):46.)
[10] Tomasz Wiltowski,Krzysztof Piotrowski,Hana Lorethova,LuborStonawski Kanchan Mondal,Lalvani S B.Neural network ap-proximation of iron oxide reduction process[J].Chemical Engi-neering and Processing,2005,44:775.
[11] Selvakumar N,Ganesan P,Radha P,Narayanasamy R,PandeyK S.Modelling the effect of particle size and iron content onforming of Al-Fe composite preforms using neural network[J].Materials and Design,2007,28:119.
[12] Yuan Ping,Li Yan,Mao Zhizhong.Detection based on copperelectrolytic support vector machine interpolation for composition[J].J.Northea.Univ.(Natural Science),2008,29(2):174.(袁平,李妍,毛志忠.基于支持向量机插值的铜电解液成分检测[J].东北大学学报,2008,29(2):174.)
[13] Li Tesheng.Applying wavelets transform,rough set theory andsupport vector machine for copper clad laminate defects classifica-tion[J].Expert Systems with Applications,2009,36:5822.
[14] Yuan Cengren.Artificial Intelligence Principles and Applica-tions[M].Beijing:Tsinghua University Press,1999.(袁曾任.人工神经网络及其应用[M].北京:清华大学出版社,1999.)
[15] Huang Haocai,Huang Yijian,Yang Guanlu.Neural networksystem identification based on levenberg-marquardt algorithm[J].Modular Machine Tool and Automatic Manufacturing,2003,(2):6.(黄豪彩,黄宜坚,杨冠鲁.基于LM算法的神经网络系统辨识[J].组合机床与自动化加工技术,2003,(2):6.)
[16] Vapnik V.The Nature of Statistical Learning Theory[M].NewYork:Springer-Verlag,1995.
[17] lvaro Barbero,Jorge Lpez,JosR,Dorronsoro.Cycle-break-ing acceleration of SVM training[J].Neuroco-Mputing,2009,72:1398.