稀有金属 2009,33(02),191-195 DOI:10.13373/j.cnki.cjrm.2009.02.028
基于均匀设计和主成分分析的粘结NdFeB永磁体制备工艺优化研究
查五生 刘锦云 王向中 周晓庆 刘桂明
西华大学材料科学与工程学院
摘 要:
基于粘结NdFeB永磁体制备工艺优化实验, 针对普通反向传播神经网络 (BPNN) 方法在预报建模中普遍存在“过拟合”和泛化能力差的问题, 从优化实验方案、减少输入层节点数两个角度, 结合均匀设计软件和主成分分析方法, 提高训练样本的分布均匀性、“主动”改善网络结构, 建立了一个粘结NdFeB永磁体制备工艺优化的2-5-3型BPNN预测模型。研究结果表明, 改进的BP神经网络模型对Br, Hc j及 (BH) m预测的相对误差的最大值分别为1.83%, 1.28%和1.53%, 较之传统的模型, 泛化能力显著提高, 网络预测也比较稳定, 具有很好的实用性。
关键词:
均匀设计 ;主成分分析 ;BP神经网络 ;粘结NdFeB永磁体 ;泛化 ;
中图分类号: TM273
作者简介: 查五生 (E-mail:zhawusheng684@hotmail.co) ;
收稿日期: 2008-05-15
基金: 四川省教育厅重点项目 (2004A110) 资助;
Preparation Crafts Optimizing of Bonded NdFeB Permanent Magnet Based on Uniform Design and Principal Component Analysis
Abstract:
Based on the optimized preparation process of bonded NdFeB magnets, a 2-5-3 BPNN prediction model was built for the bonded NdFeB magnets, which aimed at the problem of the overfitting and generalization error of the general BP neural network method for model-building and forecasting, combined uniform design to improve the uniformity of training sample with principal component analysis to reduce nodes of input layer so as to improve the network structure.The results showed that the maximum relative errors of the improved BPNN model for Br, Hcj and (BH) m were 1.83%, 1.28% and 1.53% respectively, compared with the conventional model, the generalization ability was improved greatly and the forecast results were more reliable.
Keyword:
uniform design;principal component analysis;BP neural network;bonded NdFeB permanent magnet;generalization;
Received: 2008-05-15
Nd-Fe-B系粘结永磁材料制备工艺优化研究具有重要的技术和经济意义。 如果能够确定材料磁性能和制备工艺因素之间的数学关系, 就可以在不了解材料内部详细机制的情况下, 依据这种数学关系探索材料的最优制备工艺, 寻求最佳的材料性能。
但影响粘结NdFeB永磁体磁性能的制备工艺因素很多, 且这些因素之间互相影响、 互相制约, 呈现高度的非线性关系, 使用常规的建模方法很难为其建立一个完整精确的数学模型。 而神经网络的发展为这一问题的解决提供了一条可靠有效的途径。
众多研究已证明, 一个三层的前馈网络能够实现任意精度的连续函数映射。 误差反向传播神经网络 (BPNN) 是一种前馈式全连接多层神经网络, 利用它可以训练、 建立一个材料性能与制备工艺间的BPNN预测模型, 通过对未参加训练的样本进行预测 (泛化) , 从而寻求出最佳的制备工艺。
但是, 在实际的应用中, 要想达到这种效果, 依据神经网络的理论, 即要求建立的预测模型具有良好的泛化能力。 神经网络的泛化能力指的是网络识别训练集合以外样本的能力, 它被认为是衡量神经网络性能的最重要的指标。 目前, 普通的反向传播 (BP) 神经网络方法在预报建模中普遍存在着“过拟合”现象, 导致网络泛化能力低。 针对这一问题, 本文尝试从提高训练样本分布均匀性、 “主动”改善网络结构两个角度, 结合均匀设计软件和主成分分析方法, 来改进BP神经网络模型的泛化能力, 并与一般的BP建模结果做了比较。
1 粘结NdFeB磁体的均匀设计实验
1.1 均匀设计简介
均匀设计是我国数学家方开泰、 王元根据数论提出的一种最新的实验设计技术, 主要特点是实验点均匀分布在整个实验域中, 较之普通的单因素轮换法和正交实验法, 其实验点拥有更高的均匀分散性和代表性, 即可用最少的实验次数获得大量的实验信息, 适用于多因素、 多水平的实验设计
[1 ]
。
1.2 均匀设计实验方案与结果
影响粘结磁体性能的制备工艺因素很多, 本文在其他条件相同的情况下, 研究粘结剂含量、 固化温度、 固化时间以及单位压制力大小四个工艺参数对磁体性能的影响, 每个因素分别取6个水平, 其因素水平设置如表1所示。 使用的磁粉是由市场上购得的NdFeB磁粉, 采用的粘结剂为环氧树脂, 它是各类型粘结剂中性能最好的一种, 固化剂使用的是顺丁烯二酸酐, 它具有固化速度快的特点
[2 ,3 ,4 ]
。
均匀设计是只考虑试验点在实验范围内均匀分布的一种实验设计方法, 和正交设计相似, 也是通过一套精心设计的方案表来进行实验设计, 在应用中可直接查用, 本文采用U18 (64 ) 均匀设计表来安排实验, 实验方案及结果如表2所示。
2 BP神经网络预测模型的建立
2.1 主成分分析原理 [5]
主成分分析 (PCA) 又叫主元分析, 是系统降维和特征提取的一种基本方法, 通过线性变换, 设法将原来众多具有一定相关性的指标 (例如m 个指标) , 重新组合成一组新的互相无关的综合指标来代替原来的指标。 其实质是将分散在一组变量上的信息集中到某几个综合指标 (主成分) 上的探索统计分析方法。 主成分分析后提取的每个新的综合因子都是原来多个指标的线性组合, 并且因子变量之间是相互正交的, 即: 对应m 个变量的n 个主成分关系为:
f 1 = a 1 1 x 1 + a 2 1 x 2 + ? + a m 1 x m ? ? ? ? ? ? ? ? ? ? ? ? f n = a 1 n x 1 + a 2 n x 2 + ? + a m n x m ? ? ? ( 1 )
其中, (a 1i , a 2i , …, a mi ) 分别是变量相关阵的前n 个特征根对应的特征向量。 f 1 , f 2 , …, f n 的方差分别是这n 个特征根λ 1 ≥λ 2 ≥…≥λ n (a i 1 , a i 2 , …, a in ) ′。 是第i 个变量在各个主成分上的载荷。 而实际上载荷往往是指
( a i 1 √ λ 1 , a i 2 √ λ 2 , ? , a i n √ λ n )
, 它是第i 个变量在各个标准化成分上的载荷。 因此根据最小二乘法就可解得标准主成分得分。 本文采用SPSS统计软件的主成分分析功能对输入变量进行主成分分析。
表1 实验影响因素与水平表
Table 1 Levels of experimental impact factors
Experimental factors
Binder content/ (%, mass fraction)
Thermosetting time/h
Thermosetting temperature/℃
Pressure/ MPa
Levels
1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0
0.5, 1.0, 1.5, 2.0, 2.5
100, 125, 150, 175, 200
127.3, 159.1, 190.9, 222.7, 254.6
表2 均匀设计实验方案及结果
Table 2 Experimental project and results on uniform design
No.
Binder content/ (%, mass fraction)
Thermosetting temperature/℃
Thermosetting time/h
Pressure/ MPa
B r / T
H ci / (kA·m-1 )
(BH ) m / (kJ·m-3 )
U1
2.5
165
0.50
203.7
0.569
775.9
51.2
U2
1.0
120
1.25
178.2
0.555
773.0
48.6
U3
3.0
150
1.75
178.2
0.548
773.5
48.3
U4
1.5
165
1.75
152.8
0.520
760.9
43.9
U5
2.0
105
1.50
178.2
0.546
780.8
48.5
U6
1.5
105
1.00
203.7
0.542
768.6
47.3
U7
3.5
165
1.00
254.6
0.566
746.9
49.9
U8
3.0
105
0.75
229.1
0.567
779.7
52.0
U9
2.5
135
1.00
152.8
0.539
793.2
47.5
U10
3.0
180
1.25
127.3
0.518
759.3
42.7
U11
2.0
150
1.25
229.1
0.559
761.3
49.3
U12
1.0
180
1.50
229.1
0.560
757.3
48.4
U13
1.0
150
0.75
127.3
0.521
774.8
44.1
U14
1.5
135
0.50
254.6
0.569
777.6
52.4
U15
2.5
120
1.75
254.6
0.572
785.9
52.5
U16
2.0
180
0.75
127.3
0.569
776.3
49.4
U17
3.5
120
0.50
152.8
0.536
771.8
46.9
U18
3.5
135
1.50
203.7
0.550
777.9
48.8
2.2 BP神经网络方法 [7,8,9,10]
目前, 在多种人工神经网络模型中, 误差反向传播的多层前向 (BP: Error Back Propagation) 神经网络以其强大的非线性映射和泛化能力而得到最为广泛地应用。 其基本算法原理参见文献
[
6 ]
。 BPNN学习算法的训练过程可简单归结为: (1) 初始化权值w ij 、 阈值θ j , 设定总体的收敛误差ε ; (2) 输入训练样本、 学习训练网络, 计算网络实际输出与期望输出的误差, 并根据误差反向传播调整网络各层的权值和阈值, 如此反复调整, 直至误差E <ε ; (3) 网络训练完成后, 输入检测样本对其进行检验, 若此时输出误差E 2 <ε 2 (检验误差) , 则该网络可用于实际预测。
目前, 普通的BP神经网络方法在预报建模应用中, 主要普遍存在着“过度拟合”、 泛化性能差及网络结构难以确定等问题, 本文基于Nd-Fe-B系永磁材料制备工艺优化研究实验, 详细探讨了上述存在的问题。
2.3 基于主成分分析的BPNN预测模型建立
2.3.1 输入样本的主成分分析处理
考虑到BPNN训练样本在整个实验域内的覆盖面及检验样本的代表性, 建模时取表2中序号为U3, U6, U9, U12的四组数据作为检验样本, 剩下的14组数据作为训练样本。 从表2的实验结果可知, 本文欲建立的BPNN磁体性能预测模型输入层为4个节点 (磁体制备的4个工艺参量) , 输出层为3个节点 (磁体的三个性能指标) 。 但由于四个工艺参量之间存在着一定的相关性, 因此在作为训练样本训练时必然会给网络带来许多噪声, 从而影响网络最终的预测 (泛化) 能力。
本文采用主成分分析方法, 对输入的4维数据进行降维去噪处理, 减小网络的结构规模, 以提高网络的泛化性能。
首先对原始数据进行标准化处理, 得到均值为0、 标准差为1的新输入数据, 再由SPSS软件分析得到如3所示的相关系数矩阵, 从表中信息可以看到, 各因子之间都在一定程度上存在着信息重叠现象, 如直接按原来的因子输入网络的话, 很容易造成信息之间的相互干扰, 影响网络的预测精度和稳定性。
但经分析同时也知道, 4个原彼此相关的输入因子可以变换成为彼此线性无关的两个新主成分因子f 1 , f 2 , 它们对应于各因子x i 的得分情况如表4所示。
表3 因子相关系数矩阵
Table 3 Factor correlation coefficient matrix
Factors
Binder content (x 1 )
Thermosetting temperature (x 2 )
Thermosetting time (x 3 )
Pressure (x 4 )
x 1
1.000
-0.012
-0.029
0.237
x 2
-0.012
1.000
-0.076
-0.358
x 3
-0.029
-0.076
1.000
0.076
x 4
0.237
-0.358
0.076
1.000
根据得分表4, 由公式 (1) 有:
f 1 =0.305x 1 -0.490x 2 +0.160x 3 +0.575x 4 (2)
f 2 =0.653x 1 +0.281x 2 -0.662x 3 +0.078x 4 (3)
据此可以计算出主成分f 1 , f 2 , 从而将原4维输入矩阵转为2维, 达到降维的目的。
2.3.2 神经网络隐层节点数的确定
在确定了BPNN的输入矢量矩阵后, 隐含层节点数的确定采用式 (4) 的方法:
h = √ p + t + α ? ? ? ( 4 )
训练结果发现: 当隐含层节点数取较小的3, 4时, 网络训练易陷入“局部最小”; 但若取较大的节点数 (≥7) 时, 网络的预测 (泛化) 能力又会明显的下降。 因此, 比较决定: 最终将BPNN隐含层节点数定为5, 其2-5-3的网络拓扑结构如图1所示。
表4 主成分得分表
Table 4 Principal component scores
Factors (x i )
Principal component (f 1 )
Principal component (f 2 )
x 1
0.305
0.653
x 2
-0.490
0.281
x 3
0.160
-0.662
x 4
0.575
0.078
图1 BPNN拓扑结构
Fig.1 BPNN topology
表5 磁体性能预测值和实测值对比及误差
Table 5 Contrast and error of magnetic properties between their measured value (Mea.) and predicted value (Pre .)
No.
Predicted results based on uniform design and principal component analysis
B r /T
Error/%
H cj / (kA·m-1 )
Error/%
(BH ) m / (kJ·m-3 )
Error/%
Mea.
Pre.
Mea.
Pre.
Mea.
Pre.
U3
0.548
0.552
0.69
773.5
763.6
1.28
48.6
48.7
0.21
U6
0.542
0.552
1.83
768.6
777.6
1.17
47.3
47.9
1.27
U9
0.539
0.540
0.14
793.2
793.9
0.09
47.5
48.2
1.53
U12
0.56
0.551
0.57
757.3
759.2
0.25
48.4
48.1
0.53
No.
Predicted results based on the general BPNN
B r /T
H cj / (kA·m-1 )
(BH ) m / (kJ·m-3 )
Mea.
Pre.
Error/%
Mea.
Pre.
Error/%
Mea.
Pre.
Error/%
U3
0.548
0.542
1.01
773.5
799.6
3.37
48.6
48.3
0.54
U6
0.542
0.558
2.98
768.6
752.3
2.12
47.3
46.5
1.69
U9
0.539
0.532
1.23
793.2
799.9
0.85
47.5
48.6
2.38
U12
0.56
0.555
0.90
757.3
750.0
0.31
48.4
47.9
1.12
3 结果与讨论
3.1 预测结果分析
为对比显示基于均匀设计和主成分分析建立的 BPNN预测模型的优越性, 本文在将U3, U6, U9, U12 4组数据作为检验样本检测训练好的网络的同时, 还另外分析了——未经实验方案优化和输入数据主成分分析的普通BP建模方法预测的结果情况, 并将两者作了比较, 对比结果及相对误差见表5。
从表5可以看出, 改进的BPNN预测模型对B r 预测的相对误差的最大值为1.83%; 对H cj 及 (BH ) m 预测的相对误差的最大值分别为1.28%和1.53%, 在此误差里是网络预测模型各项预测结果可以承受的范围, 且这对比利用一般神经网络建模方法建立的BP预测模型预测的结果: 2.98%, 3.37%和2.38%, 预测精度明显要高许多。 因此, 基于均匀设计和主成分分析方法改进的粘结NdFeB永磁体性能预测模型, 较之一般的BPNN建模方法建立的模型具有更好的预测 (泛化) 能力。
3.2 网络预测稳定性分析
泛化问题是BPNN预测模型能否应用于实际问题的关键, 而泛化问题的关键又是泛化结果稳定与否的问题
[11 ,12 ]
。 基于这一原则, 本文通过10次的训练实验, 最后任意取U3, U6, U9及U12四组数据预测结果中的剩磁B r 一项绘图, 得出如图2所示的相对误差变化情况图。
从图中可以看到, 尽管网络每次训练时的初始值不同, 但4组数据预测结果的相对误差基本都在一定范围内稳定变化。 这表明, 本文基于均匀设计和主成分分析建立的NdFeB粘结磁体性能BPNN预测模型, 预测 (泛化) 结果稳定性较好, 完全可以应用于进一步的制备工艺优化研究。
图2 相对误差变化情况图
Fig.2 Changes of relative error
4 结 论
1. 结合均匀设计软件和主成分分析方法, 从优化实验方案、 减小网络结构两方面入手, 研究了小样本情况下, 如何有效改进BPNN预测模型泛化能力的问题。 结果表明, 该方法建立的模型较之传统的BPNN建模方法得出的模型具有更好的预测 (泛化) 能力。
2. 通过分析绘图, 研究了在每次训练初始值不同的情况下, 网络预测结果稳定与否的问题。 结果表明, 本文建立的BPNN预测模型预测 (泛化) 结果稳定, 具有很好的实用性。
3. 将基于均匀设计和主成分分析方法改进建立的BP神经网络模型, 应用于传统的磁性材料制备工艺优化研究, 能够相对精确地预测得到更多实验结果, 缩短了实验周期、 减少了工作量, 为提高磁体制备工艺优化设计效率提供一种新的技术手段。 但该方法在训练建模中存在的“局部最小化”, 即网络收敛性问题, 也是今后研究工作必须解决的一个难题。
参考文献
[1] 袁军, 曾鹰, 韩江雪.均匀设计和神经网络优化高固量聚丙烯酰胺的合成工艺[J].武汉工程大学学报, 2007, 29 (3) :26.
[2] 刘锦云, 王克强, 陈良辉, 查五生.固化温度和时间对快淬粘结磁体性能的影响[J].稀有金属, 2006, 30 (2) :138.
[3] 沈文娟, 王宝奇, 谷南驹, 于文英.NdFeB粘结磁体性能影响因素的研究[J].河北工业大学学报, 2003, 32 (4) :82.
[4] 孙爱芝, 李智伟, 韩景智, 李涛, 张正义, 肖耀福.用模压成型方法制备HDDR粘结NdFeB磁体的成型性研究[J].中国稀土学报, 2002, 20 (3) :231.
[5] 金龙, 况雪源.人工神经网络预报模型的过拟合研究[J].气象学报, 2004, 62 (1) :62.
[6] Wu Yan, Zhang Liming.A new regularization learning methodfor improving generalization capability of neural network[A].Proceedings of 4th world congress on intelligent control and auto-mation, Shanghai[C].2002, 3:2011.
[7] 黄渝鸿, 吴菊英, 朱正吼, 付强, 梅军, 郭静, 马广斌.基于Fe73.5Cu1Nb3Si13.5B9非晶/纳米晶粉的压磁复合材料研究[J].稀有金属, 2008, 32 (2) :165
[8] Chen Gang, Yang Xiaoling, Gao Danying, Ni Jiansen, Xu Hui, Zhou Bangxin.Cathode electrophoretic technology for bondedNdFeB permanent magnet[J].Transactions of Nonferrous MetalsSociety of China, 2006, 16 (A02) :93.
[9] 周开利, 康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社, 2005.7.
[10] 杨伟, 倪黔东, 吴军基.BP神经网络权值初始值与收敛性问题研究[J].电力系统及其自动化学报, 2002, 14 (1) :20.
[11] Yu Shiwei, Zhu Kejun, Diao Fengqin.A dynamic all parame-ters adaptive BP neural networks model and its application on oilreservoir prediction[J].Applied Mathematics and Computation, 2006, 195 (1) :66.
[12] Karlik Bekir.A neural network image recognition for control ofmanufacturing plant[J].Mathematical and Computational Appli-cations, 2003, 8 (1-3) :181.