文章编号:1004-0609(2007)12-1948-07
PLS-BPN法用于7005铝合金力学性能与
工艺参数的定量研究
方善锋,汪明朴,王正安,齐卫宏,李 周
(中南大学 材料科学与工程学院,长沙 410083)
摘 要:用偏最小二乘法(PLS)结合反向传播人工神经网络(BPN)方法对7005铝合金力学性能与工艺参数之间的关系进行定性分析和计算。结果表明:用PLS法对实验数据作模式识别优化处理的结果与实验很吻合,能够指明该合金工艺参数优化的方向;用BPN定量计算的结果与实验测定值符合也较好;将PLS与BPN法有机地联系起来,有利于克服过拟合,提高BPN预报的准确性。用留一(LOO)交叉验证法分别对3种模型PLS、BPN和PLS-BPN的合金性能预报结果进行验证,其中PLS-BPN模型预测的均方根误差(RMSE)和平均相对误差(MRE)均最低,更适合于7005铝合金性能预报。
关键词:7005铝合金;偏最小二乘法(PLS);神经网络(BPN);PLS-BPN;留一(LOO)交叉
中图分类号:TG 146.2+1 文献标识码:A
Quantitative study between mechanical properties and
processing parameters for 7005Al alloys predicted
using PLS-BPN method
FANG Shan-feng, WANG Ming-pu, WANG Zheng-an, QI Wei-hong, LI Zhou
(School of Materials Science and Engineering, Central South University, Changsha 410083, China)
Abstract: The mechanical properties of 7005 Al alloys were qualitatively analyzed by partial least squares(PLS) method and quantitatively calculated by using back propagation artificial neural network(BPN) with the same processing parameters as features. The calculated results are in agreement with experimental ones basically. In order to solve the overfitting problem, a novel method hybridizing PLS and BPN to forecast the mechanical properties of the alloys was proposed and tested. PLS method can compute the scores for the principal components according to the sorts of components and thus compress the input data for BPN with linear arithmetic. The forecasting performances were compared with each other by using leave-one-cross-validation(LOOCV) among three models, i.e. the hybrid model(PLS-BPN), BPN model and PLS model. The root mean squared error (RMSE) and the mean absolute relative error (MRE) of PLS-BPN are the lowest. Consequently, the hybrid model is more suitable to forecast the mechanical properties of the alloys.
Key words: 7005Al alloys; partial least squares(PLS); back propagation network(BPN); PLS-BPN; leave-one-cross (LOOC)
铝制列车因其减震性好、耐蚀性好、运行性好、维修费低等优点为当今世界各国竞相研制和生产。研制铝车,寻找一种高强、挤压性好、耐蚀性强的车体、底架、框架大型材用铝合金尤为关键[1-3]。研究表明,7005铝合金中加入适量Mn、Cr、Zr等微量元素可以有效提高合金的再结晶温度和可焊性,得到综合性能较为优异的合金[4-7],它是铝制车辆牵引梁较为理想的材料。目前,对7005铝合金研究大多集中在实验研究,这对发展该合金无疑非常重要,但采用计算机模拟技术对合金成份、工艺过程和性能的关系进行预报,会大大减少实验研究的工作量。近年来,模式识别或人工神经网络法用于计算机辅助新材料的研制,特别是材料设计中的工艺优化工作已取得较大的进 展[8-11]。李劼等[12]采用GA-BP对NiFE2O4基金属陶瓷阳极进行优化设计,优化设计结果与实验值接近。陈丙珍[13]将人工神经网络用于过程工业中,并展示了该方法在流程工业综合自动化中的良好应用前景。周古为[14] 等将人工神经网络用于7055铝合金二次时效性能预测,建立了二次时效热处理工艺与显微硬度的神经网络模型。 然而,将偏最小二乘法与人工神经网络法有机地联系起来,并采用严格的留一交叉验证法,建立能够预报铝合金成份、工艺过程和性能之间的关系的更精确的数学模型还未见报道。
本文作者以综合性能较为优异的7005铝合金为例,用模式识别结合人工神经网络法,对该合金在线挤压淬火工艺和随后的时效工艺对合金力学性能的影响进行了定性分析和定量计算,以期对该合金成份、工艺过程和性能之间的关系进行预报。
1 模式识别—人工智能优化原理
BPN(人工神经网络中的误差反向传播网络)具有对环境变化较强的自适应学习能力,具有独特的结构和计算方法,理论上可以实现以任意函数逼近所求问题的论域,因此它能够建立以权重描述变量与目标之间复杂的非线性关系,其中最重要的一个任务是减少独立变量数以克服过拟合现象。传统的模式识别方法有主成分分析(PCA)、最优判别平面(ODP)和偏最小二乘法(PLS)等。PCA有极强的压缩数据能力,用它压缩的主成分输入BP网络,所建的模型(PCA-BPN)能达到较高的预测精度,首先被广泛应用。但PCA在成分提取上完全不考虑因变量,只单独考虑对自变量的成分提取,这样得到的成分,虽然对自变量系统有很强的概括能力,但缺乏对因变量的解释能力,而P LS在这一点上是优于PCA的,在成分的提取上兼顾了自变量和因变量的影响。因此,我们建立了以P LS为基础的人工神经网络算法(PL S-B PN)。PLS-BPN与BPN的一个重要区别是只有较小的噪声的部分,即PLS的部分得分被作为BPN的输入元素,而不是所有的原始变量。这种处理方法使用了原始变量的一些正交函数,滤出了输入元素的部分噪声,并降低所研究问题的维数,减少了 BP 网络的输入层节点数目,起到了简化网络结构,增强网络稳定性的作用,并且具有BPN的非线性建模能力和普适性。
设输入数据构成矩阵X∈Rn×l,输出数据构成矩阵Y∈Rn×m,其中n为样本的总数,l为特征变量数,m为输出目标变量数。然后采用如下非线性迭代形式的PLS算法[15-17]进行建模:
全面分析影响7005铝合金的性能的工艺条件,以这些工艺条件为特征变量,构成高维模式空间,通过 P LS 提取适当的主成分T=ti (i=1, 2, ???, h), T作为神经网络模型的输入,最后以因变量即7005铝合金的性能或样本类型作为神经网络的输出。计算中我们使用了Matlab7.0软件,硬件Pentium IV CPU (2.8 GHz),内存512MB RAM。
2 结果与讨论
2.1 7005铝合金力学性能的定性分析
实验数据取自本课题组的研究成果,合金成分为Al-3.24Zn-1.7Mg-0.32Mn-0.24Fe,一共26个实验样本,如表1所示。由于采用了正交实验设计方法,所以我们的实验数据很有代表性。经过数据的预处理后,以挤压温度(X1)、挤压速度(X2)、淬火方式(X3)和时效条件(X4)等4个工艺条件为特征变量,可构成4维模式空间。淬火方式中1表示水淬,2表示风淬。采用二级时效,时效工艺105 ℃,8 h(预时效)+155 ℃,4 h,8 h,16 h(二次时效)。模式识别的目标变量分别为抗拉强度(σb)、屈服强度(σ0.2)、硬度(HB)和样本类型。利用偏最小二乘法(PLS),对表1中的数据作模式识别优化处理,得到一系列的模式识别二维分类图及其数学模型。在图1中,○表示第二类样本,⊕表示第一类样本。
表1 7005Al合金力学性能实验值和B PN、PL S-B PN模型预测值的比较
Table 1 Comparison of BPN and PLS-BPN models predicted data with experimental data of 7005 Al alloy
图1 机械性能和多目标在得分矢上的分布(PLS)
Fig.1 Distribution of mechanical properties and multiobjection calculated by using PLS: (a) Distribution of σb,⊕: σb≥330 MPa, ○: σb<330 MPa; (b) Distribution of σ0.2,⊕: σ0.2≥225 MPa, ○: σ0.2<225 MPa; (c) Distribution of HB, ⊕: HB≥90, ○: HB<90; (d) Distribution of multiobjection,⊕: σb≥330 MPa, σ0.2≥220 MPa, HB≥90, ○: Others
2.1.1 不同目标变量的模式识别分类图
将抗拉强度σb≥330 MPa的样本作为第一类,其它为第二类,用偏最小二乘法(PLS)进行计算,以第一得分矢T1=-0.622 X1-0.125 5 X2+0.041 6 X3-0.771 8 X4对第二得分矢T2=0.479 9X1+0.475 2X2+0.506 8 X3- 0.541 9 X4作图,结果如图1(a)所示。图上优类(第一类)样本映照在横坐标(第一得分矢)增大的方向,纵坐标 (第二得分矢)对分类贡献甚微,可忽略。抗拉强度(σb)主要受挤压温度和时效条件的影响,降低挤压温度,缩短二级时效时间,略微减小挤压速度,有利于7005铝合金抗拉强度的提高。如在风淬条件下,若挤压速度和时效时间相同时,从表1可以看出,降低挤压温度,σb与σ0.2一般要提高5~15 MPa。
以屈服强度σ0.2≥225 MPa的样本为第一类,其它为第二类,用PLS方法计算,以第一得分T1=0.110 7 X1-0.902 8 X2+0.060 3 X3-0.411 X4对第二得分矢T2=0.883 3 X1-0.107 9 X2+0.517 2 X3-0.164 2 X4作图,结果如图1(b)所示。可见两类样本基本处于不同的区域,仅有属于第一类的No.7和No.23样本位于第二类样本的区域中。屈服强度主要受挤压速度的影响,时效条件对σ0.2的影响也较显著,减小挤压速度和缩短二级时效时间将有利于7005铝合金屈服强度的提高。从表1还可以看出,若挤压温度、淬火方式、时效条件相同,挤压速度从5 m/min降低到1 m/min,σb与σ0.2提高约20~50 MPa。
以硬度HB≥90的样本为第一类,其它为第二类,用PLS方法计算,以第一得分矢T1= -0.584 0 X1-0.058 8 X2+0.024 2 X3-0.809 3 X4对第二得分T2=0.532 8 X1+0.525 0 X2+0.413 6 X3-0.527 7X4作图,结果如图1(c)所示。可见两类样本基本能够分开,硬度主要受挤压温度和时效条件的影响,降低挤压温度和缩短二级时效时间将有利于7005铝合金硬度的提高。
2.1.2 多目标变量的模式识别优化分析
对上述3个力学性能指标综合考虑,以同时满足下列3个指标规定的为第一类样本:抗拉强度σb≥330 MPa,σ0.2≥220 MPa,HB≥90,否则为第二类。用PLS方法计算,以第一得分矢T1=-0.590 3 X1-0.128 1 X2+0.035 0 X3-0.796 2 X4对第二得分矢T2=0.355 4 X1-0.927 6 X2+0.049 4 X3-0.104 1 X4作图,结果如图1(d)示。可见两类样本完全能够分开,降低挤压温度、缩短二级时效时间(4~8 h)、略微减小挤压速度、采用风淬将更有利于获得综合性能优异的7005铝合金。而且,挤压温度和时效条件是影响7005铝合金力学性能的2个重要因素,在时效条件相同的条件下,挤压温度低 ( 如440 ℃ )更易获得较高的力学性能 ;在挤压温度确定的条件下,适当减少二级时效时间 (如由 155 ℃、16 h 降至 155 ℃、6~8 h),反而有利于提高合金的力学性能。其主要原因在于:挤压温度过高( 如大于480 ℃ )或二级时效时间过长(如155 ℃、16 h)时,易产生晶粒反常长大或过时效,导致合金力学性能的下降。另外,较高的挤压速度和更快的淬火速度也易使合金产生过时效,因此在实际生产中是不宜采用的。
2.2 7005铝合金力学性能的定量计算
首先,我们将表1中的实验数据标准规范化,并构造一个以4个特征变量为输入元,3个性能指标为输出元的3层神经网络。隐层神经元采用t a n si g 型传递函数,输出层神经元采用purelin型传递函数,训练算法采用Levenberg Marquardt 算法,神经网络性能指标为0.005。
为了减小过拟合,并且使构建的网络具有更好的泛化能力,我们用留一(LOO)交叉验证法检验了神经网络的性能,用最小预报误差来确定BPN模型的隐层节点数为5个,计算结果如表2所列。留一法(LOO)具体计算如下:设已知样本集含N个样本,M个目标变量,对给定的隐节点数目k,进行N次处理。每次
表2 不同隐节点数(k)用留一(LOO)交叉验证法的BPN和PLS-BPN预报结果的比较
Table 2 Comparison of predicted and fitting error for BPN and PLS-BPN models by using leave-one-cross-validation (LOOCV) under different hidden knots(k)
从N个样本中随机取出N-1个样本用于训练网络,留下的1个用于预报网络的性能。定义拟合误差函数为
定义预报误差函数为
式中 是第i个样本第j个目标的拟合值,yij是对应的实际值,是第p个样本第j个目标的预报值,yj是对应的实际值,k为隐节点数。对每个隐节点数,我们都进行10次计算,分别计算SSE(k)和SSEP(k)的平均值,用具有最小平均SSEP(k)的k个节点将建立BP网络结构。神经网络计算结果如表1所示,可见,定量计算结果与实验测定值符合较好,神经网络计算的平均相对误差(MRE)分别为1.996%(σb)、3.864% (σ0.2)和1.738%(HB),用下述公式计算平均相对误差:
对于工业优化,BPN有如下的缺点:1) 虽然神经网络模型能够较好地处理一般回归模型不能解决的非线性问题,但神经网络的性能会因为输入变量的线性相关变得较差,输入变量的严重相关性使得网络的输入矩阵处于病态,网络的求解会变得不稳定且收敛速度很慢;2) 由于工业过程变量多,输入节点太多,函数关系尤其复杂,难于建立贴切的网络结构;3) 易出现过拟合现象(Over-fitting),即虽可相当好地拟合训练样本集,却不能正确地预测非训练样本。针对这种情况,我们引入了基于PLS的模式识别方法,为BPN提供改善了的输入神经元(即令输入神经元是原变量的函数,且数目减少),因而能用更简单的网络结构来建立理解的知识所对应的非线性函数。
取前3个PLS成分为输入元,用留一(LOO)交叉验证法计算神经网络的性能,用最小预报误差来确定PLS-BP模型的隐节点数为5个,计算结果如表2所列。从表2可见,BP和PLS-BP的拟合精度都随隐层节点数的增加而提高,而预报误差有一个最低点,即k=5时2种算法的SSEP(k)的10次计算的平均值有最小值。在隐层节点数相同时,PLS-BP比BP的拟合误差大,而预报误差小,对于个别隐层节点数,2种算法的SSEP(k) 平均值相近。因此,PLS-BP模型对克服过拟合是非常有效的。
为了说明PLS-BP模型的优越性,我们将PLS、BPN和PLS-BPN 3种模型作了进一步的比较,计算结果如表3所列。定义留一(LOO)法预测的平均方差的平方根RMSE(root mean squared error)为
表3 3种算法用留一(LOO)交叉验证法预报的RMSE和MRE的比较
Table 3 RMSE and MRE for three models predicted by using leave-one-cross-validation(LOOCV)
表3中神经网络(BPN)及偏最小二乘回归(PLS) 计算的RMSE和MRE都是10次计算的平均值。从表3可以看出,单独的神经网络比单独偏最小二乘回归好,说明影响7005铝合金性能的各工艺因素间存在着多重线性相关。神经网络对于预测7005铝合金性能与各工艺参数之间复杂的非线性系统的效果是显著的,而PLS-BP模型能够比较好地处理性能与各工艺参数变量之间相关性和非线性问题,因此在3种模型中具有最好的预报精度。另外,我们也比较了3种模型用留一(LOO)法预测的抗拉强度(σb)和硬度(HB),如图2所示,可见PLS-BP模型的性能预测值与实验测量值最为接近,该模型的泛化能力也最强,该结果进一步验证了我们的结论。
将4个特征变量转换成PLS得分,取前3个PLS成分为输入元,单隐层含4个节点,以样本类型为输出,构造反传人工神经网络BPN,用表1中的样本训练网络,拟合结果无一有误,表明可在高维空间直接研究优化信息,该PLS-BPN分类神经网络可用来检验样本的类型属性。用模糊C-Means(FCM)聚类技术对上述两类样本进行计算,得到第一类中心为(460,1,1,4),第二类中心为(480,3,2,16)。用该PLS-BPN分类神经网络,预报第一类中心对应的样本模式的目标值是1.003 2,第二类中心的目标值是1.999 3,表明两类中心确能分别反映各自样本类型的性质。因此,第一类中心对应稳定的优化样本模式,处于高维优化空间的中心,它所对应的特征变量数值,就是所希望得到的优化工艺参数。其它样本的计算值如表1所示。上述计算结果也表明,模式识别及神经网络优化方法对7005铝合金的工艺优化非常有效,而且该研究方法也能够应用于其他的金属与合金的工艺与性能之间关系的优化。
再取前2个PLS成分为输入元,建立一个拟合最好且结构简单的网络,单隐层含5个节点,4个输出端。最后用该网络去预测由PLS预报的试探优化点(图1(d)中方形)和两类类中心的目标值。预测结果表明,该网络结构准确地预报了各个预报点(见表4),预报的优化点有较高的性能。该预测结果也进一步验证了PLS-BP模型可以用更简单的网络结构来建立7005铝合金的性能与各工艺参数变量之间的非线性函数关系,该模型是切实可行和有效的。当然,要得到最优的样本模式,则需考虑用全局优化方法如遗传算法、模拟退火法和禁忌搜索等,这也是我们今后进一步深入研究的方向之一。
图2 3种模型PLS、BPN和PLS-BPN用留一(LOO)法预报的抗拉强度(σb)和硬度(HB)
Fig.2 Ultimate tensile stress(σb)and hardness for PLS, BPN and PLS-BPN models predicted by using leave-one-cross-validation (LOOCV): (a) Ultimate tensile stress (σb); (b) Hardness
表4 试探优化点和两类类中心的PLS和BPN预报值
Table 4 Values predicted by PLS and BP models for center of optimal and worse samples
3 结论
1) 用偏最小二乘法(PLS),对实验数据作模式识别优化处理的结果与实验很吻合,能够指明7005铝合金工艺参数优化的方向。
2) 采用 PLS 部分得分作为 BPN的输入元素,可滤出部分噪声,减少人工神经网络输入层的节点数,有利于克服过拟合,提高人工神经网络预报的准确性 。PLS-BP预报更适合用于7005铝合金性能优化的研究。
3) 模式识别及神经网络优化方法对7005铝合金的工艺优化非常有效,也非常适合对工业生产中的多变量、多目标优化。
4) 人工智能方法能从宏观上研究材料的性能与成分及工艺间的规律,给出定量的数学模型,是材料设计的可行途径之一。
REFERENCES
[1] 王志伟, 汪明朴, 王正安, 李 周, 尹志民, 刘静安.在线挤压淬火对地铁列车用6005Al合金力学性能及微观组织的影响[J]. 中国有色金属学报, 2001, 11(4): 1-4.
WANG Zhi-wei, WANG Ming-pu, WANG Zheng-an, LI Zhou, YIN Zhi-min, LIU Jing-an. Mechanical properties and microscopic structure analysis of 7005 alloys employed in underground railway trains[J]. The Chinese Journal of Nonferrous Metals, 2001, 11 (4): 1-4.
[2] 刘静安. 大型工业铝合金型材的挤压生产工艺与关键技术(续)[J]. 铝加工, 2001, 24(3): 1-7.
LIU Jing-an. Extrusion techniques and key technologies for large commercial aluminium sections[J]. Aluminium Fabrication, 2001, 24(3): 1-7.
[3] 刘静安, 赵云路. 铝材挤压生产关键技术[M]. 重庆:重庆大学出版社, 1997: 230-242 .
LIU Jing-an, ZHAO Yun-lu. Key technology for extrusion of aluminium alloys[M]. Chongqing: Chongqing University Press, 1997: 230-242.
[4] 刘静安. Al-Mg-Si系合金的热加工工艺与可挤压性[J] . 铝加工, 2002, 25(1): 1-5.
LIU Jing-an. Hot deformation technology and extrudability of Al-Mg-Si series alloy[J]. Aluminium & Fabrication, 2002, 25(1): 1-5.
[5] Mukhopadhyay A K, Yang Q B, Singh S R. The influence of zirconium on the early stages of aging of a ternary Al-Zn- Mg alloy[J]. Acta Metall Mater, 1994, 42(9): 3083-3091.
[6] Kanno M, Araki I, Cui Q. Precipitation behaviour of 7000 alloys during retrogression and reaging treatment[J]. Mater Sci Technol, 1994, 10(7): 599-603.
[7] Whealon W J. A study of the effects of iron and silicon on the solidification behavior of 7075 aluminum[J]. Diss Abstr Int, 1994, 55(2): 140.
[8] 邹 琳, 夏巨谌, 胡国安. 基于BP神经网络的铝型材挤压模具优化设计[J]. 塑性工程学报, 2003, 10(2): 42-46.
ZHOU Lin, XIA Ju-chen, HU Guo-an. Optimizing of aluminum sections extrusion die based on BP neural network[J]. Journal of Plasticity Engineering, 2003, 10(2): 42-46.
[9] 闵惜琳, 刘国华. 人工神经网络结合遗传算法在建模和优化中的应用[J]. 计算机应用研究, 2002(1): 79-80.
MIN Xi-lin, LIU Guo-hua. The combination of artificial neural network and genetic algorithm applied to modeling and optimization[J]. Application Research of Computers, 2002(1): 79-80.
[10] Malinov S, Sha W. Software products for modelling and simulation in materials science[J]. Computational Materials Science, 2003, 28(2): 179-198.
[11] Malinov S, Sha W, Mckeown J J. Modelling the correlation between processing parameters and properties in titanium alloys using artificial neural networks[J]. Computational Materials Science, 2001, 21(3): 375-394.
[12] 李 劼, 刘代飞,秦庆伟. 基于GA-BP的NiFe2O4基金属陶瓷阳极优化设计[J]. 中国有色金属学报, 2006, 16(2): 351-356.
LI Jie, LIU Dai-fei, QIN Qing-wei. Optimization designs of NiFe2O4 cermet inert anodes based on GA-BP hybrid neural net work[J]. The Chinese Journal of Nonferrous Metals, 2006, 16(2): 351-356.
[13] 陈丙珍. 人工神经网络在过程工业中的应用[J]. 中国有色金属学报, 2004, 14(S1): 106-110.
CHEN Bing-zhen. Applications of artificial neural networks in process industry[J]. The Chinese Journal of Nonferrous Metals, 2004, 14(S1): 106-110.
[14] 周古为, 郑子樵, 李 海. 基于人工神经网络的7055铝合金二次时效性能预测[J]. 中国有色金属学报, 2006, 16(9): 1583-1588.
ZHOU Gu-wei, ZHENG Zi-qiao, LI Hai. Predicting properties for secondary aging of 7005 Al alloy based on artificial neural networks[J]. The Chinese Journal of Nonferrous Metals, 2006, 16(9): 1583-1588.
[15] Galadi P, Kowalski B R. Partial least-squares regression: A tutorial[J]. Analytica Chimica Acta, 1986, 185(1): 1-17.
[16] LIU Hong-lin, CHEN Nian-yi. A PLS-BPN pattern recognition method applied to computer-aided material design[J]. Analytical Letters, 1996, 29(2): 341-350.
[17] Wold S, Sjostrom M, Eriksson L. PLS-regression: A basic tool of chemometrics[J]. Chemometrics and Intelligent Laboratory Systems, 2001, 58: 109-130.
基金项目:国家高技术研究发展计划资助项目(2002 AA302505)
收稿日期:2007-03-21;修订日期:2007-09-10
通讯作者:方善锋,博士研究生;电话:0731-8830264;E-mail: address: fang757@163.com
(编辑 李向群)