数据清洗对热轧微合金钢性能预报模型的改进
来源期刊:钢铁研究学报2019年第10期
论文作者:李维刚 王肖 杨威 赵云涛
文章页码:920 - 927
关键词:热轧带钢;孤立森林;数据清洗;力学性能预报;
摘 要:热轧生产过程实测数据具有噪音大、信噪比低等特点,运用合适的方法对异常数据进行清洗将有助于提高钢材力学性能预报模型的精度。基于带钢热连轧过程数据的分布特点,采用孤立森林算法对热轧过程异常数据进行清洗,提高了性能预报模型的预测精度。首先,基于收集到的大量热轧微合金钢生产过程数据,采用孤立森林算法计算原始数据集中每条数据记录的异常分值;接着结合异常分值排序与力学性能建模实验,确定异常数据记录的个数;最后,基于清洗后的数据集合,运用融合数据与机理的建模方法建立力学性能预报模型,并对抗拉强度和屈服强度进行预测。预测实践表明,抗拉强度和屈服强度预报的平均绝对百分误差分别为2.50%和3.42%,且分别有93.13%和86.30%的数据预测值和实测值绝对误差在±6%之内;采用孤立森林算法对热轧生产过程异常数据进行清洗,可显著提高热轧带钢力学性能预报模型的精度。
李维刚1,2,王肖1,杨威1,赵云涛1
1. 武汉科技大学冶金自动化与检测技术教育部工程研究中心2. 武汉科技大学高温材料与炉衬技术国家地方联合工程研究中心
摘 要:热轧生产过程实测数据具有噪音大、信噪比低等特点,运用合适的方法对异常数据进行清洗将有助于提高钢材力学性能预报模型的精度。基于带钢热连轧过程数据的分布特点,采用孤立森林算法对热轧过程异常数据进行清洗,提高了性能预报模型的预测精度。首先,基于收集到的大量热轧微合金钢生产过程数据,采用孤立森林算法计算原始数据集中每条数据记录的异常分值;接着结合异常分值排序与力学性能建模实验,确定异常数据记录的个数;最后,基于清洗后的数据集合,运用融合数据与机理的建模方法建立力学性能预报模型,并对抗拉强度和屈服强度进行预测。预测实践表明,抗拉强度和屈服强度预报的平均绝对百分误差分别为2.50%和3.42%,且分别有93.13%和86.30%的数据预测值和实测值绝对误差在±6%之内;采用孤立森林算法对热轧生产过程异常数据进行清洗,可显著提高热轧带钢力学性能预报模型的精度。
关键词:热轧带钢;孤立森林;数据清洗;力学性能预报;