基于随机森林的热轧带钢质量分析与预测方法
来源期刊:东北大学学报(自然科学版)2019年第1期
论文作者:纪英俊 勇晓玥 刘英林 刘士新
文章页码:11 - 15
关键词:热轧带钢;缺陷预测;数据驱动;特征提取;随机森林;
摘 要:以某钢铁企业的热轧带钢生产实际数据作为分析对象,基于改进的随机森林算法分析工艺参数与产品质量间的隐含关系,进行影响产品质量关键工艺参数的特征提取,建立热轧带钢产品缺陷预测模型.实验结果表明,对非平衡数据集进行平衡处理可以提高样本预测精度;采用CART与C4. 5相结合的方法比单一方法可以进一步提升预测精度;同时根据特征的高相关与低相关特性,将互信息作为评价指标应用于特征选择,可以提升随机森林算法的分类效果.在以上三种改进策略下,热轧带钢缺陷的识别率得到明显提高.
纪英俊1,勇晓玥1,刘英林2,刘士新1
1. 东北大学信息科学与工程学院2. 上海宝信软件股份有限公司大数据事业部
摘 要:以某钢铁企业的热轧带钢生产实际数据作为分析对象,基于改进的随机森林算法分析工艺参数与产品质量间的隐含关系,进行影响产品质量关键工艺参数的特征提取,建立热轧带钢产品缺陷预测模型.实验结果表明,对非平衡数据集进行平衡处理可以提高样本预测精度;采用CART与C4. 5相结合的方法比单一方法可以进一步提升预测精度;同时根据特征的高相关与低相关特性,将互信息作为评价指标应用于特征选择,可以提升随机森林算法的分类效果.在以上三种改进策略下,热轧带钢缺陷的识别率得到明显提高.
关键词:热轧带钢;缺陷预测;数据驱动;特征提取;随机森林;