基于底层图像特征组合的文本图像分类研究
来源期刊:江西理工大学学报2013年第5期
论文作者:曾东红 黄朝志 黄细妹
文章页码:82 - 87
关键词:文本图像;C4.5决策树分类器;灰度直方图;图像纹理;
摘 要:针对文本图像特有的图像特征,提出了一种基于底层图像特征组合的文本图像分类方法,该方法使用了两层C4.5决策树分类器,能将文本图像有效地分为标题文本图像、文档图像和场景文本图像.首先将样本图像转换为灰度图像,提取灰度直方图的特征,根据灰度直方图特征的不同,可以先区分文档图像;然后把余下的图像转换为二值图像,提取图像的GLCM纹理特征,根据GLCM特征区分场景文本和标题文本图像.在开源的WEKA数据挖掘软件环境下进行仿真实验,结果表明该方法是可行的,并能够得到较高的查全率和查准率.
曾东红1,黄朝志1,黄细妹2
1. 江西理工大学电气工程与自动化学院2. 江西理工大学信息工程学院
摘 要:针对文本图像特有的图像特征,提出了一种基于底层图像特征组合的文本图像分类方法,该方法使用了两层C4.5决策树分类器,能将文本图像有效地分为标题文本图像、文档图像和场景文本图像.首先将样本图像转换为灰度图像,提取灰度直方图的特征,根据灰度直方图特征的不同,可以先区分文档图像;然后把余下的图像转换为二值图像,提取图像的GLCM纹理特征,根据GLCM特征区分场景文本和标题文本图像.在开源的WEKA数据挖掘软件环境下进行仿真实验,结果表明该方法是可行的,并能够得到较高的查全率和查准率.
关键词:文本图像;C4.5决策树分类器;灰度直方图;图像纹理;