文章编号:1004-0609(2008)07-1364-07
基于火焰状氧化铝回转窑火焰图像检索
张红亮1,陈湘涛2,李 劼1,罗宗山3,刘代飞1
(1. 中南大学 冶金科学与工程学院,长沙 410083;
2. 中南大学 信息科学与工程学院,长沙 410083;
3. 长沙有色冶金设计研究院,长沙 410011)
摘 要:提出一种基于火焰形状的氧化铝回转窑火焰图像的检索方法,对回转窑火焰的形状进行深入分析,根据其特点,提出一种描述火焰形状的基准距离函数,通过傅里叶变换得到火焰图像形状的傅里叶描述子。结果表明:该距离函数能较好地描述火焰形状,应用此火焰形状描述子,设计一套火焰图像检索原型机系统。以现场采集的火焰图像作为实验对象,将本研究提出的方法与传统方法和不变矩方法的进行检索实验。结果表明:本研究提出的方法具有较高的检索精度,且明显优于传统方法和不变矩方法。本研究的结果可为回转窑生产控制提供有力 支持。
关键词:氧化铝回转窑;火焰图像;火焰形状;CBIR;傅里叶描述子
中图分类号:TP 391 文献标识码:A
Alumina rotary kiln flame image retrieval based on flame shapes
ZHANG Hong-liang1, CHEN Xiang-tao2, LI Jie1, LUO Zong-shan3, LIU Dai-fei1
(1. School of Metallurgical Science and Engineering, Central South University, Changsha 410083, China;
2. School of Information Science and Engineering, Central South University, Changsha 410083, China;
3. Changsha Engineering and Research Institute of Nonferrous Metallurgy, Changsha 410011, China)
Abstract: A shape based alumina rotary kiln flame image retrieval method was proposed. First, the flame shapes were analyzed detailedly, a distance function was put forward. Through Fourier transformation, the flame shape Fourier descriptors were calculated. The results indicate that this distance function can depict the shape effectively. A flame image retrieval prototype system was proposed using this Fourier descriptors. With the flame images sampled from an alumina rotary kiln, retrieval experiments were carried out with the traditional retrieval method, invariant moment retrieval method and the proposed method. The results demonstrate that the proposed method outperforms the other two methods in terms of retrieval precision and efficiency. The research results can provide strong support for the control of the rotary kiln.
Key words: alumina rotary kiln; flame image; flame shape; CBIR; Fourier descriptor
由于我国铝土矿大部分(约95%)为一水硬铝石[1],因此氧化铝的生产方法主要为烧结或烧结?拜而混联法,而氧化铝回转窑作为这些工艺中最重要的设备之一,其运行状态关系到产品的成本和能耗。近年来,随着回转窑自动控制水平、计算机软硬件及数字图像处理技术的不断发展,在回转窑生产中先进的计算机看火正在逐渐取代或辅助传统的人工看火。这样大量的数字火焰图像数据便会存储至图像数据库中,然而,由于图像数据的特殊性,如何有效地检索和应用这些图像则成为了一个比较重要和困难的研究方向。
基于内容的图像检索(Content-based image retrieval, CBIR)提供了解决方法,对描述图像的各种底层特征进行检索,通过计算这些特征值相似性,返回近似的检索结果。目前,该课题已经成为研究热点,在医学图像数据检索领域[2]、人脸数据库领域[3]、交通工具数据库领域[4]以及其他众多的图像数据库领域中获得广泛应用并取得了较好效果,一些经典系统已得到广泛认可[5?6]。而基于形状的图像检索自出现以来,就成为该方向的一个重要分支。目前,基于形状的研究方法主要可分为两大类[7]:基于区域的方法,如不变矩和Zernike矩等;基于边界的方法,如偏心率、质心距离函数、傅里叶描述子和曲率尺度空间 (Curvature scale space, CSS)等。这些基于形状的图像检索方法各有其优缺点,并在特定的领域及简单形状的数据库中获得较好的应用,但由于我国回转窑工业水平所限,加上火焰图像的复杂性,在回转窑火焰图像形状检索上,尚未有类似的研究开展。
本研究通过分析火焰形状的特点,提出一种描述火焰形状的方法,即基准距离函数,得到其傅里叶描述子,在此基础上提出基于形状的火焰图像检索方法。通过与传统方法(基于纹理和颜色特征的图像检索)和不变矩方法(基于不变矩特征的图像检索)进行对比,验证了本研究提出方法的有效性。
1 火焰形状分析及其傅里叶描述子的提取
1.1 火焰形状分析
回转窑窑头的燃烧火焰(包括黑把子)作为火焰图像中最重要的目标之一,它不仅关系到火焰燃烧状态,还会影响回转窑的运行状态,甚至关系到回转窑的寿命。一般来说,回转窑看火的内容主要包括火焰颜色、火焰形状和物料状态。其中,观察火焰形状为重要步骤之一。
对于稳定运行的回转窑,火焰形状主要可分为5种。图1所示为以简化的形式给出各种不同火焰形状,其中P0为参考基准点,Pmax为火焰末端,矩形的对角线为火焰的参考中轴线。图1(a)所示为正常火焰,长度适中,不会伤窑皮。图1(b)和(c)所示为有偏移的火焰,是不够理想火焰形状,此时火焰可能过于偏向窑壁,从而会烧伤窑皮,破坏窑皮并缩短耐火砖的寿命。图1(d)所示为过长火焰,这样的火焰火力不够集中,放热缓慢,不利于烧结。图1(e)所示为过短过粗火焰,这样的火焰会导致窑内结圈的发生。图1(b)~(e)都为非理想、不利于生产的火焰形状。
图1 火焰形状示意图
Fig.1 Schematic diagrams of flame shapes: (a) Normal shape; (b) Upper deflected shape; (c) Lower deflected shape; (d) Thin and long shape; (e) Fat and short shape
1.2 火焰形状分割及轮廓提取
由于现场环境恶劣,在图像采集过程中难免会产生噪声,因此在处理之前须进行滤波处理。此外,为获取火焰形状,还必须对火焰图像进行分割和形状提取处理。本研究运用中值滤波和阀值分割等技术来处理火焰图像并得到火焰形状。有关这方面的理论,可见参考文献[8]。下面给出运用图像分割及轮廓提取得到火焰形状的实验(见图2)。
图2 火焰图像分割及火焰形状提取
Fig.2 Segmentation and shape extraction of flame image: (a1), (b1), (c1) Flame images; (a2), (b2), (c2) Image segmentation; (a3), (b3), (c3) Flame shape extraction
图2(a1)、(b1)和(c1)为3幅火焰图像,分别对应火焰形状为正常、偏下和短粗火焰。图2(a2)、(b2)和(c2)分别为(a1)、(b1)和(c1)进行火焰分割的结果,图中的白色“+”符号为计算机处理得到的火焰最长点。图(a3)、(b3)和(c3)为最终提取得到的火焰形状轮廓,其中,曲线AB为火焰形状轮廓线,P0为参考基准点,P为火焰最长可能出现点。由此可见,这些图像处理手段能够较好的处理火焰图像,并得到比较规范的火焰形状,为下一步分析打下基础。
1.3 火焰形状傅里叶描述子提取
ZHANG等[9]和WAI等[10]介绍了多种傅里叶描述子,其中,最常用的方法是根据形状得到边界点到形状质心的距离[11],再进行傅里叶变换。然而,在本研究中,由于图像的特殊性,采用质心距离函数尽管可以描述图像,但如果考察全部的边界点,则计算量太大,不适合在线检索,而考察部分点,又存在边界点集选取的问题。因此,本研究采用固定基准点距离函数来描述火焰形状,即计算所有点到某固定基准的距离。由于本研究所采集的火焰图像皆为同一采集设备在同一回转窑上采集,因此可以假定火焰的喷出基准固定,也就是图1中的P0为固定。
设火焰的形状边界坐标为{(x(i), y(i)), i=0, 1, 2, …, M}, N为边界点的个数。从图2可以看出,不同火焰图像的边界点数目并不相同,为此,根据火焰形状图像实际特点,各边界点与基准点P0的水平夹角在 [0, 90?]内,本研究每隔1.125?取一个代表边界点,则
可得到81个代表边界点(见图3)。火焰形状的基准距离函数r(t)可用下式表示:
图4所示为图2中图像对应的基准距离函数。
图3 火焰形状基准距离计算原理
Fig.3 Simulation principle of flame shape distance function
图4 图2中火焰图像对应的火焰形状基准距离函数
Fig.4 Flame shape distance functions of flame images in Fig.2
从图4可以看出,基准距离函数不仅能够较好的反应火焰形状的变化趋势,还可以反映形状的细小变化。其中,曲线1为正常火焰,其距离的最大值靠近中间;曲线2中距离变化比较平缓,为短粗火焰的特征,特别值一提的是在该火焰形状靠近A点的一端,有一个突起的变化,在距离函数中,在10?~20?间也对应有一个跃变过程;而曲线3则反映了距离偏向于最下端。
根据以上描述,可以将形状从2-D转化为1-D。然而,这样直接进行匹配的话,图像细小的变化便可造成很大的差异,且计算量太大,因此,可对r(t)进行傅里叶变换,可以计算得到其对应的傅里叶系数|F(u)|。
由于第1个系数为最大的系数,因此用它来对所有系数进行归一化,得到归一化的傅里叶变换系数Flame_FD(u),再选取第2~71共70个傅里叶变换系数作为火焰形状的傅里叶描述子。
一种形状描述子必须满足以下3个条件:
1) 形状描述子须不受形状的缩放、平移和旋转的影响。本研究的描述子中,当选定的参考点不变时,连接AP0与BP0构成封闭曲线,此时可以看出基准距离函数r(t)不受缩放、平移和旋转的影响。
2) 形状描述子须和人的感知相一致。可以从基准距离函数的图像看出这一点。
3) 描述子须简洁且易于获取。从前面的描述可以看出,本研究提出的傅里叶描述子在得到火焰形状之后的计算过程相对容易。
因此,本研究提出的火焰形状傅里叶描述能够较好的描述火焰形状。
2 火焰形状检索
2.1 检索步骤
与参考文献[5?6, 12?13]中的图像检索系统类似,本研究的图像检索过程主要包括以下几个步骤:
1) 初始化系统参数:数据库参数,输入被查询图像等;
2) 对被查询图像进行图像滤波、图像分割和轮廓提取,得到火焰形状轮廓,计算形状的基准距离函数r(t),并进行归一化;
3) 对r(t)进行傅里叶变换,并根据式(2)和(3)得到归一化的傅里叶描述子,从而组成傅里叶描述组向量SHAPE_FD={Shape_FD(1), Shape_FD(2), …, Shape_FD(70)};
4) 计算被检索图像的傅里叶描述子和图像数据库中所有图像的傅里叶描述子 (经过离线预处理得到)进行比较,计算二者的欧氏距离作为它们的相似度。假设图像数据库中任意图像IMG_I,其火焰形状傅里叶描述子向量为IMG_I_FD={IMG_I_FD(1), IMG_I_FD(2),…, IMG_I_FD(70)},则二者的其相似度Sim_FD可用下式计算:
5) 对相似度进行排序,返回k=30个最相似图像作为检索结果。
2.2 检索实验
本研究所提出的实验原型机系统应用用VC++6.0实现,数据库利用Microsoft SQL Server 2000实现,其中的原始图像数据为应用CCD和数字图像采集卡对某氧化铝厂的回转窑窑头火焰图像进行采样,任取500幅图像进行分析,其中,图像大小为768×576,256色灰度图像,BMP格式。图像采集后,对这些图像进行预处理,提取形状傅里叶描述子,再将火焰图像和描述子分别存入相应的图像数据库和特征数据库中。
为验证所提出形状描述子的有效性,本研究将其与基于传统内容检索的方法和基于不变矩的形状检索方法进行比较,在相同的硬件条件(PC: Pentium 4 2.20 G, 512 M, 60 G)和软件环境(Windows XP SP2, VC++6.0)下进行检索实验。这两种检索方法在文献[14?15]中有详细介绍,本研究不再累述。应用图2(a)作为检索,下图5为检索结果的屏幕截图。同时,为进一步比较检索的性能,任选10幅火焰图像,分别应用上述三种方法进行检索,得到其平均的“查准率?查全率”曲线,如图6所示。其中,查准率ηPrecision和查全率ηRecall分别由下式定义:
Nrelevent为数据库中与被检索图像相似的火焰图像总数。精度反映了检索结果的准确度,而查全率则反映从火焰数据库中检索到相似火焰图像的能力。
3 检索结果讨论
图5所示为应用3种检索方法以图2(a)为检索对象进行检索的程序结果截图,每种方法返回30幅相似的火焰图像,它们与被检索图像的相似程度按照从左
图5 火焰形状检索的结果截图
Fig.5 Screenshot of retrieval results: (a) Proposed method; (b) Traditional method; (c) Invariant moment based method
至右,从上之下的顺序排列。从图5整体看,检索结果和被检索图像都存在一定的相似性。图5(a)所示为应用本研究方法进行检索,可以看出结果图像的火焰形状和被检索图像相似度很高。图5(b)和(c)所示为应用传统CBIR方法和不变矩进行检索的结果,可以看出他们的火焰形状相似度不如图5(a)明显,其不相似的火焰形状明显增多,尤其是图5(c),不相似火焰形状图像数目最多。这是由于本查询侧重点为火焰形状,相比传统方法或不变矩而言,本研究提出的基准点距离函数傅里叶描述子能更加好地描述火焰形状,故检索精度要高。此外,3种方法的检索速度都相对较快,时间约为2 s。
图6所示为应用3种方法进行火焰形状检索的平均查准?查全率曲线。从图6中也可看出,本研究提出方法的精度要比两种参照方法的要高,当查全率较低,即返回的火焰图像数目较少时,3种方法都能有较高的精度。其中,本研究提出的方法最高,大于80%,而参照方法则大于70%;随着查全率的增加,即返回的图像数目增多,3种方法的精度都将下降。本研究提出的方法下降速度较快,当查全率接近70%时,3种方法的精度相当。但在实际应用中,一般不会返回全部的图像,而当查全率小于30%时,本研究提出的方法有较高的精度,且明显优于参照方法,因而实际应用中,本研究的方法更加优秀。
图6 不同方法的平均查准—查全率曲线
Fig.6 Average precision and recall curves for different methods
综上所述,本研究提出的基于傅里叶描述子的火焰形状检索有较高效率,比传统检索方法和不变矩的性能更优,能够满足实际中火焰形状检索需要。
4 结论
1) 通过对氧化铝回转窑火焰图像进行详细分析,提出了一种描述火焰形状的基准距离函数;通过傅里叶变换,得到火焰形状的傅里叶描述子。实验结果表明该距离函数能较好的描述火焰形状。
2) 基于基准距离函数的傅里叶描述子,设计一套火焰图像检索原型机系统。通过进行火焰形状检索实验及与传统方法和不变矩方法的对比,本研究提出的方法具有较高的检索效率,且明显优于传统方法和不变矩方法。
3) 本研究结果可为氧化铝回转窑生产、管理和员工培训提供有力支持。
REFERENCES
[1] 顾松青. 我国的铝土矿资源和高效低耗的氧化铝生产技术[J]. 中国有色金属学报, 2004, 14(1): 91?97.
GU Song-qing. Alumina production technology with high efficiency and low consumption from Chinese bauxite resource[J]. The Chinese Journal of Nonferrous Metals, 2004, 14(1): 91?97.
[2] UNSER M, ALDROUBI A, LAINE A. Wavelets in medical imaging[J]. IEEE Transactions on Medical Imaging, 2003, 22(3): 285?288.
[3] 刘 燕, 张星明, 郭宇聪. 基于聚类的大型人脸检索系统[J]. 计算机工程, 2005, 31(15): 162?164.
LIU Yan, ZHANG Xing-ming, GUO Yu-cong. Cluster-based face recognition system[J]. Computer Engineering, 2005, 31(15): 162?164.
[4] 刘海峰. 治安卡口系统中基于内容的图像数据库的应用[J]. 计算机工程与应用, 2002, 38(17): 251?253.
LIU Hai-feng. Application of content-based image database in secure-access system[J]. Computer Engineering and Application, 2002, 38(17): 251?253.
[5] SMITH J R, CHANG S F. Visual SEEk: A fully automated content-based image query system[C]//Proceedings of the 4th ACM International Conference on Multimedia. Boston, 1996: 87?98.
[6] FLICKNER M, SAWHNEY H, NIBLACK W, ASHLEY J, QIAN H D B, GORKANI M, HAFNER J, LEE D, PETKOVIC D, STEELE D, YANKER P. Query by image and video content: the QBIC system[J]. IEEE Computer Special Issue on Content-Based Retrieval, 1995, 28(9): 23?32.
[7] ZHANG Deng-sheng, LU Guo-jun. Review of shape representation and description techniques[J]. Pattern Recognition, 2004, 37(1): 1?19.
[8] RAFAEL C G, RICHARD E W. 数字图像处理[M]. 第二版. 阮秋琦, 阮宇智, 译. 北京: 电子工业出版社, 2003.
RAFAEL C G, RICHARD E W. Digital image processing[M]. 2nd ed. RUAN Qiu-qi, RUAN Yu-zhi, transl. Beijing: Electronics Industry Press, 2003.
[9] ZHANG Deng-sheng, LU Guo-jun. A comparative study of curvature scale space and Fourier descriptors for shape-based image retrieval[J]. Journal of Visual Communication & Image Recognition, 2003, 14(1): 41?60.
[10] WONG W T, SHIH F Y, LIU J. Shape-based image retrieval using support vector machines, Fourier descriptors and self-organizing maps[J]. Information Sciences, 2007, 117(8): 1878?1891.
[11] ZHANG Deng-sheng, LU Guo-jun. Shape-based image retrieval using generic Fourier descriptor[J]. Signal Processing: Image Communication, 2002, 17(10): 825?848.
[12] MAO H H, CHAUR H H, KUO C M. Similarity retrieval of shape images based on database classification[J]. Journal of Visual Communication & Image Recognition, 2006, 17(5): 970?985.
[13] FARIBORZ M, JAMSHID S, AMIR-MASOUD E M, HAMID S Z. Image retrieval based on shape similarity by edge orientation autocorrelogram[J]. Pattern Recognition, 2003, 36(8): 1725?1736.
[14] HUANG P W, DAI S K. Image retrieval by texture similarity[J]. Pattern Recognition, 2003, 36(3): 665?679.
[15] BABUM M, MOHAN S K, WING F L. Shape measures for content based image retrieval: a comparison[J]. Information Processing and Management, 1997, 33(3): 319?337.
基金项目:国家自然科学基金资助项目(60634020)
收稿日期:2007-09-29;修订日期:2008-04-10
通讯作者:张红亮,讲师,博士;电话:0731-8876454;E-mail: net_hotang@163.com
(编辑 李艳红)