DOI: 10.11817/j.issn.1672-7207.2015.03.016
基于稀疏表示的自动年龄估计
李玲芝1, 2,梁毅雄1, 2,艾玮3,刘凌波1, 2
(1. 中南大学 信息科学与工程学院,湖南 长沙,410083
2. 中南大学 移动医疗教育部-中国移动联合实验室,湖南 长沙,410083
3. 湖南大学 信息科学与工程学院,湖南 长沙,410012)
摘要:将稀疏表示同时应用于人脸图像年龄特征提取和年龄自动估计2个关键环节,提出一种基于稀疏表示的年龄估计新方法。该方法首先对人脸图像进行稠密采样,提取底层的SIFT描述子,训练字典对其进行稀疏编码,再进行空间金字塔表示,并将其作为刻画年龄属性的图像特征,然后采用线性稀疏回归模型同时选择特征进行年龄估计。针对人脸老化过程具有非线性特点,提出一种基于分段线性策略的层次模型,即首先训练若干个分类器将人脸粗分类到不同的年龄段,然后在该年龄段中训练对应的线性模型对年龄进行精确估计。在权威的FG-NET和MORPH人脸库上对该方法的有效性进行实验验证。研究结果表明:所提出的方法在FG-NET人脸库上年龄估计偏差的平均绝对误差为3.79,远比当前最好方法的平均绝对误差低,而在MORPH人脸库上的平均绝对误差为6.46,与当前最好方法的平均绝对误差相当。
关键词:模式识别;年龄估计;稀疏表示;空间金字塔匹配;弹性网
中图分类号:TP391.41 文献标志码:A 文章编号:1672-7207(2015)03-0878-08
Automatic age estimation based on sparse representation
LI Lingzhi1, 2, LIANG Yixiong1, 2, AI Wei3, LIU Lingbo1, 2
(1. School of Information Science and Engineering, Central South University, Changsha, 410083, China;
2. Mobile-Health Key Lab Attached to Education Ministry and China Mobile, Changsha, 410083, China;
3. School of Information Science and Engineering, Hunan University, Changsha, 410012, China)
Abstract: A novel sparse representation-based age estimation method was proposed. The proposed method integrated sparse representation into two key components of a successful age estimation system, i.e. age-related feature extraction and age estimation by regression. Specifically, during the feature exaction stage, the mid-level spatial-pyramid face representation based on sparse codes of dense SIFT features (ScSPM) was used to characterize the age-related variance, while during the age estimation step, the linear sparse regression models were learned which can not only select the most discriminative features but also perform the age estimation. The hierarchical strategy, which first coarsely classified the faces into age groups and then finely estimated the detailed age by the linear regression model of this group, was adopted to deal with the non-linearity attribution of aging to improve the performance of the age regression model. The effectiveness of the proposed method was validated on two benchmarks, i.e. the FG-NET database and the MORPH database. The proposed approach achieves the MAE of 3.79 in the FG-NET database and the MAE of 6.46 in the MORPH database, which shows that the proposed approach outperforms the state-of-the-arts on the FG-NET database and achieves competitive performance on the MORPH database.
Key words: pattern recognition; age estimation; sparse representation; spatial pyramid matching; elastic net
自动从人脸图像中估计年龄在安全防范、香烟自动售货机的监控、电子商务定向、失踪儿童搜寻的年龄预测等领域有着广阔的应用前景,越来越引起人们的关注,现已成为人脸图像分析研究中的热点问题[1-8]。与人脸携带的身份、性别、种族等信息相比,年龄信息具有其独特性:1) 人类老化过程是一个复杂、缓慢而又不可逆转的过程,且不同的年龄阶段呈现不同的脸型和纹理变化;2) 年龄的变化方式多样化,同时受到诸如遗传、性别、健康、生活方式等先天或后天环境因素的影响;3) 采集大量描述人脸年龄变化的图像特别是采集特定人群不同年龄段的图像序列非常困难,而且在采集过程中还经常受到光照、表情、姿势、脸部朝向等因素的干扰。所有这些因素都使得人脸图像的自动年龄估计研究较困难。成功的年龄估计系统通常包含以下2个关键模块:年龄特征提取和年龄估计。在年龄特征提取方面,经典的全局特征脸方法[9]如主动外观模型(AAM)[2-3, 10-13]、老化模式子空间(AGES)[14]、年龄流形[1, 15]、二进制高斯感知映射[6]等全局特征已被广泛应用于年龄估计研究。近年来,由于局部区域更适用于处理因年龄引起的脸部变化,因此,基于局部特征的方法如人体测量模型[16]、空间柔性块[17]、仿生特征[18-22]、GLOH特征[5]等,在公开的老龄化数据库[5, 18]上均取得了很好效果。同时,也有采用融合局部和全局特征的混合特征来进行年龄估计的研究[4, 23]。全局特征往往具有一定的语义信息,但缺乏细节纹理特征的刻画,鉴别能力较弱;而局部特征能较好地提取细节信息,具有较强的鉴别能力,但缺乏高层的语义信息。如何提取具有强鉴别能力和不变性的年龄特征仍然是当前需要研究的主要问题。在给定年龄特征的情况下,年龄估计可看成是多分类问题 [2, 16, 24],或回归问题[3, 5, 14-15, 17-19, 23-25]或二者组合问题[1-2, 4, 10, 26]。许多经典的分类工具如支持矢量机(SVM)、近邻分类器(NNC)、人工神经网络(ANN)等都已应用于具体的年龄估计[2, 24]。然而,由于年龄估计方法的性能通常是由绝对平均误差(EMA)来评估的,所以,年龄估计问题从本质上来说采用回归处理策略更合适[3]。Lanitis等[2, 11]最早采用二次和三次回归函数来估计年龄。由于年龄变化复杂,很难用简单的二次或三次曲线来拟合,大量的后续研究采用了更复杂的回归方法,如高斯过程[3]、脊回归(RR)[5]、相关矢量机(RVM)[6]、逻辑斯蒂回归(LR)[23]、支持矢量回归(SVR)[24]和Kernel回归[27]等。此外,人们还常通过使用分层策略同时结合分类和回归方法来进行混合年龄估计,典型的方法包括首先将人脸图像按年 龄[4]、性别[26]、种族或其他因素[23]分类到不同的年龄段,然后在该年龄段内通过学习一些简单的回归模型来预测人脸的准确年龄[2, 4, 23, 26]。稀疏表示作为近年来提出的一种新数学工具,已应用于图像复原、图像分类等方面,并取得了较好的性能[28]。本文将稀疏表示方法用于年龄特征的自动提取以及年龄回归2个关键环节中,提出一种基于稀疏表示的人脸年龄估计新方法。在提取年龄特征时,采用稀疏表示的方法对底层的SIFT特征进行系数编码,并通过空间金字塔匹配将其转化为同时具有高度鉴别能力和不变性的中层特征。在年龄估计阶段,采用分段线性回归的方法来处理人脸老化过程中的非线性过程,即首先通过训练SVM来估计人脸图像的大致年龄段,然后在该年龄段内训练基于稀疏约束的弹性网模型,同时完成特征选择和最终的年龄估计。
1 基于年龄的特征提取
1.1 稠密采样的SIFT局部描述子
人们常用经典SIFT描述子描述图像局部梯度信息[29],首先在图像空间和尺度空间中找出一组稀疏关键点,对这些关键点提取SIFT描述子。对于图像分类,采用稠密网格采样代替那些稀疏关键点,能取得更好性能[29-33]。而对于年龄估计,对人脸图像进行稠密采样、提取各个采样点的局部描述子,可以更好地描述年龄相关的变化。因此,本文选定1个间距为6个像素的稠密网格,具体参数与文献[29]中的一致,即图像块的大小为16×16,每个图像块划分为4×4个单元,每个单元梯度量化为8个方向,每个图像块可以用1个128维矢量表示。在实验过程中,对所有人脸图像均根据眼睛的位置进行自动配准,因此,在提取描述子时并未对主方向对齐。此外,与文献[33]中的类似,实验中也跳过了文献[29]中的标准SIFT归一化步骤,以捕捉人脸低对比度区域特征。
1.2 基于ScSPM的年龄特征提取
所提取的底层描述子仅仅描述了局部区域,表示能力有限,因此,在图像识别研究中常常将其转换为包含信息更丰富的中层表示[30, 34]。直观方法就是串联所有低层局部描述子,并将其转化成全局图像表示[5],该表示可能具有较强的鉴别能力但缺乏不变性。此外,直接串联可能会导致最终矢量维度过高,引发“维数灾难”。主流的词袋(BoF)[35]模型将低层局部描述子量化为字典中某个原子,然后统计对应的直方图来表示图像。在训练阶段,给定一个局部描述子的训练集,BoF采用K-均值聚类算法训练1个字典V:
(1)
其中:字典; ||·||0为统计矢量的非零元素个数l0伪范数;||·||1和||·||2分别为矢量的l1范数和l2范数;,为各局部描述子在对应字典下的编码。在编码阶段,BoF方法首先从1个新人脸图像I中提取M局部描述子,然后通过固定字典V求解方程(1)完成各个描述子矢量量化,最后统计这些编码的直方图。
(2)
尽管该全局的直方图表示具有空间不变性,但因为损失了各个描述子的空间信息,鉴别能力有限。为了获得鉴别力和不变性之间的平衡,Lazebnik等[33]提出了一种更有效的空间金字塔直方图池化方法,将图像从粗到精划分为若干个空间子区域,在各个子区域统计描述子编码直方图。通常划分为2l×2l个子区域,其中l=0, 1, 2,然后将各个子区域的直方图串联成1个单一矢量来表示图像。
矢量量化的主要问题在于其约束条件||ui||0 = 1过于严格,会导致大的编码误差[30]。另一个问题是该特征只有采用非线性分类器时方可取得较满意的性能,而非线性分类器往往需要更高的训练代价和存储代 价[30]。为了减少编码误差,将矢量量化环节用稀疏编码替代,而且大量研究表明采用稀疏编码图像全局表示往往具有更强的鉴别能力,故采用简单的线性分类器即可获得满意性能,而且从生物学来说更合理[36]。具体地说,稀疏编码同样需要先训练字典,其训练过程可通过以下优化问题求解:
(3)
为了保证其稀疏性,字典V是过完备的,因此,K>d。由于同时存在2个优化变量U和V,需要固定两者中任意1个将其转化为凸优化问题[30, 37]。当固定V时,问题(3)就变成了一个经典的稀疏表示问题,而当固定U时,问题就简化为一个最小二乘问题。前者可以通过feature-sign search算法[37]解决,后者则可以通过拉格朗日对偶来求解。
得到字典V后,对新的图像I提取M个局部描述子,通过基于稀疏表示完成对描述子编码,最后通过空间金字塔池化方法将其转换为1个矢量。注意到经典BoF模型中直方图池化等价于求和(或者求均值),这里则采用取最大值的方式进行池化,以此降低最终表示的维度和提高其不变性。令表示从空间金字塔第j个子区域获得的Mj 个SIFT局部描述子的相应稀疏码,最大池化定义如下:
(4)
这里函数ξmax定义在Uj的每行上,返回1个矢量zj,其中第i个元素为
(5)
将不同尺度、不同位置的池化特征串联起来,形成1个矢量Z,可以用它来描述年龄特征。在具体实现中,从所有训练样本中随机抽取20 000个图像块,从中提取SIFT描述子来训练字典,字典大小K为1 024。
2 层次年龄回归模型
鉴于ScSPM+线性方法在图像分类和识别中取得很好效果[30, 34],本文同样采用线性方法进行年龄估计。与非线性方法相比,线性方法在时间和空间上的需求较低,在数据量达到成千上万的情况下线性方法显然是更优选择。然而,人类老化过程非常复杂,单独1个线性模型难以准确描述整个年龄范围的复杂变化。在不同年龄段,其变化往往以不同形式呈现,而在同一年龄段内,变化形式相对单一。例如,从婴儿期到青少年期,因年龄影响而产生的变化主要呈现为身形变化和相关骨骼特征变化;而在成年期,基于年龄的变化又包括少量的骨骼变化以及大量的纹理变化,包括肌肉松弛、皱纹生长及其他皮肤现象等。基于此,现有的绝大多数成功的年龄估计方法均采用分层策略[1-2, 4, 10, 26 ]。这里也采用分层策略,但在估计具体年龄时仅仅使用线性SVM模型,将整个年龄范围划分成若干个具有一定重叠区域的年龄段,通过在该年龄段内学习对应的稀疏线性模型预测准确年龄。
2.1 基于线性SVM的年龄段分类
将整个年龄范围划分成G个年龄段,对于每个年龄段均训练1个对应的线性SVM。选定第g组,在给定训练集,,线性SVM的目标在于找出1个线性判别函数。对于新的测试样本z,通过以下公式将其划分到具体年龄段:
(6)
在实验中,将年龄段分为青少年和中老年2个阶段,即G=2。
2.2 基于稀疏线性回归年龄估计
在年龄段内,假定年龄a与特征z存在如下线性关系:
(7)
这样,年龄估计的问题就转化为系数矢量估计的问题。这里采用准确性和简约性2个准则来确定。由于年龄特征z通常处于高维空间,简约性显得尤为重要,因为它不仅能提高回归性能,而且能大大降低计算开销。简单的最小二乘方法需要利用所有的特征维度,且容易过拟合,在准确性和简约性2方面都很差。经典的脊回归方法通过对最小二乘法增加l2范数正则项来增强其泛化性能,往往在实际应用中能获得更高的准确度,但其弱点是仍然需要利用所有特征分量。LASSO方法通过对最小二乘方法增加l1范数正则项[32]能生成1个稀疏模型,但在实际应用中常常会产生欠拟合问题[5]。文献[5]提出了结合LASSO和脊回归方法,以同时达到准确性和简约性要求。本文采用另一种结合LASSO和脊回归方法即弹性网[31],给定1个训练集合,弹性网通过以下方程式求解目标函数:
(8)
由于同时存在l1范数和l2范数的正则项约束,因而,该目标函数同时具有稀疏性和准确性的优点。与此同时,也存在大量的快速算法[31]简化其求解过程。一旦通过离线学习方式获得了最优的,在线进行年龄估计则只需简单的点积运算即可。所有这些特点说明弹性网方法更适合于年龄估计任务。
3 实验结果与分析
为了验证所提出方法的有效性,在FG-NET[38](见图1) 和MORPH[39](见图2)这2个标准的数据库上进行一系列实验。FG-NET数据库包含82个人的1 002张人脸图像,其年龄范围为0~69岁。MORPH数据库包含515个人的1 724张人脸图像,对应年龄范围为15~68岁。为了减少成像过程中尺度、旋转等因素的影响,本文对每张图片根据自动检测的人眼位置进行旋转、缩放和裁剪等预处理,具体流程见图3,最终的图像大小设定为105×111,对应的ScSPM特征维数z为21 504。
为了进行公平比较,遵循文献[6, 14]中的测试协议。在FG-NET数据库中采用留1人(LOPO)法,即在测试时将某个人的所有照片作为测试集,而其他人的照片作为训练集,最终的结果为82次实验后的统计值。在MORPH数据库中,采用FG-NET库中图像作为测试集,将MORPH数据库中所有433张白人图片作为测试集合。同样采用平均绝对误差(EMA)和累计匹配分(CS)作为评价指标。
图1 FG-NET人脸库中的部分人脸图像
Fig. 1 Some images from FG-NET face dataset
图2 MORPH人脸库中的部分人脸图像
Fig. 2 Some images from MORPH face dataset
图3 图像预处理过程
Fig. 3 Pre-processing of face images
3.1 FG-NET人脸库的实验结果及分析
首先对MAX池化和STD池化[18]2种常见的池化策略进行评估,采用MAX池化的EMA为3.79,而采用STD池化策略的EMA为3.96,因此,MAX池化优于STD池化。同时,将本文所提出的层次线性模型(HLM)与当前在FG-NET人脸库上取得最好性能的基于高斯核函数支持向量回归(SVR)进行比较。采用LIBSVM开源软件对SVR方法进行验证,其参数设置与文献[18]中的一致。实验结果表明:采用本文提出的HLM方法(EMA为3.79),优于当前最好的SVR方法(EMA为3.96),而且由于本文提出的HLM方法使用的是线性模型,比非线性高斯核SVR具有更高的计算效率。
进一步将本文方法与当前其他几种最好的年龄估计方法进行比较,表1所示为不同方法在7组不同年龄段上的实验结果。注意到在0~9,10~19和20~29这3个年龄段上图像数据较多,本文的方法取得了与当前最好方法相当的性能,而在30~39,40~49,50~59和60~69这4个年龄段上图像数据较少,特别是60~69岁的人脸图像只有8副,而50~59岁人脸图像也只有15副。当前最好的方法在如此小样本数据上的误差急剧增大,而本文方法在各个年龄段的性能都稳定,且其整体结果是所有方法中最好的。表2所示为实验过程中所有方法在各个年龄段上的EMA。从表2可以看出:本文提出的方法优于当前最好的年龄估计方法。值得注意的是:采用ScSPM特征和非线性SVR方法同样也明显优于其他方法,这说明采用ScSPM特征可以描述更多的年龄相关特征。各种方法的累计匹配分结果如图4所示。从图4可见:本文方法在低误差水平时略逊于AAS和AGES等子空间方法[14],但在高误差水平时优于其他方法,当误差为10岁时准确率达到96.61%。
3.2 MORPH人脸库的实验结果及分析
为了进一步验证所提出算法的鲁棒性和泛化能力,采用与文献[3, 6, 14]中相同的实验设置在MORPH人脸库中对本文方法进行验证,其EMA比较结果如表3所示。从表3可见:本文所提出的方法明显优于AAS,WAS,AGES及AGESLDA等子空间方法[14],取得了与当前最好的方法(如MTWGP[3]和YF+RVM[6] )相当的性能。图5也同样给出了各种方法在MORPH数据集上的累计匹配分曲线。可见:本文提出的方法远优于AAS[14],其性能与最新的MTWGP[3]和YF+RVM[6]方法的性能相当。
表1 FG-NET人脸库上不同年龄段平均绝对误差比较结果
Table 1 Comparison of EMA at different age groups on FG-NET
表2 不同方法所得FG-NET人脸库上的平均绝对误差EMA比较
Table 2 Comparisons of EMA on FG-NET
图4 基于FG-NET数据库的累积匹配分比较
Fig. 4 Comparison of cumulative scores on FG-NET database
表3 不同方法所得MORPH数据库上的平均绝对误差EMA比较
Table 3 Comparison of EMA on MORPH
图5 基于MORPH数据库的累积匹配分比较
Fig. 5 Comparison of cumulative scores on MORPH database
4 结论
1) 该方法首先提出了一种基于稠密SIFT描述子、稀疏表示和空间金字塔的中层图像特征来描述人脸图像中与年龄相关的变化,它具有平移、旋转、尺度不变性等优点,与通常采用的底层图像特征相比。该特征具有更多的统计信息和更高的鉴别能力,在同样情况下,能够取得更准确的年龄估计结果。
2) 在年龄估计模型学习阶段,该方法提出了一种由若干线性SVM分类器及其对应的稀疏线性回归子共同组成层次回归模型。具体地,该模型先利用线性分类方法将人脸图像粗分类到某一个年龄段,然后采用该年龄段内的稀疏线性回归模型精确估计人脸的具体年龄。
3) 与当前最好方法相比,本文所提出的基于线性模型的年龄估计方法性能更好,而且由于所提出的方法均采用简单的线性模型,可直接应用于大规模数据训练和测试。
4) 年龄估计中监督字典学习、稀疏编码以及多种描述子的融合问题、基于多任务学习的稀疏编码和稀疏回归问题等有待进一步研究。
参考文献:
[1] FU Yun, GUO Guodong, HUANG Thomas. Age synthesis and estimation via faces: A survey[J]. IEEE Trans Pattern Anal Mach Intell, 2010, 32(11): 1955-1976.
[2] Lanitis A, Draganova C, Christodoulou C. Comparing different classifiers for automatic age estimation[J]. IEEE Trans Syst Man Cybern B, 2004, 34(1): 621-628.
[3] ZHANG Yu, Yeung D. Multi-task warped Gaussian process for personalized age estimation[C]// Davis L. 2010 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2010: 2622-2629.
[4] Choi S, Lee Y, Lee S, et al. Age estimation using a hierarchical classifier based on global and local facial features[J]. Pattern Recognit, 2011, 44(6): 1262-1281.
[5] LIANG Yixiong, LIU Lingbo, XU Ying, et al. Multi-task GLOH feature selection for human age estimation[C]// Macq B. 2011 18th IEEE International Conference on Image Processing(ICIP). NJ: IEEE, 2011: 573-576.
[6] Ruiz-Hernandez J, Crowley J, Lux A. “How old are you?”: Age estimation with tensors of binary Gaussian receptive maps[C]// Petrou M. Proceedings of the British Machine Vision Conference. UK: British Machine Vision Association, 2010: 1-11.
[7] 张宇, 周志华. 基于集成的年龄估计方法[J]. 自动化学报, 2008, 34(8): 997-1000.
ZHANG Yu, ZHOU Zhihua. A new age estimation method based on ensemble learning[J]. Acta Automatica Sinica, 2008, 34(8): 997-1000.
[8] 王先梅, 梁玲燕, 王志良, 等. 人脸图像的年龄估计技术研究[J]. 中国图象图形学报, 2012, 17(6): 603-618.
WANG Xianmei, LIANG Lingyan, WANG Zhiliang, et al. Age estimation by facial image: A survey[J]. Journal of Image and Graphics, 2012, 17(6): 603-618.
[9] Turk M, Pentland A. Eigenfaces for recognition[J]. J Cogn Neurosci, 1991, 3(1): 71-86.
[10] Luu K, Ricanek K, Bui T, et al. Age estimation using active appearance models and support vector machine regression[C]// Bowyer K. IEEE 3rd International Conference on Biometrics: Theory, Applications, and Systems, 2009. NJ: IEEE, 2009: 1-5.
[11] Lanitis A, Taylor C, Cootes T. Toward automatic simulation of aging effects on face images[J]. IEEE Trans Pattern Anal Mach Intell, 2002, 24(4): 422-455.
[12] CHAO Weilun, LIU Junzuo, DING Jianjun. Facial age estimation based on label-sensitive learning and age-oriented regression[J]. Pattern Recognition, 2013, 46(3): 628-641.
[13] GENG Xin, YIN Chao, ZHOU Zhihua. Facial age estimation by learning from label distributions[J]. IEEE Trans Pattern anal Mach Intell, 2013, 35(10): 2401-2412.
[14] GENG Xin, ZHOU Zhihua, Smith-Miles K. Automatic age estimation based on facial aging patterns[J]. IEEE Trans Pattern anal Mach Intell, 2007, 29(12): 2234-2240.
[15] FU Yun, HUANG Thomas. Human age estimation with regression on discriminative aging manifold[J]. IEEE Trans Multimedia, 2008, 10(4): 578-584.
[16] Kwon Y, Lobo N. Age classification from facial images[J]. Compu Vis Image Understand, 1999, 74(1): 1-21.
[17] YAN Shuicheng, WANG Huan, HUANG Thomas, et al. Ranking with uncertain labels[C]// Zhuang X. 2007 IEEE International Conference on Multimedia and Expo. NJ: IEEE, 2007: 96-99.
[18] GUO Guodong, MU Guowang, FU Yun, et al. Human age estimation using bio-inspired features[C]// Huttenlocher D. IEEE Conference on Computer Vision and Pattern Recognition, 2009. NJ: IEEE, 2009: 112-119.
[19] GUO Guodong, MU Guowang. Simultaneous dimensionality reduction and human age estimation via kernel partial least squares regression[C]// Boult T. IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2011: 657-664.
[20] LI Changsheng, LIU Qingshan, LIU Jing, et al. Learning ordinal discriminative features for age estimation[C]// Boult T. 2012 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2012: 2570-2577.
[21] GUO Guodong, WANG Xiaolong. A study on human age estimation under facial expression changes[C]// Boult T. 2012 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2012: 2547-2553.
[22] Han H, Otto C, Jain A K. Age estimation from face images: Human vs. machine performance[C]// Javier Ortega-Garcia. The 6th IAPR International Conference on Biometrics (ICB). NJ: IEEE, 2013: 1-8.
[23] SUO Jinli, WU Tianfu, ZHU Songchun, et al. Design sparse features for age estimation using hierarchical face model[C]// Cohn J. 8th IEEE International Conference on Automatic Face and Gesture Recognition (FG 2008). NJ: IEEE, 2008: 1-6.
[24] GUO Guodong, FU Yun, Dyer C, et al. Image-based human age estimation by manifold learning and locally adjusted robust regression[J]. IEEE Trans Image Process, 2008, 17(7): 1178-1188.
[25] YAN Shuicheng, WANG Huan, TANG Xiaoou, et al. Learning auto-structured regressor from uncertain non negative labels[C]// Davis L. Eleventh IEEE InternationalConferenceon Computer Vision (ICCV 2007). NJ: IEEE, 2007: 1-8.
[26] GUO Guodong, MU Guowang, FU Yun, et al. A study on automatic age estimation using a large database[C]// Matsuyama T. Twelfth IEEE InternationalConferenceon Computer Vision (ICCV 2009). NJ: IEEE, 2009: 1986-1991.
[27] YAN Shuicheng, ZHOU Xi, LIU Ming, et al. Regression from patch-kernel[C]// Ahuja N. 2008 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2008: 1-8.
[28] Wrigh J, MA Yi, Mairal J, et al. Sparse representation for computer vision and pattern recognition[J]. Proceedings of the IEEE, 2010, 98(6): 1031-1044.
[29] Lowe D. Distinctive image features from scale-invariant keypoints[J]. Int J Comput Vis, 2004, 60(2): 91-110.
[30] YANG Jianchao, YU Kai, GONG Yihong, et al. Linear spatial pyramid matching using sparse coding for image classification[C]// Huttenlocher D. 2009 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2009:1794–1801.
[31] ZOU Hai, Hastie T. Regularization and variable selection via the elastic net[J]. J Roy Statist Soc B, 2005, 67(2): 301-320.
[32] Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction[M]. 2nd ed. Berlin: Springer Verlag, 2009: 1-25.
[33] Lazebnik S, Schmid C, Ponce J. Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories[C]// Fitzgibbon A. 2006 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2006: 2169-2178.
[34] Boureau Y, Bach F, LeCun Y, et al. Learning mid-level features for recognition[C]// Davis L. 2010 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2010: 2559-2566.
[35] Sivic J, Zisserman A. Video Google: A text retrieval approach to object matching in videos[C]// Werner Bob. Ninth IEEE InternationalConferenceon Computer Vision (ICCV 2003). NJ: IEEE, 2003: 1470-1477.
[36] Serre T, Wolf L, Poggio T. Object recognition with features inspired by visual cortex[C]// Schmidt-Hellerau C. 2005 IEEE Conference on Computer Vision and Pattern Recognition. NJ: IEEE, 2005: 994-1000.
[37] Lee H, Battle A, Raina R, et al. Efficient sparse coding algorithms[C]// NIPS: MIT Press, 2007: 801-808.
[38] Lanitis A. The FG-NET Aging Database[OL]. [2014-03-01]. http://www.fgnet.rs- unit.com/.
[39] Ricanek K, Tesafaye T. MORPH: A longitudinal image database of normal adult ageprogression[C]// AFGR. NJ: IEEE, 2006: 341-345.
(编辑 陈灿华)
收稿日期:2014-07-15;修回日期:2014-09-20
基金项目(Foundation item):国家自然科学基金资助项目(60970098,61173122);湖南省自然科学基金资助项目(14JJ2008) (Projects(60970098, 61173122) supported by the National Natural Science Foundation of China; Project(14JJ2008) supported by the Natural Science Foundation of Hunan Province, China)
通信作者:梁毅雄,博士,副教授,从事图形图像处理研究;E-mail: yxliang@csu.edu.cn