基于加权极限学习机的肿瘤基因表达谱数据分类
来源期刊:东北大学学报(自然科学版)2017年第6期
论文作者:姜琳颖 余东海 石鑫
文章页码:798 - 803
关键词:基因;表达谱数据;加权极限学习机;不平衡性;肿瘤分类;
摘 要:基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.
姜琳颖,余东海,石鑫
东北大学软件学院
摘 要:基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.
关键词:基因;表达谱数据;加权极限学习机;不平衡性;肿瘤分类;