简介概要

一种面向医学短文本的自适应聚类方法

来源期刊：东北大学学报(自然科学版)2015年第1期

论文作者：栗伟许洪涛赵大哲刘积仁

文章页码：19 - 23

关键词：聚类分析;相似性度量;频繁序列模式;电子病历;相似度分布;

摘要：针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义.

详情信息展示

一种面向医学短文本的自适应聚类方法

栗伟¹，许洪涛²，赵大哲^1,3，刘积仁³

1. 东北大学医学影像计算教育部重点实验室2. 郑州市人力资源和社会保障数据管理中心3. 东软集团股份有限公司

摘要：针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义.

关键词：聚类分析;相似性度量;频繁序列模式;电子病历;相似度分布;

<上一页 1 下一页 >

相关论文

基于模糊聚类分析的临床路径决策研究

基于核熵成分分析的热轧带钢自适应聚类分析

运用DEA方法进行聚类分析

基于聚类分析方法的CCD测量原井下煤仓煤位改进测量模型研究

和声搜索算法在聚类分析中的应用

基于聚类分析的锚测验等值样本选取方法研究

一种基于改进客观聚类分析的模糊辨识方法

基于自适应模糊聚类分析的重力张量欧拉反褶积解

一种基于加权聚类分析的岩体可爆性分级方法

一种基于聚类分析的3MAD-MMMD过失误差侦破方法

相关知识点

相似性度量

聚类分析的计算方法与步骤

模糊聚类分析的基本思想和计算方法

聚类分析基础

聚类分析数据变换

采煤工作面环境状况的模糊聚类分析

聚类分析地质应用实例

采煤工作面环境状况的模糊聚类分析

最大最小聚类法

分级方法与分级表

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号