简介概要

面向Web的文本挖掘技术研究

来源期刊:控制工程2003年第S1期

论文作者:徐妙君 顾沈明

文章页码:44 - 96

关键词:数据挖掘;文本挖掘;Internet;

摘    要:简要介绍了文本挖掘技术,并描绘了该技术在Web应用特别是信息检索技术中的重要性。再对整个文本知识挖掘过程所涉及的各个方面进行了进一步地研究探讨,包括了文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价等几个方面。其间运用数据挖掘技术对各个过程进行处理,并引进基于评估函数的特征筛选算法、词频矩阵、余弦计算法和潜在语义标引等方法来处理文本挖掘过程所产生的问题。在此基础上得出了一个完整的Web文本挖掘过程。最后展望了文本挖掘技术在Web应用中的前景。

详情信息展示

面向Web的文本挖掘技术研究

徐妙君,顾沈明

摘 要:简要介绍了文本挖掘技术,并描绘了该技术在Web应用特别是信息检索技术中的重要性。再对整个文本知识挖掘过程所涉及的各个方面进行了进一步地研究探讨,包括了文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价等几个方面。其间运用数据挖掘技术对各个过程进行处理,并引进基于评估函数的特征筛选算法、词频矩阵、余弦计算法和潜在语义标引等方法来处理文本挖掘过程所产生的问题。在此基础上得出了一个完整的Web文本挖掘过程。最后展望了文本挖掘技术在Web应用中的前景。

关键词:数据挖掘;文本挖掘;Internet;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号