一种新的Web用户群体和URL聚类算法的研究
来源期刊:控制与决策2007年第3期
论文作者:宋江春 沈钧毅
文章页码:284 - 288
关键词:Web使用挖掘;用户浏览模式;用户访问矩阵;用户事务聚类;站点URL聚类;
摘 要:提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.
宋江春,沈钧毅
摘 要:提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.
关键词:Web使用挖掘;用户浏览模式;用户访问矩阵;用户事务聚类;站点URL聚类;