简介概要

大数据环境下基于前缀树的频繁项集挖掘

来源期刊：控制工程2019年第11期

论文作者：黄彩娟刘卓华所辉杨滨

文章页码：2136 - 2140

关键词：频繁项集挖掘;MapReduce;前缀序列树;模糊支持度;大数据;

摘要：针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显著地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。

详情信息展示

大数据环境下基于前缀树的频繁项集挖掘

黄彩娟¹，刘卓华¹，所辉¹，杨滨²

1. 广东机电职业技术学院计算机与设计学院2. 江南大学设计学院

摘要：针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显著地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。

关键词：频繁项集挖掘;MapReduce;前缀序列树;模糊支持度;大数据;

<上一页 1 下一页 >

相关论文

基于图形处理器的频繁项集挖掘

分布式全局最大频繁项集挖掘算法

滑动窗口下数据流完全加权最大频繁项集挖掘

含正负项目的基于位串频繁项集挖掘算法研究

一种面向数据流的频繁项集挖掘算法

基于渐近取样的频繁项集挖掘近似算法

隐私保护频繁项集挖掘中的细粒度随机化模型

MAXFP-Miner:利用FP-tree快速挖掘最大频繁项集

用有序FP-tree挖掘最大频繁项集

基于频繁项集树的时态关联规则挖掘算法

相关知识点

大数据助力新材料智能化设计与制造

利用数据挖掘技术进行SARS流行与环境

事故树的定量分析

事故树的定量分析

矿山数据挖掘方法

大数据在锡新材料研发中的应用并不遥远

数据挖掘的步骤

事故树分析的步骤

矿山数据挖掘模式

事故树的最小割集和最小径集

数据挖掘的模式

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号