简介概要

基于HADOOP集群的数据采集和清洗

来源期刊:软件工程2016年第11期

论文作者:刘晨 焦合军

文章页码:20 - 24

关键词:海量数据;Hadoop;hive;数据采集;数据清洗;

摘    要:互联网的到来,使计算机行业蓬勃发展,各公司的业务数据也都到达P级别的数据量。本文结合Hadoop框架的中Hive和Hbase,对各个模块进行了详细的描述,重点分析了集群搭建步骤,及如何对集群的数据进行采集和清洗,并通过建立表来存储分析结果。

详情信息展示

基于HADOOP集群的数据采集和清洗

刘晨1,焦合军2

1. 71320部队2. 河南工程学院计算机学院

摘 要:互联网的到来,使计算机行业蓬勃发展,各公司的业务数据也都到达P级别的数据量。本文结合Hadoop框架的中Hive和Hbase,对各个模块进行了详细的描述,重点分析了集群搭建步骤,及如何对集群的数据进行采集和清洗,并通过建立表来存储分析结果。

关键词:海量数据;Hadoop;hive;数据采集;数据清洗;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号