基于MapReduce的关系型数据仓库并行查询
来源期刊:东北大学学报(自然科学版)2011年第5期
论文作者:师金钢 鲍玉斌 冷芳玲 于戈
文章页码:626 - 629
关键词:MapReduce;数据仓库;并行计算;分布式数据库;查询优化;
摘 要:针对MapReduce框架与传统关系型数据库兼容性不好的问题,提出了一种基于分块结构的分布式关系数据库ChunkDB.并对MapReduce架构进行了扩展设计,使ChunkDB与MapReduce有效结合,将MapReduce的扩展性、易操作性、高并行性与关系数据库的索引等查询优化优势相结合.实验证明基于MapReduce的ChunkDB数据库能够为数据仓库应用提供快速高效的并行查询.
师金钢,鲍玉斌,冷芳玲,于戈
东北大学信息科学与工程学院
摘 要:针对MapReduce框架与传统关系型数据库兼容性不好的问题,提出了一种基于分块结构的分布式关系数据库ChunkDB.并对MapReduce架构进行了扩展设计,使ChunkDB与MapReduce有效结合,将MapReduce的扩展性、易操作性、高并行性与关系数据库的索引等查询优化优势相结合.实验证明基于MapReduce的ChunkDB数据库能够为数据仓库应用提供快速高效的并行查询.
关键词:MapReduce;数据仓库;并行计算;分布式数据库;查询优化;