基于不确定数据的分布式Top-k查询算法
来源期刊:东北大学学报(自然科学版)2010年第2期
论文作者:王爽 王国仁
文章页码:177 - 180
关键词:Top-k查询;不确定数据;分布式处理;通信代价;查询处理;
摘 要:目前基于不确定数据的Top-k查询算法仅考虑了集中式的环境,为了解决分布式系统中节省系统带宽的问题,在此基础上,提出了在分布式环境中基于不确定数据的Top-k查询算法UDTopk.该算法定义了一个候选集(candidate set),仅使用候选集中的数据,而不用访问数据集中所有数据,就可以得到正确的Top-k查询答案.算法通过动态维护候选集、仅传输少量数据,达到减少网络中数据传输的目的.实验结果表明,该算法可以有效地节省网络带宽.
王爽1,2,王国仁2
1. 东北大学软件学院2. 东北大学信息科学与工程学院
摘 要:目前基于不确定数据的Top-k查询算法仅考虑了集中式的环境,为了解决分布式系统中节省系统带宽的问题,在此基础上,提出了在分布式环境中基于不确定数据的Top-k查询算法UDTopk.该算法定义了一个候选集(candidate set),仅使用候选集中的数据,而不用访问数据集中所有数据,就可以得到正确的Top-k查询答案.算法通过动态维护候选集、仅传输少量数据,达到减少网络中数据传输的目的.实验结果表明,该算法可以有效地节省网络带宽.
关键词:Top-k查询;不确定数据;分布式处理;通信代价;查询处理;