黑龙江省教育厅科学技术研究项目(11531276)
- 作品数:9 被引量:56H指数:5
- 相关作者:李建中杨东华韩希先高宏任倩倩更多>>
- 相关机构:哈尔滨工业大学黑龙江大学佳木斯大学更多>>
- 发文基金:黑龙江省教育厅科学技术研究项目国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- TKEP:海量数据上一种有效的Top-K查询处理算法
- 在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理top-k查询,从而适合于随机读受限或不可能的...
- 韩希先杨东华李建中
- 关键词:海量数据TOP-K
- 文献传递
- 海量数据上的近似连接聚集操作被引量:3
- 2010年
- 连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此提出了一种新的算法——(p,ε)-近似连接聚集查询(pε-AJA)来有效地返回满足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本(JRS)和连接位置索引对表(JPIPT).利用JRS,pε-AJA向用户返回近似结果的快速响应.如果利用JRS得到的近似结果没有满足给定的置信区间,pε-AJA利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPIPT和JRS有效的构建和维护算法.实验结果表明:pε-AJA可以获得相对于准确查询1~5个数量级的加速,并且可以有效地完成JPIPT和JRS的构建和维护操作.
- 韩希先杨东华李建中
- 关键词:海量数据
- TKEP:海量数据上一种有效的Top-K查询处理算法被引量:18
- 2010年
- 在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理top-k查询,从而适合于随机读受限或不可能的场合.文中详细地分析了NRA算法的执行行为,确定了增长阶段和收缩阶段中每个文件需要扫描的元组个数.文中发现在海量数据环境中,NRA在增长阶段需要维护大量的候选元组,严重影响了算法的执行效率.所以,文中提出一种新的海量数据上的top-k查询算法TKEP,该算法在查询的增长阶段就执行早剪切,从而大大减少增长阶段需要维护的候选元组.文中给出了早剪切操作的数学分析,确定了早剪切操作的理论和实际剪切效果.据作者所知,该文是第一篇提出在top-k查询的增长阶段执行早剪切的文章.实验结果表明,和传统的NRA相比,TKEP在增长阶段维护的元组数量减少3个数量级,需要的内存量减少1个数量级,TKEP算法获得1个数量级的加速比.
- 韩希先杨东华李建中
- 关键词:海量数据TOP-K
- RB树:一种支持空间近似关键字查询的外存索引被引量:9
- 2012年
- 空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给定阈值.随着当前数据的爆炸性增长,空间数据库无法完整地存放在内存中,因此空间数据库需要支持空间近似关键字查询的外存索引.目前,还没有在外存中支持精确的空间近似关键字查询的索引结构.设计了一种新型的外存索引RB树,在外存中支持精确的空间近似关键字查询.RB树支持的空间近似关键字查询包括多种空间条件,如范围查询、NN查询,同时支持多种关键字相似性度量,包括编辑距离、规范化编辑距离等.通过真实数据中的性能测试验证了RB树的效率.
- 王金宝高宏李建中杨东华
- 关键词:空间数据库关键字查询处理索引外存
- DBCC-Join:一种新的高速缓存敏感的磁盘连接算法
- 随着CPU和内存的性能差距越来越大,系统设计者在CPU寄存器和内存之间插入高速缓存来弥补这个差距.高速缓存的数据存取速度远高于内存,所以数据库操作要获得更好的性能就必须考虑充分利用高速缓存.基于磁盘的连接操作是一种常用并...
- 韩希先杨东华李建中
- 文献传递
- 传感器网络中一种基于两阶段睡眠调度的目标跟踪协议被引量:9
- 2009年
- 移动目标跟踪是传感器网络的一个重要应用.网络中传感器节点协作发现目标并将对目标的感知信息反馈给用户.为了有效地减少网络能耗和提高跟踪质量,文中提出一种基于两阶段睡眠调度的目标跟踪协议.该协议将整个跟踪过程划分成两个阶段,根据各阶段对节点密度要求的不同,分别采用不同的睡眠调度机制.文中进一步对所提出协议进行优化,在保证跟踪质量的同时最小化系统能耗.最后用36个传感器结点验证了所提出协议的有效性.
- 任倩倩李建中高宏程思瑶
- 关键词:无线传感器网络目标跟踪睡眠调度网络覆盖网络划分
- 传感器网络簇头选举与调度策略研究被引量:6
- 2010年
- 为了最大化分簇网络的生存周期,提出基于线性规划的簇头选举策略(LPCHS)和基于簇头时间比的簇头调度算法(CHSA).LPCHS根据数据流守恒约束和能量约束等条件,建立线性规划方程,得到簇生存周期、簇中各节点轮为簇头的时间及相应的簇头时间比.CHSA采用多路径路由技术完成簇间数据转发,得到基于簇头时间比的簇头调度方案.
- 柳絮李金宝纪守领郭龙江惠丽
- 关键词:传感器网络簇头选举
- DBCC-Join:一种新的高速缓存敏感的磁盘连接算法被引量:6
- 2010年
- 随着CPU和内存的性能差距越来越大,系统设计者在CPU寄存器和内存之间插入高速缓存来弥补这个差距.高速缓存的数据存取速度远高于内存,所以数据库操作要获得更好的性能就必须考虑充分利用高速缓存.基于磁盘的连接操作是一种常用并且耗时的数据库查询操作,可是大多数传统的连接算法在设计时都没有考虑高速缓存的使用,从而使得这些连接算法无法充分利用CPU的能力.文中分析了传统的连接算法在高速缓存利用方面的问题,并且提出了一种新的可以充分利用高速缓存的磁盘连接算法DBCC-Join.连接位置索引对表JPIPT是用到的数据结构,说明了每个连接结果元组在各自表中的位置索引对.DBCC-Join的执行包括两个阶段:JPIPT构建阶段和结果输出阶段.JPIPT构建阶段对列存储化的连接属性执行高速缓存敏感的算法来构建连接位置索引对表.利用获得的JPIPT,结果输出阶段只需要对数据表执行一遍顺序扫描就可以获得结果.该文是第一篇提出利用高速缓存的磁盘连接算法的文章.实验表明,和传统磁盘连接算法相比,DBCC-Join算法可以获得一个数量级的加速比.
- 韩希先杨东华李建中
- 基于遗传优化策略的传感器配置算法被引量:3
- 2011年
- 传感器配置是传感器网络研究的核心问题之一.传感器网络配置可以有效布置传感器网络节点、合理覆盖感知数据区域、延长感知区域传感器网络的运行周期,既能够准确地采集感知区域的数据信息,又能够充分管理传感器网络资源.本文提出了在传感区域中一个有效的基于遗传算法策略的的传感器配置算法,算法目标在于优化传感器数量并且确定它们的位置以支持分布式传感器网络.实验结果表明这种算法非常有效.
- 张海燕任倩倩
- 关键词:传感器网络
- 无线传感器网络中一种基于动态网格的查询处理方法
- 2011年
- 为减少传感器网络能耗,本文提出了一种基于动态网格的查询处理方法,该方法可以有效地利用节点的网格拓扑结构对查询进行优化,从而减少数据发送量,降低整个网络能耗.在模拟环境下验证了文中所提出方法的有效性.
- 任倩倩刘振尧
- 关键词:传感器网络查询处理网格