乔百友
- 作品数:22 被引量:53H指数:5
- 供职机构:东北大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信天文地球生物学更多>>
- 一种基于网格索引的空间连接查询处理优化算法被引量:5
- 2014年
- 针对云环境下的空间数据连接查询处理问题,提出一种基于MapReduce框架的高效空间连接查询处理优化算法.该算法采用网格划分方法将数据空间划分成大小相同的网格单元,并将其中一类数据集中的每个空间对象,按照其中心点的位置划分到所在的网格单元中,从而避免了连接对象的复制,网格单元之间根据其所包含数据对象的交叠关系构建网格索引;对另一类数据集中的对象,仅将其复制到与网格单元中数据有交叠的网格单元,从而过滤掉不可能有连接结果的数据对象,大大减少了后续的连接计算代价.合成数据和真实数据集上的大量实验表明,本文提出的空间数据连接查询处理优化算法在性能上明显优于原有SJMR查询处理算法.
- 乔百友邓增安王秋杰朱红印孔德福王国仁
- 关键词:连接查询MAPREDUCE空间数据网格索引
- TH-Ring: 一种基于语义的结构化P2P网络
- 2007年
- 构建基于语义的P2P网络是支持基于语义的查找和提高网络性能的重要手段.考虑遵循某种分类层次的数据源的特点,提出了一种基于分类层次语义空间的P2P网络(TH-Ring),并给出具体实现算法. TH-Ring根据广度优先遍历算法对分类层次语义空间进行编码,为新加入的Peer提供PeerID的高32位.数据项根据所属分类加入到环中,同一个分类的数据项存储在环上连续的Peer上,这些Peer的PeerID高32位相同,低32位不同. Peer根据数据负载分布动态地加入或离开环. Peer之间根据PeerID的高32位建立路由关系,从而形成了一个基于语义的P2P网络.实验表明,TH-Ring具有良好的可用性和扩展性,而且数据项插入后的负载平衡维护代价相对很小.
- 乔百友谢可心王国仁
- 关键词:P2P
- 一种基于Spark的多路空间连接查询处理算法
- 2017年
- 针对云环境下空间数据连接查询处理问题,提出了一种基于Spark的多路空间连接查询处理算法BSMWSJ.该算法采用网格划分方法将整个数据空间划分成大小相同的网格单元,并将各类数据集中的空间对象,根据其空间位置划分到相应的网格单元中,不同网格单元中的空间数据对象进行并行连接查询处理.在多路空间连接查询处理过程中,采用边界过滤的方法来过滤无用数据,即通过计算前面连接操作候选结果的MBR来过滤后续连接数据集,从而过滤掉无用的连接对象,减少连接对象的多余投影与复制,并采用重复避免策略来减少重复结果的输出,从而进一步减少后续连接计算的代价.合成数据集和真实数据集上的大量实验结果表明:提出的多路空间连接查询处理算法在性能上明显优于现有的多路连接查询处理算法.
- 乔百友朱俊海郑宇杰申木川王国仁
- 关键词:云计算
- 一种基于语义的super-peer网络构建方法
- 2008年
- 针对分类层次语义空间,提出了一种基于语义的super-peer网络构建方法.该方法根据peer上数据的语义信息,动态地将peer聚簇成不同的语义簇,语义簇之间建立适当的语义路由关系.每个语义簇由一个super-peer节点和一组peer节点组成,仅负责回答其语义子空间上的查询.查询首先根据其语义被路由到适合的语义簇中,然后被转发给包含结果的peer.实验结果表明,该方法在查找性能和开销之间取得了一个良好的平衡,具有较高的查找性能和较低的查找代价,提高了网络的可扩展性.
- 乔百友王国仁邢云龙王彩荣
- 关键词:SUPER-PEER路由算法
- 基于分片的XML快速结构连接算法被引量:3
- 2008年
- 结构连接作为XML查询的重要部分,对查询性能来说起着非常重要的作用.目前有几种结构连接算法已经被提出,例如Stack-Tree、XR-tree.这些算法主要集中在节点之间关系的确定上.与之不同,作者从分片的角度去解决结构连接问题,首先把节点间的关系引申到分片之间的关系,从而得出各分片之间的一些性质,再利用分片间的性质来提高结构连接操作的性能.文中提出了一种基于分片的结构连接算法和两种优化方法,实验表明该算法在性能上要优于Stack-Tree算法和XR-tree算法.设计了一个简单而又高效的索引结构来存储分片结果,实验结果表明该索引结构的维护代价要小于XR-tree的维护代价.
- 王国仁乔百友韩东红王斌
- 关键词:XML
- 无线广播网络的可靠性的一个算法被引量:7
- 1998年
- 提出一个无线广播网络(RadioBroadcastNetwork,RBN)的概率有向图模型.利用该模型,证明了计算RBN的2终点可靠性是个NP困难问题,进而提出几个保可靠性约化(ReliabilityPreservingReduction)和一个计算RBN的2终点可靠性的因子算法.
- 孔繁甲乔百友王光兴
- 关键词:可靠性
- TH-Ring:一种基于语义的结构化P2P网络
- 构建基于语义的P2P网络是支持基于语义的查找和提高网络性能的重要手段.考虑遵循某种分类层次的数据源的特点,提出了一种基于分类层次语义空间的P2P网络(TH-Ring),并给出具体实现算法.TH-Ring根据广度优先遍历算...
- 乔百友谢可心王国仁
- 关键词:P2P
- 文献传递
- 决策树的并行训练策略被引量:4
- 2004年
- 随着生物科学技术的发展,其数据量的增长也非常迅速,很难在一定合理的时间内对数据进行建模和分析,因此,对并行数据挖掘算法的研究已变成解决此问题的重要途径。决策树途径已被广泛用作一种重要的分类工具,本文研究了几种决策树的并行训练策略并对它们的性能进行了比较。
- 刘欣阳王国仁乔百友韩东红
- 关键词:决策树数据挖掘人工神经元网络统计模型
- 并行后缀树的构造及查询算法被引量:5
- 2004年
- 针对生物信息领域中传统后缀树构造算法在时间和空间上的限制,从结构并行的角度提出了一种新颖的、适用于生物信息学应用的并行后缀树结构和相应的构造算法·该算法首先将给定字符串分成若干连续的片段,并在各个处理机上分别构造这些片段的后缀树,形成了一种分布于多个处理机上的并行后缀树结构·该并行算法不仅大大缩短了后缀树的构造时间,而且避免了主存大小的限制·经分析,其性能优于现有的任何一种并行算法·在此基础上,提出了一种高效的基于这种并行后缀树的字符串匹配算法,解决了传统后缀树的基本查询问题·
- 乔百友葛健王国仁韩东红
- 关键词:后缀树字符串匹配生物序列生物信息学
- XML路径表达式中公共子查询的优化技术被引量:3
- 2005年
- 研究了XML路径表达式的相关查询算法,提出了基于标注后缀树的XML路径表达式公共子查询的优化算法,通过冗余消除技术来提高路径表达式的查询效率·在REOA测试集上,通过对设计的查询进行测试,分析了基于标注后缀树的XML路径表达式公共子查询的优化算法的性能·实验结果表明,基于标注后缀树的XML路径表达式冗余消除技术可以极大地提高路径表达式的查询效率·
- 韩东红王国仁乔百友
- 关键词:查询优化