周傲英
- 作品数:339 被引量:4,351H指数:35
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术经济管理文化科学天文地球更多>>
- XML DTD文档聚类研究
- 本文针对XML、DTD文档的聚类方法不同传统的文本聚类算法,在词义方面,引入了模糊概念词典到聚类模型中,可以充分考虑到DTD文档中元素在语义上的概念关系.
- 王晓宇钱卫宁张龙周傲英
- 关键词:可扩展标记语言文档聚类
- 文献传递
- 基于对象异常频度的数据流阈值查询
- 2013年
- 数据流查询与处理技术广泛应用在金融系统等诸多领域中,银行卡交易系统中存在的由终端复用所导致的不规范交易即是一个典型案例.此类不规范交易存在两个特点:(1)对象频繁出现;(2)对象的值序列频繁波动.然而,现有的频繁项挖掘算法仅考虑第一个特点,无法有效解决问题,亟需开发新技术进行检测.文中首先形式化地定义了这类不规范交易查询,再设计了多个创新算法进行处理.此外,文中还将工作扩展到滑动窗口模型以处理数据流演化问题.理论分析与实验结果均表明所提方法具有较佳性能,空间复杂度与时间复杂度都较低.
- 张敬伟金澈清林煜明周傲英
- 关键词:数据流查询
- 确定型演绎数据库的查询求值被引量:1
- 1990年
- 本文针对确定型演绎数据库的查询求值问题提出了一种系统的、高效的编译方法。决定DDB效率的两个关键因素是冗余和可能相关事实。为能消除冗余和最小化可能相关事实,我们把编译过程分为两个子阶段。第一子阶段是预编译阶段,它负责可能相关事实的最小化;被称为一般编译阶段的第二子阶段负责冗余的消除。本文对J.D.Ullman提出的规则/目标图进行了合理的扩展,并以此作为统一的形式化体系。对应这两个子阶段,我们分别给出了通用算法的直观的和形式化的描述。
- 周傲英
- 关键词:演绎数据库数据库查询
- 实时监测流数据突变的方法
- 本发明为一种实时监测数据突变的方法。该方法首先对现有监测方法关于数据突变的定义进行了扩充,提出了动态地监测突变的定义;其次,引入了倒置桶序列的直方图算法(BOIH),利用很小的空间精确地压缩采样数据流x1,x2…xn;当...
- 秦首科周傲英
- 文献传递
- 数据科学与工程:大数据时代的新兴交叉学科被引量:38
- 2015年
- 大数据时代的IT发展的基本特点是:应用驱动创新,开源加速创新,硬件助力创新。基于对这些特点的认识,从社会创新发展、人才需求变化、技术发展趋势等方面论述了数据科学与工程这一新兴交叉学科的发展必然性,进一步阐述了数据科学与工程学科的特点、学科内涵与知识体系,最后从科学研究、系统开发和人才培养的角度探讨了数据科学与工程学科的建设思路。
- 周傲英钱卫宁王长波
- 关键词:大数据
- 一种利用缓存将关系数据发布为XML文档的优化方法
- 本发明属数据库技术领域,具体为一种利用缓存将一种关系数据发布为XML格式文档的优化方法。它采用存储频繁的用户发布请求以及相应的关系结果,从而加速对用户发布请求的相应速度。针对此问题提出了发布请求树,发布根子树,频繁发布根...
- 邱洋周傲英
- 文献传递
- 流数据分析与管理综述被引量:249
- 2004年
- 有关流数据分析与管理的研究是目前国际数据库研究领域的一个热点.在过去30多年中,尽管传统数据库技术发展迅速且得到了广泛应用,但是它不能够处理在诸如网络路由、传感器网络、股票分析等应用中所生成的一种新型数据,即流数据.流数据的特点是数据持续到达,且速度快、规模宏大;其研究核心是设计高效的单遍数据集扫描算法,在一个远小于数据规模的内存空间里不断更新一个代表数据集的结构棗概要数据结构,使得在任何时候都能够根据这个结构迅速获得近似查询结果.综述国际上关于流数据的概要数据结构生成与维护的研究成果,并通过列举解决流数据上两个重要问题的各种方案来比较各种算法的特点以及优劣.
- 金澈清钱卫宁周傲英
- 关键词:流数据概要数据结构
- 基于概念格的Web服务管理技术被引量:4
- 2005年
- W eb服务的有效管理是实现服务发现和服务组合的关键。文中定义了W eb服务及服务间的关系等基本概念,在W eb服务管理中引入了形式概念分析(FCA)的方法,建立了描述服务间相互关联的概念格,分析了如何通过概念格对W eb服务进行有效地管理,并实现了概念格的增量维护。对模拟数据和真实数据的相关实验表明,文中提出的基于概念格的方法能有效地实现W eb服务管理,提供了一种规范的对服务功能的分类管理策略,对服务发现也有较好的检索效果。
- 周傲英彭敦陆王晓玲
- 关键词:WEB服务管理形式概念分析概念格WEB服务发现
- 一种用于保证语义可串行性的并发控制算法
- 本文所给出的算法弥补了文献中的算法不足,同时为语义可串行性在支持乐观并发控制算法的实际系统中的进一步应用奠定了理论基础.
- 陈子军刘国华周傲英
- 关键词:数据库管理系统并发控制可串行性事务处理
- 文献传递
- 基线与增量数据分离架构下的分布式连接算法被引量:6
- 2016年
- 在大数据背景下,数据库系统表连接操作的效率急需优化,尤其对于基线与增量数据分离的数据库系统来说,其连接操作更是成为其性能的主要瓶颈.为了有效提升事务处理的性能,在基线与增量数据分离的数据库系统架构中,通常将基线数据存储于磁盘中,增量数据存储于内存中,进而获得较高的事务处理吞吐量和可扩展性.Hbase、BigTable、OceanBase等系统是典型的基线与增量数据分离的数据库管理系统,但是他们的表连接效率较低,其主要原因包括:每次表连接前必须先合并基线数据和增量数据;数据存储模式更为复杂,导致过大的网络开销.该文提出了一种基线与增量数据分离架构下的排序归并连接优化算法.该算法对连接属性做范围切分,在多个节点上并行做排序归并连接.该算法无需在连接前合并基线数据和增量数据,进而实现对基线和增量数据并行处理,同时也避免了大量非连接结果集数据的基线与增量合并操作.并在开源的数据库OceanBase上实现了该算法,通过一系列实验证明,该算法可以极大提高OceanBase数据库的表连接处理性能.
- 樊秋实周敏奇周傲英
- 关键词:增量数据并行处理