国家自然科学基金(51079040)
- 作品数:24 被引量:136H指数:8
- 相关作者:万定生朱跃龙李士进余宇峰李宇更多>>
- 相关机构:河海大学中华人民共和国水利部国家工程研究中心更多>>
- 发文基金:国家自然科学基金引进国际先进农业科技计划“十一五”国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术水利工程天文地球电子电信更多>>
- 水利普查成果分析中数据立方体计算研究被引量:3
- 2014年
- n维的立方体将生成2n个聚集立方体。如何进行立方体计算,在存储空间和查询时间方面寻求平衡,成为多维分析应用中的关键问题。基于部分物化的策略,并结合水利普查数据特征,改进Minimal cubing方法,提出了层次维编码片段方法HDEF cubing。该方法利用编码长度较小的层次维编码及其前缀,快速检索出与查询关键字相匹配的层次维编码,减少了多表连接操作,从而提高查询效率。以水利普查数据为例,验证了改进的立方体计算方法能高效地对立方体进行存储和查询,适用于水利普查成果分析。
- 朱凯万定生程习锋
- 关键词:水利普查数据立方体MINIMAL
- 一种极端降水预测方法研究被引量:2
- 2014年
- 为了提高极端降水量的预测精度,将小波分析、支持向量机以及遗传算法相结合,建立了一种极端降水预测模型。首先利用小波变换对极端降水数据进行分解,分离出序列中的低频信息和高频信息;然后对各子序列分别用遗传算法优化的支持向量机进行训练和预测;最后将各子序列的预测结果叠加,得到极端降水量的最终预测结果。实验表明,该组合模型能准确揭示极端降水的变化特性,具有更高的预测精度,从而为极端降水量的预测提供了一种有效方法。
- 唐娟万定生程习锋
- 关键词:极端降水小波分析支持向量机遗传算法
- 基于语义相似的水文时间序列相似性挖掘——以太湖流域大浦口站水位数据为例被引量:10
- 2011年
- 利用数据挖掘技术从长期观测的数据序列中发现蕴藏的规律是当前研究热点之一。相似性挖掘是时间序列挖掘的基础,提出一种基于语义相似的水文时间序列相似性查询方法。首先利用小波变换将时间序列进行平滑处理,在此基础上进行极值点分段并符号化,每个符号代表一种语义模式,从而选取语义相似的子序列作为候选集,再将候选集中子序列通过动态时间弯曲距离进行精确匹配从而得到相似子序列(以太湖流域大浦口站水位数据为例),实验证明,该方法能够在大幅度降低时间复杂度的基础上较准确地查找出相似子序列。
- 朱跃龙王咏梅万定生李薇梅青余达征
- 关键词:水文时间序列语义相似动态时间弯曲距离
- 数据挖掘在太湖水质环境分析中的应用研究
- 引水工程中引水时延分析是一个很重要的问题。采用典型相关分析与时延数据处理法进行引水时延分析,对水源地水质数据和引水水质数据、引水水量数据以及太湖水位数据这两组变量进行综合分析挖掘,得到引水对水源地的影响时延以及对应的相关...
- 万定生陈涛陆铭锋李士进
- 关键词:数据挖掘水质分析
- 基于水利普查数据的函数依赖关系算法被引量:1
- 2014年
- 条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时重新定义条件函数依赖,改进发现条件函数依赖的算法(即CTANE算法);以水库工程数据为例,验证本文改进的算法能准确高效地发现水利普查数据中的条件函数依赖,为检测数据一致性做好准备。
- 钱振兴万定生李士进程习锋
- 关键词:条件函数依赖维度
- 基于Sequitur的时间序列异步周期模式挖掘
- 2012年
- 现有的时间序列异步周期模式挖掘方法是在获取1-pattern有效段及周期的基础上再以枚举法得到i-patterns,时间复杂度较高。为解决该问题,提出一种改进的异步周期模式挖掘方法。在时间序列符号化后,使用基于Sequitur的候选模式算法获取候选i-patterns及其事件位置序列,通过基于OEOP的i-patterns有效段生成算法得到1-pattern和i-patterns的有效段及周期,从而生成有效子序列。实验结果表明,该方法具有较高的挖掘效率。
- 陈遥朱跃龙冯钧李士进
- 关键词:时间序列符号化数据挖掘
- 水文时间序列相似性查询优化算法被引量:3
- 2013年
- 为了快速、准确找出给定时间段相似的水文过程,提出了一种语义相似性匹配下加权动态时间弯曲距离和标准欧式距离结合的查询优化算法。针对水文数据特点,在小波变换、特征点分段和语义符号化过程的前提下,用语义相似匹配和离散区间初步筛选候选集,使用加权动态时间弯曲距离对候选子序列进行近似匹配,利用改进欧式距离通过左右搜索法进一步优化相似结果。以鄱阳湖康山站日水位数据为例,表明了该算法在降低时间复杂度的前提下较准确地找出相似子序列。
- 程习锋万定生王亚明
- 关键词:时间序列欧式距离语义相似
- 基于降雨类型直方图分析的降雨站点相似性研究被引量:2
- 2013年
- 为研究降雨观测站点间的相似性,提出了基于单场降雨类型直方图分析的降雨站点相似性比较模型。首先提取降雨时间序列中的雨量项,经过数据预处理,选择和提取单场降雨特征,并将这些特征统计量进行数据标准化处理;采用基于Davies-Bouldin指数聚类有效性指数的K-means方法进行聚类,最后对聚类结果进行基于单场降雨的降雨类型直方图相似性分析。实验结果符合相关区域的站点相似性实际情况,表明该相似性模型是可靠的,具有较好的应用价值。
- 章龙飞朱跃龙李士进高祥涛
- 关键词:特征提取
- 水文数据库数据质量控制与管理应用研究被引量:11
- 2013年
- 数据质量问题已经成为水文信息化过程成败的重要影响因素。本文以水文数据库为背景,分析了水文数据质量评估关键指标维度、数据质量问题的来源及其分类,建立了水文数据库数据质量评估模型和控制模型,并从实践角度探讨了数据质量控制和改进的若干方法。
- 余宇峰张建新朱跃龙万定生
- 关键词:数据质量维度
- 基于Oracle BIEE水利普查数据展现系统研究被引量:2
- 2012年
- 为从多方面清晰、简洁、直观地展现水利普查数据,设计了基于Oracle BIEE的水利普查数据展示系统。对水利普查数据的特点以及BIEE架构进行分析描述,在BI管理工具上设计了资料库Repository三层模型,然后通过BI Answer进行开发设计报表,并统一在仪表盘布局中进行展现。仪表盘的实际运行结果表明了该设计思想的有效性和可行性。
- 占军万定生李宇
- 关键词:ORACLE水利普查数据展示数据仓库