华侨大学信息管理系
- 作品数:16 被引量:84H指数:6
- 相关作者:李铮更多>>
- 相关机构:兰州大学数学系更多>>
- 发文基金:国家自然科学基金福建省社会科学规划项目福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理理学社会学更多>>
- 基于动态时间弯曲的股票时间序列联动性研究
- 针对股票联动性的研究,传统时间序列分析方法主要使用市场、行业或板块等大规模金融数据进行分析并得到较为宏观的结论,对于个股数据波动的分析与挖掘存在一定的局限性。鉴于此种情况,本文提出一种基于动态时间弯曲的股票时间序列联动性...
- 李海林梁叶
- NWUC寿命分布类的一个充分条件
- 2001年
- 讨论 NWUC寿命分布类 ,证明了若一个更新过程的剩余寿命函数随时间依凸序随机递增 ,则其到达间隔是 NWUC的 .
- 李效虎伍锦棠
- 关键词:可靠性剩余寿命
- 期刊论文数据分析系统设计与实现
- 2017年
- 针对传统期刊文献的研究存在的局限性,提出一种基于数据挖掘的期刊分析系统。系统利用JSF Web开发技术,以Java为主要开发语言,结合中国知网文献数据辅以Primefaces开源类库,Echarts为主要绘图工具的B/S架构期刊分析系统。系统将包含期刊论文作者、机构、被引频次等属性的数据自动解析,结合文献计量学、关联规则、共现分析等方法实现数据挖掘,并利用可视化结果帮助编辑部与学者进行管理决策。
- 黄思雨许振雪王昶茹肖宏宇
- 关键词:数据挖掘系统设计JAVA
- 基于同步频繁树的时间序列关联规则分析被引量:6
- 2021年
- 针对经典算法Apriori和频繁模式增长算法(frequent pattern growth, FP-growth)不能直接对时间序列数据进行关联规则挖掘的问题,提出一种同步频繁树算法(synchronize frequent tree, SFT)。利用时间序列的时间属性具有一维性的特点,定义趋势项-位置表示法表示时间序列数据,将首条时间序列构建成一棵基础树,通过计算树叶子节点与列表项的信息交集,可判断其是否与该树枝中的所有节点构成频繁K项集。在SFT算法中,用趋势项-位置表示的数据内存占用情况要优于原始数据,并且在挖掘过程中不会产生候选频繁项集,使得算法在整个挖掘过程中表现出较好的时间性能。基于商品数据和股票数据的数值实验表明,SFT算法所得结果不仅与其他5种对比算法的结果一致,在各量级的数据和不同的支持度计数中,其时间复杂度都要优于对比算法。
- 李海林龙芳菊
- 关键词:时间序列频繁项集关联规则
- 基于动态时间弯曲的股票时间序列联动性研究被引量:3
- 2016年
- 对于股票联动性的研究,传统时间序列分析方法及目前数据挖掘技术主要使用国内或者国外股票指数来研究市场、板块或行业之间的联动关系,并得到一些较为宏观的结论,存在着缺少直接分析与挖掘个股数据之间的联动性的问题。鉴于此,本文提出一种基于动态时间弯曲的股票时间序列联动性研究方法。通过动态时间弯曲找出若干只形态相似的股票,并在此基础上获得相关的重要信息,再提出基于动态时间弯曲的k-means聚类方法实现股票聚类,进而得到具有相同波动趋势的股票簇。实验结果表明,新方法能从大量股票中准确找到具有联动关系的个股,区分开不同波动趋势的股票簇,具有一定的优越性。
- 李海林梁叶
- 关键词:动态时间弯曲K-MEANS聚类
- 基于簇中心群的时间序列数据分类方法被引量:8
- 2017年
- 分类算法是时间序列数据挖掘中极为重要的任务和技术,该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分,利用近邻传播算法分别对每个簇进行中心代表点选择,构造出各代表点的代表对象集;然后借助基于动态时间弯曲的均值中心方法对各代表对象集实现中心群计算,结合改进后的K近邻算法实现时间序列数据的分类。数值实验结果表明,与传统方法相比,新方法具有更好的分类效果和计算性能。
- 李海林万校基
- 关键词:数据挖掘动态时间弯曲时间序列
- 大数据环境下的管理信息系统发展研究被引量:33
- 2016年
- 大数据时代的到来给管理信息系统带来了一定的冲击和挑战,因此有必要研究大数据对现代管理信息系统的作用及影响,使得管理信息系统的性能和社会服务作用得到进一步提升。首先从数据的内涵与特征来理解大数据的概念,接着从数据处理过程的角度来讲述大数据对管理信息系统业务流程的变化和影响,同时,从管理信息系统的构成来解析大数据对于管理信息系统的推动与发展作用。最后,针对基于大数据环境下的信息安全和信息人才短缺等问题进行了探讨,并提出了相关的解决方案。
- 杨丽彬李海林张飞波
- 关键词:大数据管理信息系统数据挖掘信息处理
- 基于频繁模式发现的时间序列异常检测方法被引量:11
- 2018年
- 针对传统异常片段检测方法在处理增量式时间序列时效率低的问题,提出一种基于频繁模式发现的时间序列异常检测(TSAD)方法。首先,将历史输入的时间序列数据进行符号转化;其次,利用符号化特征找出历史序列数据集中的频繁模式;最后,结合最长公共子序列匹配方法度量频繁模式与当前新增加时间序列数据之间的相似度,从而发现新增加数据中的异常模式。与基于滑动窗口预测的水文时间序列异常检测方法(TSOD)和基于扩展符号聚集近似的水文时间序列异常挖掘方法(ESAA)相比,对于实验选择的三种类型的时间序列数据,TSAD的检测率都超过90%;TSOD对规则性较强的序列检测率较高,能达到99%,但对噪声干扰较大的序列检测率较低,对数据偏向性较强;ESAA对三种类型的数据检测率均不超过70%。实验结果表明,TSAD在时间序列异常检测中能够较好地发现异常片段。
- 李海林邬先利
- 关键词:时间序列异常检测检测率
- 基于特征矩阵的多元时间序列最小距离度量方法被引量:7
- 2015年
- 相似性度量是多元时间序列数据挖掘任务过程中一项重要的前期工作,度量质量直接影响到后期整个数据挖掘的性能和结果。利用主成分分析方法对数据集中的每个多元时间序列数据进行特征分析,提取其特征矩阵并且构建相应的新正交坐标系。通过夹角公式来度量2个正交坐标系之间距离,并且结合匈牙利算法计算它们之间的最小距离,进而实现了一种基于特征矩阵的多元时间序列最小距离度量方法。实验结果表明,与传统方法相比,新方法具有较好的相似性度量质量,提高了多元时间序列的数据挖掘效果。
- 李海林郭韧万校基
- 关键词:多元时间序列特征矩阵主成分分析数据挖掘
- 基于Struts和Hibernate框架的比价网设计与实现
- 2007年
- 介绍了主要应用Struts和Hibernate两种框架技术实现的一个图书比价网系统。对实现比价功能的网络爬虫算法进行了详细阐述,并分析了两种框架技术在该B/S系统中组合应用的要点,为相关领域人员提供借鉴经验。
- 李向阳李铮
- 关键词:网络爬虫STRUTS框架HIBERNATE框架