蔡青林 作品数:18 被引量:4 H指数:2 供职机构: 浙江大学 更多>> 发文基金: 国家自然科学基金 国家科技重大专项 更多>> 相关领域: 自动化与计算机技术 更多>>
基于倒排索引的时间序列相似性查询方法 本发明公开了一种基于倒排索引的时间序列相似性查询方法,包含索引构建和查询处理步骤,首先利用符号聚集近似表示将实值型的时间序列转化为离散的字符串,然后提取特征子序列,利用向量近似文件存储编码,将子序列分别转为两种粒度的词插... 孙建伶 陈岭 蔡青林 马骄阳文献传递 时间序列相似性查询研究 时间序列数据广泛存在于金融、工业、医疗、交通、气象等各个应用领域,为了实现针对该类数据的应用目标,学术界提出了许多时间序列数据分析和挖掘方法,如相似性查询、聚类、分类、预测、异常检测、关联规则挖掘等。其中,相似性查询是许... 蔡青林关键词:时间序列 相似性查询 数据挖掘 文献传递 基于分段正交多项式分解的时序数据最近邻分类方法 本发明公开了一种基于分段正交多项式分解的时序数据最近邻分类方法,首先,基于时间序列编码识别转折点,将时间序列切分为包含完整波动趋势的子序列;然后,利用第一类切比雪夫多项式分解子序列,提取切比雪夫系数作为子序列特征,构造子... 蔡青林 陈岭 孙建伶 陈蕾英文献传递 一种时间序列关联的信息检索方法 本发明公开了一种时间序列关联的信息检索方法,首先按照时间顺序统计文本数据库的词频分布,为各词汇构建词频时间序列;然后基于相似性度量方法,计算各词汇与时间序列的相关度。对于每个文本文件,基于各词汇相关度计算文本主题与查询时... 蔡青林 陈岭 孙建伶 陈蕾英文献传递 基于K线图表示的金融时间序列相似性查询方法 本发明公开了一种基于K线图表示的金融时间序列相似性查询方法,包括特征提取、索引构建和查询处理步骤。首先,基于K线表示对金融时间序列提取基本模式与典型模式特征,将其分别转化为基本字符串与典型字符串;然后,分别对两者构建倒排... 蔡青林 陈岭 孙建伶 陈蕾英文献传递 一种基于分段统计近似表示的时间序列相似性度量方法 本发明公开了一种基于分段统计近似表示的时间序列相似性度量方法,包括特征提取和动态模式匹配步骤。首先对时间序列切分子序列,依次提取每条子序列的多种统计特征,构造局部模式特征向量;然后利用加权欧氏距离计算局部模式特征向量之间... 蔡青林 陈岭 孙建伶 陈蕾英文献传递 基于新闻主题信息检索的金融时间序列预测方法 本发明公开了一种基于新闻主题信息检索的金融时间序列预测方法。首先对原始新闻数据提取词汇组合特征,并以新闻数据对金融时间序列的实时影响作为标记,训练支持向量机分类器作为预测模型;通过构建词频时间序列,有效度量词汇特征与时间... 蔡青林 陈岭 孙建伶 陈蕾英基于倒排索引的时间序列相似性查询方法 本发明公开了一种基于倒排索引的时间序列相似性查询方法,包含索引构建和查询处理步骤,首先利用符号聚集近似表示将实值型的时间序列转化为离散的字符串,然后提取特征子序列,利用向量近似文件存储编码,将子序列分别转为两种粒度的词插... 孙建伶 陈岭 蔡青林 马骄阳文献传递 一种基于动态时间弯曲的数据流子序列匹配系统 被引量:2 2015年 随着工业生产中数据源的不断增加,人们对数据流的处理需求日益增大.其中,一个基本需求是基于距离度量方法的子序列匹配.由于动态时间弯曲距离(dynamic time warping,DTW)具有较高的度量精度,将其应用于子序列匹配问题是非常有价值的.但是,DTW具有较高的计算复杂度,这极大地限制了它在数据流上的应用.针对该问题,设计了一种高效的基于DTW的数据流子序列匹配系统.首先对数据流进行高效的适应性分段,然后对每一子段进行切比雪夫因式分解.不同于在原始数据空间的DTW计算,系统将在低维的切比雪夫特征空间计算DTW距离,因此,系统具有较高的计算效率.另外,提出了一种高效的在线匹配算法,可实现DTW在数据流上的增量式计算,进一步提高了系统的执行效率. 梅寒蕾 蔡青林 陈岭 孙建伶关键词:数据流 子序列匹配 动态时间弯曲 基于自适应性分段统计近似的时间序列相似性度量方法 本发明公开了一种基于自适应性分段统计近似的时间序列相似性度量方法,首先基于时间序列编码识别转折点,将时间序列切分为包含完整波动趋势的子序列;然后依次提取每条子序列的多种统计特征,构造局部模式特征向量;最后利用规范化距离计... 蔡青林 陈岭 孙建伶 陈蕾英文献传递