中央高校基本科研业务费专项资金(2012RC0205)
- 作品数:4 被引量:28H指数:3
- 相关作者:韩晶鄂海红宋俊德宋美娜杨俊更多>>
- 相关机构:北京邮电大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于主体行为的非结构化数据模型被引量:12
- 2013年
- 为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型。基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集。在此基础上,使用一个数据对象和基本类、内容类、特征类、行为类、环境类等5个属性类表示一个非结构化数据,构建非结构化数据模型。对模型进行了仿真分析,分析结果表明了模型有效且可行,具有轻量级、支持复杂检索、检索结果准确度高等优势,为大数据管理提供支撑。
- 韩晶鄂海红宋美娜宋俊德
- 关键词:非结构化数据数据管理用户行为数据模型
- HotRank:热度敏感的非结构化数据检索排名算法被引量:4
- 2013年
- 为满足用户对非结构化数据检索的需求,分析用户对数据的操作行为,提出一种新型的数据热度敏感的非结构化数据检索排名算法HotRank。通过对数据操作情况(任务、访问次数、编辑时长等)进行日志记录,形成非结构化数据检索数据集。在此基础上,定义数据的任务相似度和数据热度计算方法实现该算法。结合实例仿真,对算法进行评估,并将仿真结果与其他算法进行比较,证明了该排名算法的准确率优于其他算法。
- 韩晶宋美娜鄂海红宋俊德
- 关键词:非结构化数据排名热度
- 基于事务ID集合的带约束的关联规则挖掘算法被引量:9
- 2013年
- 为解决在挖掘关联规则时存在大量冗余规则以及效率不高的问题,提出了一种基于事务ID集合的带约束的关联规则挖掘算法ACARMT。该算法结合了Separate算法以及基于数据垂直分布算法的优势,先根据约束条件产生基础频繁项目集,再利用事务ID集合存储项目集信息,从而避免重复扫描数据库,提高了挖掘效率。应用该算法挖掘实际的生殖健康数据的实验表明,在数据量大到超出基于数据垂直分布算法的使用范围时,该算法仍然有效,并且其效率优于Sepa-rate算法。
- 赵佳璐杨俊韩晶鄂海红
- 关键词:关联规则频繁项目集
- 基于信息冗余检验的支持向量机时间序列预测自由参数选取方法被引量:3
- 2012年
- 支持向量机建模中的一个关键和难点问题是自由参数的设置.不同于以往应用残差的简单统计量选取最佳模型的方法,本文提出通过检验模型在训练集上的拟合残差是否不含冗余信息作为选择自由参数的依据.进一步提出应用全向相关函数(omni-directional correlaton function,ODCF)检验残差信息冗余并给出应用方法,并从理论分析和数值仿真两方面给出该方法正确性的证明.在两个典型的非线性时间序列(年均太阳黑子数和Mackey-Glass数据)上进行了实验,实验结果优于相关文献记载及基于校验集方法的预测性能.
- 于艳华宋俊德
- 关键词:支持向量机残差