曹建军
- 作品数:66 被引量:299H指数:10
- 供职机构:总参第六十三研究所更多>>
- 发文基金:国家自然科学基金中国博士后科学基金江苏省博士后科研资助计划项目更多>>
- 相关领域:自动化与计算机技术机械工程兵器科学与技术电子电信更多>>
- 面向隐马尔可夫特征的数据质量控制模型
- 在进行数据质量控制时,考虑数据的具体特征以提高数据质量,分析了当前基于贝叶斯网络进行数据质量控制的模型、改进模型及其效果.针对字段之间存在"隐马尔可夫"关系的数据,提出了一种面向隐马尔可夫特征的数据质...
- 周金陵刁兴春周星曹建军
- 关键词:数据挖掘贝叶斯网络隐马尔可夫模型
- 基于重采样和集成选择的适用于实体识别的多分类器系统
- 实体识别常利用分类器以根据记录对的字段相似度向量将记录对分为匹配、不匹配和可能匹配,此时,分类器的准确性与实体识别的准确性直接相关。为提高分类的准确性,本文基于重采样和集成选择技术构建一个多分类器系统。充分利用实体识别的...
- 周星刁兴春曹建军李鑫王芳潇
- 数据清洗及其一般性系统框架被引量:31
- 2012年
- 数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故障诊断与维修。对数据清洗做了10点说明,进一步澄清了其基本内涵;将数据清洗与数据集成进行了比较分析,指出二者是同等的数据质量概念。提出了数据清洗的一般性系统框架,其由准备、检测、定位、修正、验证5部分组成,允许在多处停止以完成不同的数据清洗任务,是一个柔性的、可扩展的、交互性好的、松耦合的框架。
- 曹建军刁兴春陈爽邵衍振
- 关键词:数据质量数据清洗相似重复记录
- 一种基于Markov模型的实体基本信息自动生成系统及方法
- 一种基于Markov模型的实体基本信息自动生成系统及方法,适用于信息系统试验、试用场景的基本数据生成,该系统及方法所涉及的实体属性数据具有枚举型特征,所述方法包括定义属性优先级排序步骤、构建多值依赖统计决策树步骤、以及进...
- 曹建军刁兴春张慧邓波邹攀红谭明超
- 文献传递
- 基于简单规则的数据质量检查系统设计与应用被引量:5
- 2015年
- 为了更加全面地对数据存在的质量问题进行检查,并找出其中的问题数据,分析了数据质量评估的一般性指标,从规则约束的角度对关系型数据字段的格式、语法、长度、取值范围,以及字段与字段之间的逻辑关系、函数依赖关系等进行分类描述,设计相应的数据质量检查算法并进行编码实现,形成一套完整的数据质量检查工具。对某单位的设备人员信息数据从完整性、规范性、一致性、有效性等方面进行检查。实验结果表明,这些规则能够有效检出关系型数据中存在的问题。
- 高科刁兴春曹建军
- 关键词:数据质量关系型数据
- 基于进化强度的蚁群算法过程性能评价被引量:3
- 2013年
- 为了评价蚁群算法的过程性能,提出了一种基于进化强度的蚁群算法性能评价方法。以子集问题为例,引入谷元距离度量解的差异程度,并定义了迭代的相对进化幅度。将一次迭代的相对进化幅度与解的相对差异程度之比定义为进化强度,并据此将迭代区分为进化代与停滞代。通过多次运行算法并计算进化强度的平均值得到蚁群算法的进化强度趋势图,对比进化强度的趋势图进行蚁群算法过程性能评价。以4种求解子集的典型蚁群算法为例,通过标准测试实例验证了评价方法的有效性与合理性。
- 曹建军刁兴春李凯齐邵衍振
- 关键词:蚁群算法趋势图
- 大型移动多机电设备在线状态监控系统研究被引量:5
- 2007年
- 对大型移动多机电设备进行全面的实时在线状态监控,是目前国内外尚未完全解决的课题。依据设备端检测装置功能的不同,建立了一种大型移动多机电设备在线状态监控系统的分类标准,界定了检测装置的黑匣子功能模型和白匣子功能模型,提出了灰匣子功能模型,并对基于三种功能模型的状态监控系统结构进行了简要描述。对黑匣子系统的特性进行了深入分析,指出了其适用范围和局限性;指出了白匣子系统存在的技术瓶颈、局限性,及其该系统的理论意义;分别从硬件和软件角度说明了灰匣子系统的可实现性。通过算例分析,论证了灰匣子系统的优越性。为实际大型移动多机电设备在线状态监控系统的开发提供了理论依据,灰匣子系统还为未来大型移动智能设备的设计制造提供了有益参考。
- 曹建军张培林石志勇任国全傅建平
- 关键词:计算机应用无线通信信息融合故障诊断
- 基于蚁群优化的振动信号特征选择被引量:12
- 2008年
- 从所获取信号特征集合中选择出优化特征子集,是故障诊断问题中提高分类效率、减小运算规模的关键。提出了一种基于蚁群算法的特征选择算法,给出了特征选择蚁群算法有向图,将问题转化为有向图的路径搜索。给出了路径选择公式,将最坏Fisher标准判别率作为启发信息,提高搜索效率。将本次迭代最好解和与之等效的路径上信息素同步增强,增加对蚂蚁的有序指导。通过应用实例,验证了算法的有效性。
- 曹建军张培林任国全张英堂
- 关键词:蚁群优化振动信号特征提取故障诊断
- 一种基于本体的支持模糊匹配的事件发布订阅方法
- 本发明公开了一种基于本体的支持模糊匹配的事件发布订阅方法,基于领域本体允许发布者和订阅者通过浏览器来构建RDF事件和带关键词描述的SPARQL语句。其中,领域本体规定了某一领域中的概念以及概念之间的关系,采用OWL语言来...
- 刁兴春张慧严浩江春邓波曹建军袁震丁晨路黄宇王芳潇俞赟
- 文献传递
- 结合局部敏感哈希的k-近邻数据填补算法
- 数据缺失是常见的数据质量问题,典型的缺失数据处理方法一般分为忽略缺失值和填补缺失值.由于忽略缺失值会丢失很多数据的信息,所以对缺失值进行填补是更为合理的方式.k-近邻算法是一种常见的数据填补方法,但是由于其要计算待填补数...
- 郑奇斌刁兴春曹建军周星许永平