国家自然科学基金(70771007)
- 作品数:34 被引量:229H指数:9
- 相关作者:武森高学东谷淑娟刘燕驰陈敏更多>>
- 相关机构:北京科技大学中国地质大学(北京)中国国际工程咨询公司更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术经济管理理学自然科学总论更多>>
- 一种基于可辨识向量的规则提取方法
- 针对信息表中的规则提取问题,应用粗糙集理论对其中的属性约简、属性值问题进行了研究,提出了一种基于可辨识向量的规则提取方法。根据粗糙集中的不可分辨关系建立了可辨识向量,利用可辨识向量的加法法则运算只需要对信息表扫描一次,就...
- 鄂旭邵良杉杨芳翟宝峰乔柱赵肖冰
- 关键词:粗糙集属性约简属性值约简
- 文献传递
- 高技术产业化政策对我国企业竞争能力的影响分析——以某五年规划期间的高技术企业实证数据为例被引量:1
- 2012年
- 近年来,我国政府制定了大量高技术产业化政策,推动高技术产业发展,大大提高了企业研发水平和竞争能力。基于有序probit模型并结合某五年规划期间的实证数据,对我国高技术产业化政策下的企业竞争能力进行分析,结果发现:从技术角度来看,高技术产业化政策显著提高了企业技术水平,尤其是中型企业的提高非常明显。从产品角度来看,高技术产业化政策的实施难以有效提高企业产品质量水平和成本竞争力。为此建议:继续推动和完善高技术产业化政策,强化对高技术产业化专项的管理,把企业产品质量和管理水平作为重要的考核指标,加强监督,并对项目实施后的效果进行总结评价,最终提升高技术企业的综合竞争能力。
- 李华许有志佘元冠
- 关键词:有序PROBIT模型实证分析
- 分类属性高维数据基于集合差异度的聚类算法
- 2010年
- 提出基于集合差异度的聚类算法.算法通过定义的集合差异度和集合精简表示,直接进行一个集合内所有对象总体差异程度的计算,而不必计算两两对象间的距离,并且在不影响计算精确度的情况下对分类属性高维数据进行高度压缩,只需一次数据扫描即得到聚类结果.算法计算时间复杂度接近线性.实例表明该算法是有效的.
- 武森魏桂英白尘张桂琼
- 关键词:聚类高维空间差异度数据挖掘
- 基于不完备数据聚类的缺失数据填补方法被引量:63
- 2012年
- 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的.
- 武森冯小东单志广
- 关键词:不完备数据聚类
- 基于关联规则的SNS网站个性化推荐研究被引量:3
- 2011年
- 以关联规则为理论基础,针对社会性网络服务(Social Networking Services,SNS)网站的个性化推荐问题进行研究.在系统总结个性化推荐方法基础上,详细给出基于关联规则的个性化推荐过程,综合运用可信度和作用度两个指标更好地对生成的关联规则进行评价.并采用SNS网站实际运营数据有效实现个性化推荐,对个性化推荐技术在SNS网站的实际应用价值进行拓展分析.
- 武森徐丽李志才
- 关键词:社会性网络服务个性化推荐关联规则
- 基于RGB分量的车牌定位方法的研究
- 车牌定位是车牌识别的重要步骤,常用的车牌定位算法有很多。介绍了定位前的预处理方法,分析了常用算法的优缺点。根据彩色图像中车牌所具有的RGB分量特点,进行X和Y方向上车牌像素分布统计处理,找到车牌在图像中的位置,对处理结果...
- 翟宝峰鄂旭王全铁
- 关键词:车牌定位车牌识别
- 文献传递
- 基于密度的并行聚类算法被引量:9
- 2010年
- 为满足大规模空间数据库的聚类需求,面向计算机集群,提出一种基于密度的并行聚类算法。该算法根据数据库分布特征进行数据分区,在每一个节点上对数据块并行聚类,在主节点上合并聚类结果。实验结果表明,该算法的计算速度随着节点数的增多呈线性增加,具有较好的延展性。
- 陈敏高学东栾绍峻郗玉平
- 关键词:并行聚类计算机集群数据库延展性
- 不确定信息系统中基于粒细度的属性约简
- 2011年
- 针对不确定信息系统属性约简问题,提出一种基于颗粒细度的属性约简方法。给出一个以粒细度为属性重要性的概念,并用此重要性作为启发信息进行属性的约简。从原始的不确定信息系统出发,定义一个利用粗糙集中的等价关系构建相容的粒度空间,从而缩减原始系统所占用的空间,避免计算时对象的重复。实现计算量的降低。
- 赵肖冰鄂旭李克李艳红王全铁
- 关键词:粗糙集属性约简
- 数据挖掘中的聚类技术在学生成绩分析中的应用被引量:13
- 2009年
- 本文针对在大类招生背景下北京科技大学经济管理学院2005级学生的考试成绩,应用数据挖掘技术分析分专业前学生成绩与专业及分专业后课程学习之间可能存在的潜在的联系。首先进行数据预处理以保证数据挖掘结果的质量和提高数据挖掘的效率;然后根据分专业前的课程成绩对学生进行聚类,并分析各类的成绩特征;最后以信息管理与信息系统专业为例,分析各类学生在分专业后的优势课程和较弱课程。
- 武森俞晓莉倪宇王瑞峰
- 关键词:数据挖掘聚类学生成绩分析
- 一种能挖掘不完备日志的改进α算法被引量:2
- 2012年
- 对于不完备日志挖掘这一过程挖掘的难题,在传统α算法的基础上,提出了一种不完备日志的过程挖掘算法。该算法在α算法给出的并行关系定义的基础上,提出了一组隐含并行关系的推导规则,利用已知的任务关系推导出日志中缺失的隐含并行关系,在此基础上构造出过程的结构模型。实验结果证明,该算法对不完备日志的挖掘效果优于传统α系列算法。
- 瞿华
- 关键词:过程管理工作流网