王琰
- 作品数:4 被引量:28H指数:2
- 供职机构:安徽大学更多>>
- 发文基金:安徽省教育科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- K-Means算法的研究与改进被引量:20
- 2012年
- K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。文中首先应用统计学中的标准分数对样本进行孤立点分析,然后提出一种新的初始聚类中心确定策略。对改进的算法和原算法分别做实验进行比较,实验结果表明,改进的算法在准确率、收敛速度和稳定性方面都有很大的提高。
- 周爱武陈宝楼王琰
- 关键词:孤立点初始聚类中心
- 关联规则增量挖掘算法研究及应用
- 如何从大量数据中获取不同的个性化信息是信息检索领域的研究热点。此方面的研究主要包括元搜索引擎和查询扩展。综合多个搜索引擎返回结果的元搜索引擎其关注点在于为用户提供更多查询结果,查询扩展则通过将用户提交短查询扩展为更多词组...
- 王琰
- 关键词:元搜索引擎查询扩展
- 安徽省精准扶贫档案工作研究
- 改革开放以来,我国一直在脱贫路上积极探索,扶贫思路和扶贫方式不断推·陈出新。党的十八大以后,全国开启脱贫攻坚新局面,精准扶贫战略思想给我国的扶贫道路指明了方向。过去五年,在精准扶贫战略思想的科学引领下,我国脱贫攻坚战取得...
- 王琰
- 关键词:档案工作
- 文献传递
- 一种基于FUP的TD-FP-Tree并行快速更新算法被引量:2
- 2013年
- TD-FP-Growth是对经典关联规则挖掘算法FP-Growth算法的改进,它采用新的数据结构TD-FP-Tree。人们已经基于Apriori和FP-Growth算法提出了多种关联规则增量挖掘算法。文中讨论了在基于TD-FP-Tree的结构上如何进行增量挖掘,对批量挖掘算法的瓶颈进行分析,指出加快更新速度的策略。文中基于FUP思想提出了TD-FP-Tree的快速更新算法,重点研究了当有单个项在新增事务加入后由非频繁变为频繁时TD-FP-Tree的处理情况。通过将项分类处理降低更新时间,并部分采用并行处理进一步提高效率。实验表明,文中提出的算法不仅可以快速更新TD-FP-Tree,而且在同基于FP-Tree结构的增量挖掘对比中也有更好的表现。
- 周爱武王琰陈宝楼
- 关键词:关联规则