卫洁
- 作品数:4 被引量:15H指数:2
- 供职机构:山西财经大学信息管理学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Hadoop分布式集群容错验证被引量:1
- 2011年
- 云计算的诞生,使运行在大量廉价硬件设备集群上的Hadoop系统备受关注。本文在Linux系统上搭建了Hadoop的集群环境,通过实验利用分布式系统的冗余存储机制对其高容错性进行了验证,保证了数据的高可靠性。
- 李宗伟卫洁
- 关键词:HADOOPHDFS
- MapReduce框架下的贝叶斯文本分类学习研究
- 文本分类是信息检索与文本挖掘的重要基础。目前,虽然很多文本分类算法都成功地应用在各个领域,但单一文本分类算法容易导致构造的分类器分类性能差、泛化能力弱。集成学习算法利用多个单分类器之间的差异,有效地改善了分类器的性能和泛...
- 卫洁
- 关键词:文本分类MAPREDUCE朴素贝叶斯HADOOP
- 文献传递
- 基于Map Reduce的Bagging贝叶斯文本分类被引量:2
- 2012年
- 集中式系统框架难以进行海量文本数据分类。为此,提出一种基于Map Reduce的Bagging贝叶斯文本分类算法。介绍朴素贝叶斯文本分类算法,将其与Bagging算法结合,运用Map Reduce并行编程模型,在Hadoop平台上实现算法。实验结果表明,该算法分类准确率较高,运行时间较短,适用于大规模文本数据集的分类学习。
- 冀素琴石洪波卫洁
- 关键词:MAP文本分类朴素贝叶斯BAGGING算法
- 基于Hadoop的分布式朴素贝叶斯文本分类被引量:9
- 2012年
- 云计算的诞生,有效地解决了海量数据集的存储和分析处理。在云计算实现的开源Hadoop分布式系统集群上,使用MapReduce并行编程模型,设计并实现了一种对TFIDF改进的分布式朴素贝叶斯文本分类算法。实验结果表明,基于Hadoop框架的分布式朴素贝叶斯文本自动分类器不仅能处理节点失效,同时具有高效性和易扩展性的优势。
- 卫洁石洪波冀素琴
- 关键词:HADOOP朴素贝叶斯MAPREDUCE文本分类