搜索到235篇“ 中文网页分类“的相关文章
一种基于头脑风暴优化算法的中文网分类方法
本发明公开了一种基于头脑风暴优化算法的中文网分类方法。该方法包括:对中文文档进行分词,并根据词频建立中文文档的单词索引;根据中文文档的单词索引,建立中文文档分词向量;采用头脑风暴优化算法,对中文文档分类算法的性能和参数...
程适雷秀娟
基于多信息融合深度学习的多标签中文网分类模型研究
当今互联时代,海量信息包含于海量中,潜藏着巨大的商业价值,这使得分类日益成为一个受人关注的研究领域。随着互联在我国的普及和发展,中文网分类已成为一个重要的研究课题。多标签分类是指数据集的分类体系中有多个类别...
郑家伟
一种基于头脑风暴优化算法的中文网分类方法
本发明公开了一种基于头脑风暴优化算法的中文网分类方法。该方法包括:对中文文档进行分词,并根据词频建立中文文档的单词索引;根据中文文档的单词索引,建立中文文档分词向量;采用头脑风暴优化算法,对中文文档分类算法的性能和参数...
程适雷秀娟
文献传递
基于Weka平台的改进KNN中文网分类研究
是信息传递的最重要的媒介之一,而信息的主要呈现形式是文本信息,集社交、娱乐、新闻、知识等重要功能。目前,数量的增长正以超乎人们想象的速度在发展,传统的人工分类方法已不切实际,而且,由于数量的爆炸性增长,大...
黄超
关键词:中文网页文本分类WEKA平台KNN算法特征提取
文献传递
基于关键词自学习的中文网分类技术研究与实现
近几年来,为了满足人们对知识信息的需求,我国有超过450万家站为民提供涉及各个知识信息领域的。正是由于站数量繁多,内容和形式变得参差不齐。为了能够将大规模中文网高效的进行类别区分,盲目的将外文分类技术...
鞠亮
关键词:中文网页卷积神经网络支持向量机
中文网分类技术解析
2015年
本文从分类方面对万维上的数据处理技术进行了分析,对中文网/文本分类技术进行了介绍,阐述了基于支持向量机的自动分类算法。
郑津景彦昊
关键词:文本信息网页分类向量机
中文网分类算法研究
随着Internet及其相关技术的飞速发展,互联上出现了海量而庞杂的Web信息资源。如何从这些海量的非结构化数据中提取和产生知识,找到人们感兴趣的内容,已经成为当前迫切需要解决的重要问题。中文网分类技术作为解决这一问...
钱强
关键词:中文网页分类向量空间模型KNN
基于VSM的中文网分类特征选择技术研究与实现
随着信息技术的不断发展,自动分类技术成为了Web领域的一个研究热点,它在信息检索、信息过滤等多个领域得到了广泛地应用。特征选择是实现自动分类的重要环节,它从初始特征空间中选出类别区分能力强的特征项以降低文本向...
周帆
关键词:网页自动分类向量空间模型信息增益文档频率
基于关键词频度分析的中文网分类方法
一种基于关键词频度分析的中文网分类方法,是根据所分析出的中文网的关键词,依照中文分类主题词库进行中文网分类模糊匹配,通过首先获取到的HTML源码,对进行预处理。通过测试和分析,利用正则表达式过滤器对噪音信息...
掌明垄成龙卢艳宏冯源杨瑞王攀
文献传递
基于朴素贝叶斯的中文网分类技术研究与应用
中文网分类是一项极具实用价值的技术,它在用户行为分析、个性化推荐服务、精准化营销等领域都有着广泛的应用,但是当前分类的准确率和召回率不高,还有较大的提升空间,需对其中的关键流程进行改进,提高分类的性能。本文主要...
刘海春
关键词:朴素贝叶斯关联规则

相关作者

冯是聪
作品数:9被引量:226H指数:5
供职机构:北京大学
研究主题:中文网页分类 WEB挖掘 特征选取 评测 搜索引擎
李晓明
作品数:143被引量:2,091H指数:27
供职机构:北京大学计算机科学技术研究所
研究主题:搜索引擎 虚拟机 远程教育 INTERNET 确定性退火技术
吴扬扬
作品数:97被引量:320H指数:9
供职机构:华侨大学
研究主题:数据空间 XML 数据库 XML文档 关联规则
刘艳民
作品数:8被引量:3H指数:1
供职机构:青海大学计算机技术与应用系
研究主题:中文网页分类 中文网页 特征选取 网页分类 蚁群算法
段昕
作品数:5被引量:2H指数:1
供职机构:山东大学
研究主题:网页分类 中文网页分类 网页分割 重要度 支持向量机