搜索到122篇“ 中文网页自动分类“的相关文章
中文网自动分类构架设计被引量:1
2014年
本文主要分析了中文网自动分类所要用到的功能和技术,给出了一个可行的中文网自动分类系统的基本构架。
郑津景彦昊
关键词:网页自动分类分词技术特征抽取
中文网自动分类系统及关键技术研究与实现
随着互联的快速发展,数量也呈爆炸式的增长。有效组织并管理这些海量的方法之一就是利用自动分类技术对其进行分类。由于目前内容纷繁复杂,而且文本长度长短不一,将传统的基于机器学习的分类方法应该用到大规模...
周军
关键词:网络服务数据挖掘网页分类程序语言
基于CFS-GA特征选择算法的中文网自动分类被引量:2
2012年
为在中文网分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色体进行二进制编码;利用CFS启发值作为GA的适应度函数对个体进行评价;CFS值越大的个体遗传到下一代的概率越大.结合GA的全局搜索特性,该算法可保证所得特征子集是全局最优的.利用weka平台,对搜狗实验室提供的中文网数据集进行实验.结果表明,该算法能有效降低特征空间的维度、提高分类精度。
喻春萍黄晓霞
关键词:中文网页分类遗传算法
基于中文网自动分类技术的Web用户行为分析方法
本发明提供了一种基于中文网自动分类技术的web用户行为分析方法,采用朴素贝叶斯分类方法,使用类别概率和特征项的联合分布概率自动推理出web用户所浏览的的类别,在分类的基础上对web用户的上习惯进行分析,得出用...
孙建张梅琴张顺颐王攀
文献传递
基于模糊数据挖掘的中文网自动分类方法
本发明公布了一种基于模糊数据挖掘的中文网自动分类方法,该方法由分类词语描述库构建部分、新预处理部分、模糊分类匹配器部分以及分类结果模糊评判部分组成。通过应用模糊综合评判的方法,将构建分类词语描述库时所生产的训练集特...
孙雁飞姚蓓丽张顺颐王攀
文献传递
基于SVM的中文网自动分类技术研究
随着互联迅速普及和发展,络信息资源呈爆炸式增长,用户从中选择自己感兴趣的信息,给用户带来了方便,然而络给人们提供足够丰富信息的同时,也带来了新的问题。面对繁杂的内容,很难找到所需的信息,如何方便快捷地找到这些...
盛魁
关键词:中文网页分类SVM算法特征选取
文献传递
中文网自动分类综述被引量:2
2010年
该文介绍中文网自动分类的研究状况;分析常用的特征提取方法并比较其在中文网分类应用中的优劣,总结经典分类方法;简述分类评价指标;讨论目前分类系统。
盛魁赵鹏
关键词:网页分类特征提取评价指标
基于结构信息的中文网自动分类技术研究
互联技术的迅猛发展,推动了络信息的爆炸式增长。如何从这些异常丰富的络信息资源中发现有价值的信息,已经成为信息处理领域的一个亟待解决的问题。自动分类技术可以在较大程度上解决信息杂乱和“信息爆炸”的问题,在搜索引擎...
刘欣
关键词:网页自动分类朴素贝叶斯组合分类器
基于模糊数据挖掘的中文网自动分类方法
本发明公布了一种基于模糊数据挖掘的中文网自动分类方法,该方法由分类词语描述库构建部分、新预处理部分、模糊分类匹配器部分以及分类结果模糊评判部分组成。通过应用模糊综合评判的方法,将构建分类词语描述库时所生产的训练集特...
孙雁飞姚蓓丽张顺颐王攀
基于特征的中文网自动分类问题研究
随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对上海量的信息资源,人们很难迅速有效的找到真正所需的信息。因此,如何合理和有效地组织和管理上信息,已经成为Web智能领域里...
朱珠
关键词:数据挖掘网页分类超链接
文献传递

相关作者

冯是聪
作品数:9被引量:226H指数:5
供职机构:北京大学
研究主题:中文网页分类 WEB挖掘 特征选取 评测 搜索引擎
盛魁
作品数:46被引量:99H指数:5
供职机构:亳州职业技术学院信息工程系
研究主题:中药材 RBF神经网络 教学改革 高职院校 个性化推荐
胡燕
作品数:64被引量:205H指数:7
供职机构:武汉理工大学
研究主题:WEB 流媒体 特征提取 ASF文件 多媒体同步
梁久祯
作品数:213被引量:843H指数:14
供职机构:常州大学
研究主题:神经网络 学习算法 瑕疵检测 人脸识别 特征提取
王小冷
作品数:3被引量:3H指数:1
供职机构:中国科学院计算技术研究所
研究主题:KNN 计算机应用 中文信息处理 中文网页 GRAM