王占一
- 作品数:6 被引量:3H指数:1
- 供职机构:北京邮电大学更多>>
- 发文基金:国家自然科学基金高等学校学科创新引智计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Web文本挖掘中若干问题的研究
- 随着互联网和电信网的飞速发展,网络文本成为信息的重要载体及不可或缺的主要来源。Web文本挖掘采用数据挖掘、模式识别、信息检索、自然语言处理等学科的知识,解决如何从纷繁复杂的文本信息中获取可理解、易用的知识的问题。本文针对...
- 王占一
- 关键词:文本分类垃圾短信过滤文本检索复杂网络WEB文本挖掘
- 一种短信的识别方法和设备
- 本发明提供一种短信的识别方法和设备。其中方法包括:接收服务器发送的短信和所述短信的概率特征向量;利用所述概率特征向量分别计算正常短信模型下所述短信的第一生成概率和垃圾短信模型下所述短信的第二生成概率;由所述第一生成概率和...
- 徐蔚然王占一刘东鑫方琦
- 文献传递
- 一种基于两级分类器的垃圾短信过滤方法
- 垃圾短信过滤是一个文本分类问题。如何设计分类器,可以在训练样本较少的情况下达到可观的精度是一个重要的问题。本文对传统分类器的结构加以改进,设计了一种基于潜在中间层的两级分类器,每级用贝叶斯方法实现。进一步地,将朴素贝叶斯...
- 王占一徐蔚然刘东鑫郭军
- 关键词:垃圾短信过滤文本分类朴素贝叶斯组合分类器
- 文献传递
- 一种短信的识别方法和设备
- 本发明提供一种短信的识别方法和设备。其中方法包括:接收服务器发送的短信和所述短信的概率特征向量;利用所述概率特征向量分别计算正常短信模型下所述短信的第一生成概率和垃圾短信模型下所述短信的第二生成概率;由所述第一生成概率和...
- 徐蔚然王占一刘东鑫方琦
- 智能文本搜索新技术被引量:3
- 2012年
- 面对当今互联网上海量的信息,以及搜索信息准确、高效、个性化等需求,提出了一套包括信息检索、信息抽取和信息过滤在内的智能文本搜索新技术.首先举荐了与信息检索新技术相关的企业检索、实体检索、博客检索、相关反馈子任务.然后介绍了与信息抽取技术相关的实体关联和实体填充子任务,以及与信息过滤技术相关的垃圾邮件过滤子任务.这些关键技术融合在一起,在多个著名的国际评测中得到应用,如美国主办的文本检索会议评测和文本分析会议评测,并且在互联网舆情、短信舆情和校园网对象搜索引擎等实际系统中得到了检验.
- 王占一徐蔚然郭军
- 关键词:文本检索文本分析
- 一种基于两级分类器的垃圾短信过滤方法
- 垃圾短信过滤是一个文本分类问题。如何设计分类器,可以在训练样本较少的情况下达到可观的精度是一个重要的问题。本文对传统分类器的结构加以改进,设计了一种基于潜在中间层的两级分类器,每级用贝叶斯方法实现。进一步地,将朴素贝叶斯...
- 王占一徐蔚然刘东鑫郭军
- 关键词:垃圾短信过滤文本分类朴素贝叶斯组合分类器
- 文献传递