许昕
- 作品数:3 被引量:8H指数:2
- 供职机构:北京工业大学计算机学院更多>>
- 发文基金:北京市自然科学基金国家自然科学基金北京市教育委员会科技发展计划面上项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于尾项加权的自适应文本分类方法研究
- 2011年
- 基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.
- 赖英旭许昕杨震
- 关键词:文本分类朴素贝叶斯分类器垃圾邮件过滤
- 基于用户隐式反馈的个性化资讯推荐系统研究与实现
- 互联网信息技术的快速发展为人们提供了大量的有用信息,但同时也使人们陷入“信息过载”困境。个性化推荐系统能够根据用户的兴趣模型向用户推荐符合其兴趣的网络资讯,帮助用户摆脱“信息过载”带来的困扰。本文设计和实现了一个基于用户...
- 许昕
- 关键词:个性化推荐朴素贝叶斯隐式反馈
- 文献传递
- 邮件网络协同过滤机制研究被引量:4
- 2012年
- 基于Enron邮件集合探索真实邮件网络,揭示出邮件网络的无标度特性和有限小世界特性.在此基础上,依据用户间交互强度设计出垃圾邮件协同过滤机制,通过调整参数λ,用户可以决定主要是依靠自己还是其他用户协同进行垃圾信息过滤.算法即使在没有对用户个人阅读习惯充分训练的情况下,也可以通过基于交互强度的网络协同方式实现良好过滤.同时为了解决Enron数据集缺乏标注的情况,基于训练样本集W和测试样本集T独立同分布的假设,利用改进的EM(Expectation maximization)算法最小化W∪T集合上风险函数,给出了未知样本的一个良好标注.真实数据上的实验表明,同单机过滤和集成过滤方法相比,协同过滤能够提高平均过滤精度且方法简单易行.
- 杨震赖英旭段立娟李玉鑑许昕
- 关键词:文本分类邮件过滤协同过滤