余刚
- 作品数:4 被引量:51H指数:3
- 供职机构:重庆大学计算机学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词同现频率的文本特征描述被引量:12
- 2005年
- 文本的特征描述是文本自动处理的基础工作之一,目前的文本特征描述一般采用加权VSM模型,该模型大都使用统计的和经验的加权算法,该算法方便了计算机对中文文本的相似度计算,但不能很好地揭示文本中词与词的关系。针对此缺点,提出了一种基于词同现频率的加权算法,使得文本的特征向量蕴涵了词与词的相关信息,最后用实验对该算法的效果进行了证明。
- 余刚陈华月朱征宇高原
- 关键词:向量空间模型文本挖掘
- 基于加权关联规则的用户关注项目推荐算法被引量:7
- 2006年
- 根据每个项受关注的程度对其赋予权值,体现每个项在项集中的重要性,引入选择关注度,体现用户选择项时的倾向,推荐时将其与关联规则的置信度相结合,从而为用户更准确的提供关注项目推荐。在实验中比较了文中的算法和一种基于最近邻用户协作过滤算法,实验验证了文中的算法在为用户进行推荐项目时用户的点击率和算法的性能都有所提高。
- 陈华月余刚朱征宇
- 关键词:加权关联规则
- 基于语义概念的文本特征描述
- 文本的特征描述是自然语言处理、文本分类、聚类、中文信息检索、个性化服务等研究中的一项基础性工作,它研究的是用什么样的方法和模型来表示文章的主题思想。这个描述一方面要能很好的概括文章的主要内容,另一方面要方便计算机进行计算...
- 余刚
- 关键词:特征抽取文本特征自然语言处理
- 文献传递
- 基于词汇语义计算的文本相似度研究被引量:32
- 2006年
- 基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。
- 余刚裴仰军朱征宇陈华月
- 关键词:《知网》相似度计算向量空间模型