您的位置: 专家智库 > >

国家教育部博士点基金(20070358040)

作品数:6 被引量:35H指数:4
相关作者:俞能海陈超张迎峰康雨洁陆铭更多>>
相关机构:中国科学技术大学微软公司更多>>
发文基金:国家教育部博士点基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 2篇会议论文

领域

  • 8篇自动化与计算...

主题

  • 2篇用户
  • 2篇数据稀疏
  • 2篇最近邻
  • 2篇最近邻居
  • 2篇相似度
  • 2篇协同过滤
  • 2篇聚类
  • 1篇多特征融合
  • 1篇用户行为
  • 1篇余弦
  • 1篇余弦相似度
  • 1篇数据集
  • 1篇特征向量
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇文本分类
  • 1篇向量
  • 1篇协同过滤推荐
  • 1篇协同过滤推荐...
  • 1篇邻居

机构

  • 8篇中国科学技术...
  • 1篇微软公司

作者

  • 7篇俞能海
  • 4篇陈超
  • 2篇张迎峰
  • 1篇庄连生
  • 1篇陆铭
  • 1篇李扬
  • 1篇华先胜
  • 1篇周维
  • 1篇周津
  • 1篇麦林
  • 1篇康雨洁
  • 1篇张学胜
  • 1篇胡洋

传媒

  • 6篇小型微型计算...

年份

  • 3篇2012
  • 1篇2011
  • 3篇2010
  • 1篇2008
6 条 记 录,以下是 1-8
排序方式:
融合争议度特征的协同过滤推荐算法被引量:4
2012年
基于项目的协同过滤推荐算法在电子商务中有着广泛的引用,该算法的核心是计算项目之间的相似度.传统的计算项目相似度算法仅仅通过项目间共同用户评分值差异来计算,在数据稀疏情况下,项目间共同用户评分值很少,导致此类算法性能严重下降.针对此问题,从项目间的整体评分角度出发,提出争议相似度的概念,争议相似度从项目间评分方差差异的角度衡量项目间相似性.将争议度特征融合到基于项目之间共同用户评分的传统相似度算法中,进而提出了融合项目争议度特征的协同过滤推荐算法,最终缓解了传统算法在稀疏数据情况下相似度计算不准确的问题.实验结果表明该算法在数据稀疏环境下可以明显提升推荐质量.
张学胜陈超张迎峰俞能海
关键词:协同过滤最近邻居数据稀疏
采用对象特征向量表示法的标签聚类算法被引量:8
2012年
在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.
周津陈超俞能海
关键词:特征向量K-MEANS余弦相似度
简约语法规则和最大熵模型相结合的混合实体识别被引量:12
2012年
现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升.
陆铭康雨洁俞能海
关键词:命名实体识别最大熵模型
小规模和非平衡数据下的目标分类
针对小规模和非平衡的训练数据集下的目标分类问题,本文提出了一种新的目标分类学习算法 gentleBoost- BFKO(Balance Feature Knock ore)。该算法利用数据扩充算法 BFKO 在 gent...
周维庄连生俞能海
文献传递
一种基于成对约束的半监督最大间隔聚类算法被引量:1
2010年
最大间隔聚类是近来聚类分析的一个研究热点,为进一步提高其聚类准确性,提出一种基于成对约束的半监督最大间隔聚类算法.该算法在最大间隔聚类的目标函数中添加针对成对约束的损失项,从而对违反给定约束条件的分界面进行惩罚.对所得到的非凸优化问题,本文提出一种基于约束凹凸过程的迭代算法来进行高效求解.实验表明,本文提出的算法能极大地提高最大间隔聚类的准确性,其聚类性能也明显优于其他两种半监督聚类算法.
胡洋王井东俞能海华先胜
关键词:聚类
一种基于用户行为相似度的协同推荐算法
如何计算用户之间的相似度是协同推荐算法中最关键的技术,而现有算法在数据稀疏或小邻居集的环境下性能严重下降。本文提出了一种基于用户行为相似度的协同推荐算法(UBS),它充分考虑数据稀疏环境的特点,从评分矩阵中挖掘用户的网络...
李扬陈超祁麟俞能海
关键词:数据稀疏
文献传递
多特征融合的博客文章分类方法被引量:8
2010年
博客已经成为了互联网上最热门的应用之一.博客文章内容千差万别,对其进行分类具有重要意义.博客文章有别于新闻文章,普通文本分类方法直接应用于博客文章效果不理想.提出一种新的方法,充分利用了博客文章特有的Tag、用户自定义类别等多个特征,并对各项特征进行融合.另外,通过对自定义类别进行预处理,过滤与类别无关的噪声单词.实验结果表明多特征融合的方法能够有效提高博客文章分类的准确率.
麦林俞能海
关键词:文本分类多特征融合
基于最近邻用户动态重排序的协同过滤方法被引量:2
2011年
在传统协同推荐方法中,相似性的度量是整个方法的核心.在数据稀疏情况下,现有相似度计算方法仅使用历史评分数据,难以准确反映用户之间的相似程度;相关改进方法在考虑用户共同评分数量对相似度的影响时,引入的重叠度参数需要手动调整,限制了方法实用性.针对上述问题,本文提出一种基于最近邻用户重排序(DRNN)的相似度方法,充分利用项目类别信息,根据不同的目标项目动态调整邻居集内用户权重,能更准确地刻画用户之间的相似性;并提出修正的重叠度因子弥补现有方法中手动调整参数的不足,增强了方法实用性.实验结果表明,该方法可以明显提升预测结果的准确性.
张迎峰陈超俞能海
关键词:协同过滤
共1页<1>
聚类工具0