何天翔
- 作品数:4 被引量:19H指数:3
- 供职机构:西南科技大学计算机科学与技术学院更多>>
- 发文基金:博士科研启动基金四川省教育厅资助科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 元搜索引擎的结果去重及排序研究被引量:3
- 2012年
- 结果去重和排序是提高元搜索引擎结果质量的两个关键问题,文章分析余弦相似度、基于TF-IDF的文本相似度三种去重算法,利用URL、标题和计算摘要相似度三方面去重;研究了Board排序、星星排序、轮询法、位置排序和概念可行度对检索结果的影响,提出了一种综合排序算法。实验结果表明,综合排序算法在准确率、召回率等方面都优于其他算法。
- 杨春明何天翔
- 关键词:元搜索相似度去重排序
- 一种基于情感分析的网络舆情演化分析方法被引量:8
- 2015年
- 以微博作为研究对象,针对微博类短文本数据的特点,从情感的角度出发,提出基于情感分析的舆情演化分析。该方法以文本的情感值作为特征对微博数据进行时间分片,然后使用DTM模型对分片后的数据进行话题演化分析。实验表明,该方法能较好地划分微博数据,有效地找到舆情变化的时间点。
- 何天翔张晖李波杨春明赵旭剑
- 关键词:情感分析
- 结合情感词网的中文短文本情感分类被引量:5
- 2015年
- 针对短文本特征稀疏、信息量少等问题,提出了结合情感词网的中文短文本情感分类方法。该方法利用大规模语料库和同义词集合构建可以表示词—词、词—对象之间关系的情感词网,通过此情感词网在权重以及特征集合对短文本的特征进行了相应的扩展,并结合机器学习分类方法进行情感分类。实验表明,该方法具有较高的准确率和召回率,有效地解决了短文本情感分类中的特征稀疏、信息量不足的问题。
- 何天翔张晖李波杨春明赵旭剑
- 关键词:同义词情感分类
- 具有共现关系的中文褒贬词典构建被引量:3
- 2016年
- 针对情感词典构建中只反映了语言知识,缺乏语用知识的问题,提出了一种从真实语料中获取词语间的共现关系,并结合词语同义关系、语素特征进行中文褒贬词典半监督构建的方法。利用点互信息从语料中构建了情感词语和评价对象之间的相关性矩阵,采用非负矩阵分解的方法将其分解为情感词语之间的共现矩阵及新的情感词语-评价对象关系矩阵;将关系矩阵结合同义、语素特征,利用标签传播算法进行词语的褒贬分类。实验结果表明,在相同的数据集上该方法提高了只考虑语素和语义特征词典的准确率和召回率。
- 杨春明张晖何天翔李波赵旭剑
- 关键词:情感词典语用知识非负矩阵分解