您的位置: 专家智库 > >

孙松涛

作品数:10 被引量:171H指数:5
供职机构:武汉大学计算机学院更多>>
发文基金:国家自然科学基金武汉市科技攻关计划项目国家教育部博士点基金更多>>
相关领域:自动化与计算机技术自然科学总论一般工业技术更多>>

文献类型

  • 9篇期刊文章
  • 1篇学位论文

领域

  • 9篇自动化与计算...
  • 1篇一般工业技术
  • 1篇自然科学总论

主题

  • 4篇情感分类
  • 4篇情感分析
  • 4篇网络
  • 3篇神经网
  • 3篇神经网络
  • 3篇情感
  • 2篇社交
  • 2篇社交网
  • 2篇社交网络
  • 2篇卷积
  • 2篇卷积神经网络
  • 2篇标签
  • 2篇标签分类
  • 2篇抽取
  • 1篇对象抽取
  • 1篇信息检索
  • 1篇用户
  • 1篇用户兴趣
  • 1篇用户兴趣挖掘
  • 1篇舆情

机构

  • 10篇武汉大学

作者

  • 10篇孙松涛
  • 9篇何炎祥
  • 3篇李飞
  • 3篇陈强
  • 2篇刘健博
  • 2篇彭敏
  • 2篇牛菲菲
  • 1篇文卫东
  • 1篇蔡瑞
  • 1篇方文其
  • 1篇梁伟
  • 1篇杨铭

传媒

  • 2篇山东大学学报...
  • 1篇北京大学学报...
  • 1篇计算机学报
  • 1篇武汉大学学报...
  • 1篇计算机应用与...
  • 1篇华南理工大学...
  • 1篇小型微型计算...
  • 1篇四川大学学报...

年份

  • 3篇2017
  • 1篇2016
  • 2篇2015
  • 3篇2014
  • 1篇2012
10 条 记 录,以下是 1-10
排序方式:
基于深度学习的微博复杂情感分类研究
随着社会发展和技术进步,微博等社交媒体逐渐开始流行,人们也已经习惯了在日常生活中通过微博获取资讯、沟通感情和发表观点,使得其成为了一个兼具新闻娱乐、信息发布和社交互动等功能的综合性平台。微博的内容大多都是文本形式,通过对...
孙松涛
关键词:情感分类
文献传递
基于词性组合规则改进的中文句子极性判断方法被引量:2
2015年
介绍基于词性组合规则改进的中文句子极性判断方法,提出一种基于半监督学习的中文句子极性判断框架。在传统的完全基于情感词典方法的基础上,结合词性组合规则这一重要特征对中文句子进行极性判断。首先,分析中文句子中情感短语、情感词语的词性组合规则。然后,将情感短语、情感词语的词性组合规则用于中文句子极性判断。根据词性组合规则集抽取评测句子中的候选情感短语、情感词语;而后,计算句子的情感信息总量和句子的情感值,根据句子的情感信息总量将句子分为主观句、客观句,根据句子的情感值将主观句子分为积极情感句、消极情感句、中立情感句。实验结果证明,该方法在主客观分类上F值较高,可以达到77.4%;在主观句情感分类上,可达到的F值为62.5%。相比较于已有方法,基于词性组合规则改进的中文句子极性判断方法的F值有了明显的提高。
何炎祥牛菲菲方文其陈强孙松涛
基于CNN特征空间的微博多标签情感分类被引量:14
2017年
面对微博情感评测任务中的多标签分类问题时,基于向量空间模型的传统文本特征表示方法难以提供有效的语义特征。基于深度学习的词向量表示技术,能够很好地体现词语的语法和语义关系,且可以依据语义合成原理有效地构建句子的特征表示向量。作者提出一个针对微博句子的多标签情感分类系统,首先从1个大规模的无标注微博文本数据集中学习中文词语的词向量表示,然后采用卷积神经网络(convolution neural network,CNN)模型进行有监督的多情感分类学习,利用学习到的CNN模型将微博句子中的词向量合成为句子向量,最后将这些句子向量作为特征训练多标签分类器,完成微博的多标签情感分类。2013年NLPCC(Natural Language Processing and Chinese Computing)会议的微博情感评测公开数据集中,相比最优评测结果的宽松指标和严格指标,本系统的最佳分类性能分别提升了19.16%和17.75%;采用Recursive Neural Tensor Network模型合成句子向量的方法,取得目前已知文献中的最佳分类性能,系统将2个指标分别提升了3.66%和2.89%。采用多种多标签分类器来对比不同的特征表示方法,发现基于CNN特征空间的句子向量具有最好的情感语义区分度;通过对CNN迭代训练过程的分析,体现了语义合成过程中的模式识别规律。进一步的工作包括引入更多合适的深度学习模型,并深入探索基于词向量的语义合成现象。
孙松涛何炎祥
关键词:情感分类卷积神经网络
基于句法分析的跨语言情感分析被引量:7
2014年
利用句法分析模型,将语句分成若干组合词,根据组合词的主谓成分中情感词对于句子情感贡献的不同,分别赋予不同的权重。统计分析该语句的情感分布特征,利用得到的特征参数训练分类器,再将训练好的分类器用于测试语料的情感分类。实验结果表明,与已有的判别方法相比,该方法的情感分类判别准确率较理想。此方法也可用于语句的比较级判别和否定句的极性判断等。
陈强何炎祥刘续乐孙松涛彭敏李飞
关键词:跨语言情感分类句法分析贝叶斯分类
面向微博情感评测任务的多方法对比研究
2014年
主要对COAE 2014评测中采用的算法进行描述,并结合评测结果进行分析比较。本次评测共有5个任务,本文重点描述与微博相关的3个任务。在微博情感新词发现和判断的任务中,方法核心是利用谷歌翻译算法的对齐操作来获得候选新词,之后使用平均点互信息筛选高频词语。在微博倾向性分析任务中采用两种方法,一种是传统的基于情感词典的极性判断方法,另一种是结合情感词标注的基于条件随机场CRFs的极性判断方法。在微博观点句要素抽取任务中,首先利用名词在复杂网络中的中介性和趋近性提取候选产品名和属性名,然后分别采用3种方法完成对产品属性名的抽取,其中,第一种方法是基于简单规则的滑动窗口抽取策略,后面两种方法都是基于CRFs的有监督抽取策略。
孙松涛何炎祥蔡瑞李飞贺飞艳
关键词:情感分析评价对象抽取复杂网络
基于神经网络的微博舆情预测方法被引量:7
2016年
根据微博社交平台特征,提出了一种基于神经网络的微博舆情预测方法.该方法使用单位时间内的微博发帖量作为事件趋势的量化指标,考虑影响事件发展的因素,根据样本内的数据趋势建模,使用神经网络来预测范围外的事件的未来趋势.仿真实验结果表明,该方法可以快速地对事件发展的趋势进行量化分析和建模,能够准确地预测事件的爆发点和发帖量.
何炎祥刘健博孙松涛
关键词:社会计算神经网络大数据
基于层叠条件随机场的微博商品评论情感分类被引量:2
2015年
商品评论是消费者针对某一个商品的主观议论。针对微博中商品的评论文本短小、结构多样等特征,在仅使用现有的微博级情感标注的条件下,提出了一种基于层叠条件随机场模型。以中文小句中枢说为理论基础,将商品评论的句子划分为若干小句,使用微博内小句序列的各种特征训练粗粒度的随机条件场情感分类模型,同时使用小句内汉字序列的各种特征来训练细粒度的随机条件场情感分类模型。实验结果表明,本文提出的方法优于传统的情感分类方法。
何炎祥刘健博孙松涛文卫东
关键词:情感分析小句中枢说条件随机场
用于微博情感分析的一种情感语义增强的深度学习模型被引量:129
2017年
基于神经语言模型的词向量表示技术能够从大规模的未标注文本数据集中自动学习词语的有效特征表示,已经在许多自然语言处理任务及研究中取得重要进展.微博中的表情符号是微博情感分析最重要的特征之一,已有大量的研究工作在探索有效地利用表情符号来提升微博情感分类效果.借助词向量表示技术,为常用表情符号构建情感空间的特征表示矩阵R^E;基于向量的语义合成计算原理,通过矩阵R^E与词向量的乘积运算完成词义到情感空间的映射;接着输入到一个MCNN(Multi-channel Convolution Neural Network)模型,学习一个微博的情感分类器.整个模型称为EMCNN(Emotion-semantics enhanced MCNN),将基于表情符号的情感空间映射与深度学习模型MCNN结合,有效增强了MCNN捕捉情感语义的能力.EMCNN模型在NLPCC微博情感评测数据集上的多个情感分类实验中取得最佳分类性能,并在所有性能指标上超过目前已知文献中的最好分类效果.在取得以上分类性能提升的同时,EMCNN相对MCNN的训练耗时在主客观分类时减少了36.15%,在情感7分类时减少了33.82%.
何炎祥孙松涛牛菲菲李飞
关键词:情感分析卷积神经网络自然语言处理社交网络
基于语句查询扩展和高性能计算平台的分布式信息检索系统DQSSQE
2012年
提出了一种基于语句的查询扩展方法以及语句向量的融合策略,使得扩展后的查询语句的查询性能优于原始查询语句;基于微软高性能计算平台HPC Server和查询扩展策略,设计实现了一个分布式文本检索系统DQSSQE.实验结果表明,在检索性能方面,所提出的查询扩展策略能够有效的提高查准率,召回率上也有一定的提高;在分布式检索计算性能方面,DQSSQE系统具有较好的计算加速比,随着文本集规模的增加,其计算性能的优越性体现明显.
彭敏杨铭孙松涛何炎祥
关键词:信息检索查询扩展分布式
社交网络用户兴趣挖掘研究被引量:10
2014年
面向消费者的公司或者企业都希望了解他们用户的需求,而大量的用户产生的数据在很大程度上就体现了用户的兴趣和需求.提出一种用于社交网站上,针对用户生成内容(User Generate Content UGC)和用户关注信息的用户兴趣发掘方法.首先通过启发式初始化的PLSA模型训练得到贴近兴趣类别的话题模型,然后从训练结果中抽取可靠的话题并以此构建分类器,对用户的分享数据进行分类,最后根据用户的分享数据分类结果来识别用户的兴趣类别.在初始化PLSA模型时,用关键词抽取算法抽取每个分类的关键词,并给这些关键词赋予较高的PLSA初始权重,以此来引导PLSA模型的训练.实验的结果表明:本文方法可以有效的构建用户兴趣类别,并对用户兴趣的挖掘比较理想.
何炎祥刘续乐陈强梁伟孙松涛
关键词:用户兴趣挖掘社交网络关键词抽取概率潜在语义分析
共1页<1>
聚类工具0