国家自然科学基金(61070083) 作品数:4 被引量:41 H指数:2 相关作者: 彭敏 何炎祥 刘楠 刘健博 刘纪平 更多>> 相关机构: 武汉大学 中国人民解放军军事经济学院 徐州工业职业技术学院 更多>> 发文基金: 国家自然科学基金 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于时间片的微博用户分类方法 被引量:2 2013年 针对微博用户分类问题提出时间片微元的概念,建立了时间片微元模型;对每个时间片内的微博所涉及到的用户进行研究得到时间片微元内部的用户兴趣度向量,最终整合所有时间片内的用户兴趣度向量,再对整个时间段内用户的兴趣度向量进行两次朴素贝叶斯分类,得到整个时间段内的用户分类.同时,对微博内容研究上规避了传统的单一的依靠系统标签形成用户网络的方式,结合了自然语言处理技术,提取用户兴趣方向,形成用户兴趣向量,然后对用户兴趣向量分析,采用改进的朴素贝叶斯分类算法进行用户分类.最后是对所提出的方法按详细步骤进行实验,研究结果表明,基于时间片的微博用户分类方法能有效对大规模的微博语料中所涉及到的用户进行较准确分类,为研究微博用户分类问题具有一定推动作用. 葛红美 何炎祥 陈强 徐超关键词:朴素贝叶斯分类 面向微博短文本的细粒度情感特征抽取方法 被引量:30 2014年 结合TF-IDF方法与方差统计方法,提出一种实现多分类特征抽取的计算方法。采用先极性判断,后细粒度情感判断的处理方法,构建细粒度情感分析与判断流程,并将其应用于微博短文本的细粒度情感判断。通过NLP&CC2013评测所提供的训练语料对该方法有效性进行验证,结果表明该方法具有较好的抽取效果。 贺飞艳 何炎祥 刘楠 刘健博 彭敏关键词:自然语言处理 文本情感分析 基于高质量信息提取的微博自动摘要 被引量:7 2015年 是获取微博平台关键信息的一种重要手段。现有面向微博的自动摘要方法较关注文本集合中句子或者关键词的提取,而在去除冗余信息、内容噪声方面缺乏有效手段,导致提取的微博内容质量不高。为解决该问题,以微博平台为研究对象,提出一种基于时频域转换的信息提取方法,获得与某话题相关度高、冗余度低且信息量大的高质量微博文本,将综合分值较高的微博作为生成摘要的样本集合,并对该样本集合中每条微博的句子进行权重打分,选取权值较高的句子组成微博摘要。实验结果表明,该方法能够有效过滤冗余信息和内容噪声,基于自动评测和人工评测的摘要结果均优于现有自动摘要方法。 彭敏 高斌龙 黄济民 刘纪平关键词:信息提取 自动评测 结合局部与非局部的图像复原方法 被引量:2 2015年 为了更好地复原图像的细节,提出了一种结合局部与非局部的图像复原方法。将图像中的细节准确地提取出来,对提取的细节进行非局部全变差约束,同时对剩下的图像成分进行局部全变差约束。提出的方法很好地结合了非局部全变差和局部全变差的优点,实现了图像细节更好的复原。实验结果表明,提出的方法与近几年的一些较好的图像复原方法相比,不仅主观的视觉效果得到了明显的改进,而且客观的峰值信噪比也增加了0.11~2.28 d B。 李俊英 肖升关键词:图像复原 图像细节