国家自然科学基金(60773167) 作品数:7 被引量:99 H指数:5 相关作者: 何婷婷 闻彬 王倩 宋乐 罗乐 更多>> 相关机构: 华中师范大学 咸宁学院 福建师范大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 一般工业技术 更多>>
基于PMI-IR算法的Blog情感分类研究 Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了一种基于PMI-IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本中的情感要索和背景情... 段秀婷 何婷婷 宋乐关键词:中文信息处理 情感分类 互信息 文献传递 以关键词抽取为核心的文摘句选择策略 被引量:10 2008年 针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。 马亮 何婷婷 李芳 陈劲光 邵伟关键词:计算机应用 中文信息处理 多文档文摘 关键词抽取 网络热点事件发现系统的设计 被引量:35 2008年 该文设计了一个热点事件发现系统。该系统面向互联网新闻报道流,能自动发现任意一段时间内网络上的热点事件,并给出描述事件发展过程的曲线图。针对网络新闻语料具有数据规模大和时间特征明显两个特性,系统将语料按时间(天)分组,对每天的语料采用凝聚聚类得到微类,选取某段时间内的所有微类,再做Single-pass聚类得到事件列表,利用事件热度计算公式,把候选事件按热度进行排序。采用该系统对2007年新闻语料进行实验,结果表明该系统能取得较好的效果。 刘星星 何婷婷 龚海军 陈龙关键词:计算机应用 中文信息处理 凝聚聚类 篇章连贯语义关系的自动标注方法 被引量:5 2012年 为实现篇章连贯语义关系的判定与自动标注,提出一种综合运用关联词多种语法信息的自动标注方法。该方法利用关联词的词性分布规则排除非关联词,标注出潜在关联词,对比关联词库中的模式表,并综合利用搭配距离、搭配强度和句法位置获取合法的篇章连贯模式,在此基础上标注出其语义关系。通过实验验证了该方法的有效性。 姚双云 胡金柱 舒江波 沈威关键词:篇章连贯 语义关系 句法规则 一种面向查询的多文档自动文摘系统实现方法 针对面向查询的多文档自动文摘,本文提出了一种系统实现方法。首先通过对句子结构的分析发现,句子中某些成分并不能反映该句子的重要信息,提出在一定句子的修剪基础上,基于倒几率比的词权计算方法与改进的HAL语言模型方法,并应用于... 桂卓民 何婷婷 陈劲光 李芳关键词:自动文摘 面向查询 文献传递 基于网络百科全书的中文关联语义知识获取 本文提出了一种用语义标签、语义指纹来表示关联语义知识的形式化方法,其中语义标签指代语义中的一个知识单元(也即概念),语义指纹是对语义标签所指代概念的描述,由语义标签的相关词语及其关联度共同组成。本文提出了一种从网络百科全... 杨柳 何婷婷 涂新辉关键词:百科全书 语义知识 文献传递 一种利用关键词提取的面向查询多文档文摘技术 针对面向查询的多文档自动文摘,本文提出了一种利用关键词提取技术的文摘句选择策略。通过计算多文档集中词语的查询相关性特征和语料相关性特征,并将词语的两个特征值进行特征融合得到每个词语的重要度,随后通过词语的重要度来给候选句... 马亮 何婷婷 陈劲光 李芳 邵伟关键词:多文档文摘 关键词提取 文献传递 A New Method for Mining Biomedical Knowledge Using Biomedical Ontology 2009年 In order to solve the problem of mining biomedical knowledge, a biomedical semantic-based knowledge discovery method (Bio-SKDM) is proposed. Using the semantic types and semantic relations of the biomedical concepts, Bio-SKDM can identify the relevant concepts collected from Medline and generate the novel hypothesis between these concepts. The experiment result shows that compared with ARROWSMITH and LITLINKER, Bio-SKDM generates less but more relevant novel hypotheses and requires less human intervention in the discovery procedure. LI Guangrong HUANG Chuanhe ZHANG Xiaodan XU Xuheng HU Xiaohua关键词:ONTOLOGY CONNECTION HYPOTHESIS 极性相似度计算在词汇倾向性识别中的应用 被引量:5 2010年 该文提出了一种新的基于HowNet相似度计算的词汇倾向性识别方法。该方法首先利用HowNet中的"良"、"莠"极性义原进行一种新的相似度——极性相似度的计算,再计算出词汇的极性值,进而识别出词汇的极性倾向。大量实验证明了该方法能够有效地区分词汇的极性,并且在第一届中文倾向性分析评测(COAE2008)比赛中取得了很好的效果。 宋乐 何婷婷 王倩 闻彬关键词:计算机应用 中文信息处理 面向查询的多模式自动摘要研究 为了满足用户的个性化需求,提供尽可能丰富、实用、方便的文摘结果,本文设计了面向查询的多文档自动文摘的多种摘要模式。在将查询返回的文档集合表示为以文本、段落为节点的双层复杂网络结构以发现子主题的基础上,除传统的摘要模式外,... 李芳 何婷婷文献传递