周雅倩
- 作品数:36 被引量:584H指数:7
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金上海市科委科技攻关项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 自底向上和自顶向下结合的句法分析
- 把自底向上、自顶向下和双向分析结合起来,文献[1]提出了双向策略标记上下文无关文法(BSCFG),并指出了它的不完备性,即基于BSCFG的分析器无法分析所有合法的句子.本文提出了一种使不完备的BSCFG完备的规范化算法,...
- 周雅倩黄萱菁吴立德
- 关键词:上下文无关文法
- 文献传递
- 利用未标注语料改进实体名识别性能
- 本文主要介绍了一个利用最大熵进行实体名识别的系统以及所采用的模型和选取的特征。利用这些在任何语言的文本上都极易获得的特征,我们构建了一个基准系统。在此基础上,我们在未标注语料上抽取出现的实体名作为辅助的训练语料,再将这些...
- 陈宁昱周雅倩黄萱菁吴立德
- 关键词:实体名识别最大熵
- 文献传递
- 一种基于谱聚类的共指消解方法被引量:6
- 2009年
- 该文针对中文共指消解的具体任务,提出采用谱聚类的方法进行共指消解。首先,在待消解项对上抽取特征,使用最大熵模型判断两个待消解项存在共指关系的概率;然后,以此概率值作为相似度进行谱聚类;最后,得到若干实体,实现共指消解。该方法能从全局的角度进行实体划分,有效地提高准确率。在ACE 2007标准数据集上的Diagnostic实验结果表明该方法的ACE Value比baseline方法有了2.5%的提高,Unweighted Precision值有5.4%的提高。
- 谢永康周雅倩黄萱菁
- 关键词:计算机应用中文信息处理共指消解谱聚类最大熵模型
- 基于HowNet的词汇语义倾向计算被引量:375
- 2006年
- 在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、自动文摘、文本过滤等自然语言处理的研究提供了新的思路和手段。篇章语义倾向研究的基础工作是对词汇的褒贬倾向判别。本文基于HowNet,提出了两种词汇语义倾向性计算的方法:基于语义相似度的方法和基于语义相关场的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别准确率可达80%以上,具有一定的实用价值。
- 朱嫣岚闵锦周雅倩黄萱菁吴立德
- 关键词:计算机应用中文信息处理语义倾向知网
- 基于最大熵模型的QA系统置信度评分算法
- 置信度指的是一个问题回答系统(QA系统)对其所作回答的自信程度。本文描述了一种基于最大熵模型的算法。首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度。在2002年度的文本检索会议(...
- 游斓周雅倩黄萱菁吴立德
- 关键词:最大熵模型信息检索
- 文献传递
- 一种多模态的学生课堂行为分析系统和方法
- 本发明属于计算机技术领域,具体为一种多模态的学生课堂行为分析系统和方法。本发明系统包括学生注意力检测模块、教师授课内容检测模块、教师授课风格检测模块和相关性分析模块;学生注意力检测模块检测学生的专注率,教师授课内容检测模...
- 姚泽平路红周雅倩李超鹏
- 文献传递
- Internet网上文本信息的分类、检索和摘要系统
- 吴立德黄萱菁郭以昆刘秉伟韦雄观叶丹瑾王文欣季祥周雅倩罗翀牛军钰张玥杰陈凯江
- 本项成果在大规模语料库统计分析的集础上,解决了大规模文本处理的许多技术难点,实现了网络中文信息的分类、检索、文本摘要和信息提取系统的原型。所达到的技术指标和国际上著名的权威评测会议(如文本检索会议、消息理解会议和文本摘要...
- 关键词:
- 关键词:INTERNET
- 基于最大熵模型的英文名词短语指代消解被引量:28
- 2003年
- 提出了一种新颖的基于语料库的英文名词短语指代消解算法 该算法不仅能解决传统的代词和名词 /名词短语间的指代问题 ,还能解决名词短语间的指代问题 同时 ,利用最大熵模型 ,可以有效地综合各种互不相关的特征 算法在MUC 7公开测试语料上F值达到了 6 0 2 % ,极为接近文献记载的该语料库上F值的最优结果 6 1 8%
- 钱伟郭以昆周雅倩吴立德
- 关键词:最大熵自然语言处理
- 基于同义实体扩展的冗余信息去重被引量:3
- 2012年
- 冗余信息去重是信息抽取中的重要任务,对于多元素表示的信息,该文针对以往对各个元素统一处理所存在的问题,将信息元素进行分类,由各类元素的冗余判断难易出发,归纳相似度计算方法,并将各相似度作为特征,通过分类器判断信息间的冗余性。同时对最难判断的命名实体信息元素,该文从其他易判断相似性的信息元素出发,通过同义命名实体的自动扩展,提高信息去重的效果。
- 姜孟晋周雅倩黄萱菁
- 关键词:信息抽取
- 依赖关系三元组匹配在问题回答中的应用(英文)
- 本文描述了一种问题回答任务中答案排序的新方法。该方法引入了问题/答案句依赖关系三元组匹配这一新特征,来对候选答案进行排序。该特征考虑了问题中的疑问性和非疑问性部分的信息。同时,该方法还采用了启发式规则来扩展问题的依赖关系...
- 林锋周雅倩黄萱菁吴立德
- 关键词:自然语言处理
- 文献传递