李峰 作品数:10 被引量:52 H指数:4 供职机构: 北京航空航天大学计算机学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 文化科学 更多>>
基于军事平行语料库的人机结合翻译策略 被引量:3 2016年 本文结合军事文本翻译的需求,提出了一种基于军事领域公开资源的平行语料库构建思路,进而提出了一种基于该平行语料库和Trados辅助翻译系统的人机结合的军事文本翻译策略,并通过对比实验分析验证了该方法的有效性.此外,为解决平行语料库的构建以及后期语料更新的问题,本文还提出了基于词汇释义句对齐的方法.通过对比分析可知,该方法能够有效处理军事文本句对齐问题. 黄金柱 樊信展 李峰 张克亮关键词:人机结合 面向俄文NLP的形态自动分析研究与实现 被引量:2 2011年 在俄文自然语言处理中形态分析往往是必不可少的模块,在国内虽有个别理论研究,却还没有可以应用于生产的案例。该文系统归纳了国内外俄文形态自动分析方法,深入剖析了俄罗斯以及欧美等其他国家具有代表意义的俄文形态分析器,并在此基础上提出了多策略融合的俄文形态自动分析方法,测试表明即使将该方法应用于专业领域,也能取得令人较为满意的效果。 李峰 易绵竹关键词:自然语言处理 俄文 VDEA词典的构建及其在情感倾向性分析中的应用 被引量:1 2016年 配价语法主要以谓词为中心研究句子的深层语义结构,重点描述动词和形容词与搭配成分间的依存关系,是解决语义分析处理这个颈瓶问题的利器。以英语形容词为主体,构建了包含相关配价信息的形容词配价词典,词典包含3170个英语形容词的配价关系、格关系、释义、褒贬义、语义分类、语义特征和相关例句等信息。此外,基于该词典设计了词汇情感倾向性分析模型,取得了很好的实验结果。 黄金柱 李峰 张克亮关键词:配价语法 形容词 知识库 基于大数据倒排索引技术的外语写作教学辅助系统研究与实现 被引量:2 2015年 大数据及其相关技术的发展给众多领域带来了诸多机遇与挑战,教育领域也不例外。本文首先介绍了大数据场景下常用的倒排索引技术,其次设计了面向外语写作教学的句子倒排索引算法,接着基于该算法设计并实现了一套外语写作教学辅助系统。应用分析与实验表明,大数据倒排索引技术能够较好地应用于辅助外语写作教学,同时较之于传统的方法也有着明显的优势。 李峰 卫乃兴关键词:大数据 外语写作教学 VDEA词典的构建与应用研究 2015年 配价语法通过谓词与其搭配成分间的依存关系来描述语义关系,是当前语义分析处理的重要语法理论之一,也是解决语义分析处理颈瓶问题的利器.本研究构建的英语形容词配价词典是一部基于配价语法,并面向自然语言处理的机器可读词典,词典包含3170个英语形容词的配价关系、格关系、释义、褒贬义、语义分类、语义特征和相关例句等信息.在此基础上,提出了基于VDEA词典的句子情感倾向性分析策略.实验证明,该配价词典在情感分析领域有一定的应用价值. 黄金柱 孙浩 张俊生 李峰关键词:配价语法 形容词 一种领域语料驱动的句子相关性计算方法研究 2016年 句子相关性计算在自然语言处理的多个实践应用中均具有十分重要的作用,如舆情监测、信息检索、统计机器翻译等。在明确相似性与相关性之间的关系之后,设计了一种基于领域语料驱动的句子相关性计算方法,该方法基于同一领域的语料构建一个"句-段-篇"3层的领域语义空间,通过度量词语在各个层级间的共现概率、共现平均距离和句长等因子来测量词间的主题相关性。与基于字面特征、HowNet和同义词词林的方法进行了实验对比,结果表明该方法具有较好的实践应用价值。 李峰 黄金柱 李舟军 杨伟铭关键词:主题相关性 基于HNC语境框架和情感词典的文本情感倾向分析 被引量:13 2016年 提出了一种基于情感词典和概念层次网络(hierarchical network concepts,HNC)语境框架的文本情感倾向性分析方法,将文本的情感倾向分析分为两个阶段:特征词、语句和句群判定阶段;基于HNC语境框架的句与句群情感分析阶段。首先以How Net情感词典和自建的形容词配价词典(valency dictionary of English adjective,VDEA)作为基础词典资源进行文本特征词匹配,在此基础上基于HNC语境框架进行文本的情感倾向性判定,融合情感词典资源与HNC语境框架的独特优势,从特征词语情感分析入手,以包含特征词的语句及句群为情感分析重点,进而确定文本的情感倾向性,体现了HNC"有所为有所不为"的思想。为验证方法的有效性,文本分别对政治、经济、体育与影视评论等领域文本进行测试,从实验结果可以看出商品评论以及影评类的文本情感识别率相对较高,而政治与体育类识别率低,但基本达到了预期实验效果,从而验证了本方法的可行性。 张克亮 黄金柱 曹蓉 李峰关键词:情感词典 HNC 融合词向量的多特征句子相似度计算方法研究 被引量:14 2017年 在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型测量了非重叠词间的相似性;在结构方面,考虑了句子中重叠词的语序和两个句子的长度一致性。实验部分设计实现了4种句子相似度计算方法,并开发了相应的实验系统。结果表明:提出的算法能够取得相对较好的实验结果,对句子中词的语义特征和句子结构特征进行组合处理和优化,能够提升句子相似度计算的准确性。 李峰 侯加英 曾荣仁 凌晨关键词:句子相似度 使用关键词扩展的新闻文本自动摘要方法 被引量:13 2016年 提出了使用关键词扩展的新闻文本自动摘要方法。该方法从大规模的语料中提取与输入文档相近主题的文本组成背景语料,并基于背景语料进行关键词的扩展,强化关键词对文摘句的指示作用,从而提高新闻文本摘要抽取质量。研究和实验表明,该方法在Rouge-1,Rouge-2评测中取得了优于基于关键词、基于TextRank和基于Manifold Ranking方法的结果。在研究中组织制定了100篇新闻文本的4份中文新闻文本标准评价集,研制了基于关键词扩展的中文新闻文本自动摘要系统,开发了面向中文的基于ROUGE原理的新闻文本摘要结果自动评测系统,初步实现了从理论到实践的转化。 李峰 黄金柱 李舟军 杨伟铭关键词:图算法 基于无干扰理论的信任链传递模型 被引量:4 2016年 针对现有的信任链传递模型可用性不强、缺乏将信任链扩展到网络环境的缺点,提出了一种新的基于无干扰理论的信任链传递模型。该模型将系统抽象为进程、动作和执行,从可信根出发,通过度量程序及其动态库完整性来保证进程静态可信;分析交互进程之间的关系,利用无干扰理论判定其合法性;通过对接入终端的可信度量,将信任链扩展到整个网络系统。最后给出了相应的形式化定义及安全性证明。 陈亮 曾荣仁 李峰 杨伟铭关键词:无干扰理论