杨尔弘
- 作品数:104 被引量:313H指数:11
- 供职机构:北京语言大学更多>>
- 发文基金:中央高校基本科研业务费专项资金山西省青年科技研究基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学理学更多>>
- 面向对外汉语报刊教学的文本难易度分类
- 本文介绍了利用文本中通用词的覆盖率和文本长度两个因素,通过计算文本难易度,对大规模文本进行自动初步难易分类.实验发现,综合考虑文本的通用词覆盖率和文本长度比仅根据其中一个因素对文本进行难易度分类效果更佳.针对本次实验所用...
- 邹红建杨尔弘
- 文献传递
- 一种根据关键词生成对应的目标生成句子的方法及装置
- 本发明涉及文本生成技术领域,特别是指一种根据关键词生成对应的目标生成句子的方法及装置。构建初始文本生成模型;获取训练样本,通过训练样本对初始文本生成模型进行训练,得到训练完毕的待评测文本生成模型;基于预设的基线模型,对待...
- 杨麟儿聂锦燃余婧思林浩泽孔存良朱君辉陈云杨尔弘
- 信息领域优秀青年科学基金项目申请受理与资助情况分析被引量:1
- 2012年
- 本文对2012年信息领域申请受理与获得资助的优秀青年科学基金项目从其一级申请代码领域分布、交叉研究领域分布以及申请人已经取得的研究成果等多个方面进行了调研分析,获得了该类项目申请受理与资助的总体情况,希望能为信息领域的科研人员、科研管理人员以及相关政策制定者提供参考。
- 徐琳杨尔弘张兆田秦玉文
- 基于上下文词语同现向量的词语相似度计算被引量:14
- 2005年
- 词语的语义相似度是词语间语义相似紧密的一种数量化表示。提出一种词语的语义相似度计算方法 ,利用上下文词语同现向量来描述词语的语义知识 ,在此基础上 ,使用 min/ max的方法计算词语之间的语义相似度。实验结果表明 ,该方法能够比较准确地反映词语之间的语义关系 ,为词语间的语义关系提供一种有效度量。
- 张涛杨尔弘
- 关键词:语义关系文词上下文语义相似度相似度计算
- 语言监测中词语构造能力的分析及其应用
- 2005-2009年的国家语言资源监测工作已经积累了—些成果,这些成果应该设法转化为语言研究、语言教学、语言信息处理的可用资源。本文将探讨语言监测中词语的内部组成及其关系,统计并分析其中高频词语的能产性,一方面可以为更好...
- 曾小兵邱丽娜张普张志平杨尔弘
- 关键词:语言资源词汇结构特征
- 突发事件信息提取研究
- 随着Internet的飞速发展,我们被包围在信息的汪洋大海之中。准确、有效地从信息海 洋中提取有用的信息,正是信息提取任务要解决的问题。信息提取(Information Extraction,简 ...
- 杨尔弘
- 关键词:突发事件信息提取文本信息处理
- 通过元学习实现语法改错少样本领域适应的方法及系统
- 本发明公开了一种通过元学习实现语法改错少样本领域适应的方法及系统,该方法包括:构建预训练数据集,其包括二语学习者所写的句子和母语修改者修改后的句子;构建源领域数据集,其包括多个领域的语法改错数据;构建目标领域数据集,其包...
- 杨麟儿张生盛黄雅平杨尔弘庞桂娜
- 文献传递
- 一种新的双语语块对应算法被引量:1
- 2004年
- 提出了一种新的语块对应算法 ,该算法是建立在实词对应基础上来划分语块的 ,这样可以保证语块正确对应的同时 ,有效地避免了双语语块边界划分不一致的情况。实验结果表明 。
- 刘冬明杨尔弘
- 关键词:粗糙集理论学习算法英语语法英语语块英语教学
- 一种基于增量式片段预测的端到端词汇受限文本生成方法
- 本发明公开了一种基于增量式片段预测的端到端词汇受限文本生成方法,所述方法包括:构建训练数据集,所述训练数据集中包含给定的单个或多个受限词汇和包含所述受限词汇的文本,所述受限词汇也称为关键词;构建词汇受限文本生成模型,用于...
- 杨麟儿聂锦燃刘鑫孔存良杨尔弘黄轩成刘洋
- 文献传递
- 基于预训练语言模型的上下文敏感的释义生成方法及系统
- 本发明公开了一种基于预训练语言模型的上下文敏感的释义生成方法及系统,该方法包括:获取训练数据集;其中,训练数据集中包括被释义词、被释义词所在的上下文,以及被释义词对应的释义;构建用于为被释义词生成释义的释义模型;其中,释...
- 杨麟儿范齐楠杨尔弘孔存良
- 文献传递