陈家骏
- 作品数:202 被引量:773H指数:14
- 供职机构:南京大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字建筑科学更多>>
- 一种自动探索更多参考译文信息的机器翻译优化方法
- 本发明公开了一种自动探索更多参考译文信息的机器翻译优化方法,利用图扩展参考译文的信息,对机器翻译得到的译文进行更充分的评价,同时在利用译文信息扩展的评价方法参与训练过程时,帮助系统更好的进行参数学习。主要步骤如下:利用G...
- 黄书剑季红洁戴新宇陈家骏张建兵
- 日汉机器翻译系统中的词典讨论被引量:4
- 1998年
- 本文讨论了日汉机器翻译系统中有关词典的同音词、同型词、兼类词、挑选汉译词以及惯用型处理等几个问题,这些问题的解决将直接影响日汉机器翻译系统的译文质量。
- 雍殿书胡海文陈家骏王启祥
- 关键词:机器翻译词典同音词多义词
- 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
- 本发明公开了一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,包括:分别通过两个非线性多层感知器,将用户和论文以及论文和单词映射到相同维度的低维特征空间;通过最大化同一篇论文的两种低维表示向量之间的相似度,在两个非线性...
- 戴新宇戴瑾黄书剑张建兵尹存燕陈家骏
- 文献传递
- 利用基于词上下文的字嵌入与神经网络的中文分词方法
- 本发明提出了一种利用基于词上下文的字嵌入与神经网络的中文分词方法,在大规模的自动切分数据上学习字嵌入,将学习得到的字嵌入作为神经网络分词模型的输入,可以有效帮助模型学习。具体步骤如下:根据字上下文以及词位标记在大规模自动...
- 戴新宇郁振庭陈家骏黄书剑张建兵
- 文献传递
- 利用外部信息的神经机器翻译方法
- 本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻...
- 黄书剑郑在翔戴新宇张建兵尹存燕陈家骏
- 文献传递
- 一种基于层间自注意力的中文拼写纠错方法
- 本发明提出了一种基于层间自注意力的中文拼写纠错方法,其利用n元语法令牌作为查询,对BERT的不同层上的字符表示进行自注意力查询并加权融合,并利用字符的最终表示进行拼写纠错任务。通过引入BERT编码器中不同层次的抽象知识,...
- 戴新宇曹永昌何亮吴震张建兵黄书剑陈家骏
- 自然语言信息抽取中的机器学习方法研究被引量:21
- 2005年
- 信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的。近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注。本文深入探讨了当前自然语言信息抽取领域广泛采用的几种非常有效的统计学习方法,比较分析了各种方法的统计推断过程和学习算法及其优缺点,讨论了各种统计学习方法所面临的训练语料匮乏问题的主要解决方法,并指出了今后进一步研究的方向。
- 周俊生戴新宇尹存燕陈家骏
- 关键词:自然语言信息抽取机器学习方法统计学习
- 面向微博的中文反语识别研究被引量:3
- 2015年
- 反语识别已成为当前研究的热点,但当前对于中文反语识别研究报道较少。针对于此,主要研究面向社交网络的中文反语识别。在借鉴外文相关工作的基础上,结合中文语言和社交网络的特性,构建了六种特征,通过信息增益对比了各种特征有效性,并检测了不同分类器在该特征体系中的稳定性。实验结果表明,本文构建的特征在识别反语的任务中有显著的效果。
- 邓钊贾修一陈家骏
- 基于层叠条件随机场模型的中文机构名自动识别被引量:137
- 2006年
- 中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.
- 周俊生戴新宇尹存燕陈家骏
- 关键词:中文机构名识别条件随机场
- 英汉TBMT中模板抽取的改进算法及应用被引量:3
- 2002年
- 基于模板的机器翻译(简称TBMT)是为了提高当前机器翻译系统译文生成质量而采用的一种新的翻译方法,该技术的关键是模板的抽取。文章针对英汉机器翻译中的现存问题,在“动词+虚词”形式的模板抽取算法的基础上提出一种改进算法,应用该算法可较好地解决英汉机器翻译中的一些歧义问题。
- 杨思春程节华陈家骏王启祥
- 关键词:英汉机器翻译计算机