唐旭日
- 作品数:14 被引量:73H指数:3
- 供职机构:南京师范大学文学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:语言文字自动化与计算机技术文化科学天文地球更多>>
- 自动词形分析中的经验主义
- 2007年
- 本文简要评述了自动词形分析中的经验主义研究方法。经验主义认为词形构成本身是概率性的,使用各种统计模型和机器学习来获得词形分析规则和进行歧义处理。以词形自动分析中为例的研究有助于认识这种方法在语言学其他领域的研究和应用。
- 唐旭日
- 关键词:经验主义
- 语料库检索可读性的自适应控制
- 2004年
- 检索结果的可读性较差是语料库在网络教学等实时语言教学环境中应用所面临的主要困难之一。本文提出了一种通过对检索过程进行自适应控制以提高检索结果的可读性的方法。该方法依赖于两个方面的信息:句子Dale-Chall 可读性参数及语言学习者的阅读能力。实验表明,该系统使得语料库在语言教学中的实时应用成为可能。
- 唐旭日
- 关键词:语料库可读性自适应
- WordNet与HowNet之关系研究被引量:3
- 2007年
- WordNet与HowNet在表征论的语义理论框架下对词汇所携带的概念框架信息采用了不同的描述方式。WordNet采用区别性语义表征,给出了词汇的各种语义关系;HowNet则采用建构性语义表征,给出了概念及概念关系的义原解释。HowNet的义原能够系统解释WordNet中的各种语义关系。
- 唐旭日
- 关键词:WORDNETHOWNET语义表征语义关系
- 中文文本的地名解析方法研究被引量:42
- 2010年
- 讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。
- 唐旭日陈小荷张雪英
- 关键词:地名识别地理编码
- 中文地名结构的定性与定量分析
- 本文依据语言递归性本质特征,提出“地名成分”的概念,并以其为基本单位,对中文地名内部结构进行了定性和定量分析。“地名成分”为确定性的地名结构分析单位,由区别性词素、方位词素、描写性词素、类型词素和部位词素按一定顺序构成,...
- 唐旭日陈小荷
- 关键词:文字处理地名识别数理语言学
- 文献传递
- 谓词语义计算:搭配与概念隐喻
- 唐旭日
- 关键词:搭配谓词词义排歧概念隐喻HOWNET
- 超大规模语料库精加工技术研究被引量:4
- 2009年
- 在对现有词法标注器标注质量考察分析的基础上,本文提出语料库精加工的方法。利用这些方法,对从《人民日报》社购得的1998年上半年样例语料重新进行校对,从中排查并修改了5万余处切分和词性标注的错误或不一致,提高了样例语料的质量。本文提出的基于上下文词语相对词频比之和RFR_SUM的消歧模型,具有很好的分类效果。利用重新校对过的样例语料作为训练数据,再利用RFR_SUM模型对400余种常见歧义现象的消解进行训练,并将所得到的模型应用于超大规模语料的精加工,也取得良好的效果。
- 曲维光唐旭日俞敬松
- 信息技术背景下教材系列化建设——英语(新标准)配套多媒体光盘的开发研究
- 2006年
- 一.引言近十多年来,随着个人计算机和互联网的进一步普及,计算机辅助外语教学的研究热忱日益高涨。基础英语教学、高等学校英语教学中开始尝试开展较大规模的使用计算机进行英语教学。
- 唐旭日
- 关键词:多媒体光盘教学手段新标准英语
- Matrix英汉翻译系统的分析及建议被引量:3
- 1999年
- 本文分析了M atrix 英汉翻译系统中的自动剖析基本语法框架及自动剖析过程对翻译结果的影响,认为该系统以词为转换单位的设定,限制了原语分析的进一步深入,并建议以小句作为转换单位,以此提高机译转换过程中的对等程度。
- 罗选民谭外元唐旭日
- 关键词:机器翻译MATRIX小句
- 计算机辅助学习环境中的词汇学习策略被引量:3
- 2007年
- 在总结计算机辅助学习环境中词汇学习的特点的基础上,系统地分析了机助词汇学习环境中学习者在学习策略的选择、学习策略的使用、和学习策略使用效果等方面的特征,从而进一步论证了学习策略与学习环境之间存在紧密地联系。
- 唐旭日
- 关键词:学习环境