江西财经大学信息管理学院数据与知识工程江西省高校重点实验室
- 作品数:3 被引量:8H指数:1
- 发文基金:江西省教育厅科学技术研究项目江西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于统计的句法分析方法被引量:6
- 2014年
- 句法分析是自然语言处理的一个基本问题,随着大规模标注树库的建立,基于树库的统计句法分析逐渐成为现代句法分析的主流技术。在介绍句法分析树库及句法分析性能评测方法的基础上,对主要句法分析统计模型和中文句法分析的研究现状进行简要综述和分析,并探讨和总结了基于统计的句法分析模型的不足之处和发展趋势,指出现有的汉语句法分析方法不适合汉语的特点,没有有效刻画出汉语的本质特性,导致目前汉语句法分析性能与英语相比相差较大;将语义信息融入句法分析,并在此基础上建立句法分析与语义角色标注联合学习统计模型,将是句法分析的一个重要研究方向。
- 袁里驰
- 关键词:句法分析统计模型语义分析自然语言处理
- 基于答案结点的XML文档模糊检索被引量:1
- 2007年
- 针对普通用户发出的面向XML文档的自然语言模糊查询,分析了模糊内容和结构检索(VCAS)的影响因素,充分利用预设答案结点的逻辑意义完整性,结合模糊抽取的查询表达式给出了如何找到模糊内容检索的最佳查找粒度.在此基础上,设计了VCAS检索的结果相关性排序模型,最后通过实验从不同角度对模型进行了验证.
- 江腾蛟万常选刘喜平
- 关键词:XML检索排序
- 几种基于统计的词聚类方法比较被引量:1
- 2016年
- 基于数据稀疏问题是影响语言统计模型系统性能的主要问题,而基于词类的语言统计模型是解决这一问题的主要方法之一,利用相邻词语的互信息定义一种词语相似度,在词语相似度的基础上定义词语集合的相似度,进而提出一种能得到全局最优结果、自下而上的词聚类算法。研究结果表明:该词聚类算法执行效率高,聚类效果较好;根据该词聚类模型的结果所构造的基于词类和基于词语的线性插值模型,能较好地缓解统计语言模型中的数据稀疏问题。
- 袁里驰
- 关键词:自然语言处理词聚类互信息