王洪俊
- 作品数:3 被引量:6H指数:2
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 搜索引擎日志中“N+V”型主谓短语研究被引量:3
- 2011年
- "N+V"型结构能够构成定中偏正、状中偏正和主谓三种不同结构的短语。基于搜狗日志语料,对"N+V"型主谓短语从其各组成要素特点、音节特点和句法功能三方面进行研究,着重从语义方面对"V"进行阐述。文中,还对实验数据进行深入的分析和实证,针对"N+V"型短语的句法结构歧义问题,提供了解决方案,这为提高中文搜索引擎的检索质量和搜索引擎用短语词典构建提供了重要的理论依据。
- 赵红改肖诗斌王洪俊吕学强
- 关键词:搜索引擎主谓短语句法功能
- 搜索引擎日志中“N_1+N_2+V”型名词短语研究被引量:3
- 2011年
- "N1+N2+V"结构是组成名词短语的一种基本形式。本文基于搜狗日志语料,对搜索引擎日志中的"N1+N2+V"型名词短语进行研究。针对语料自身的特点,从句法特征、短语的层次切分与拆分、句法功能和语义关系4方面,对这类短语进行了考察,着重分析了N1与N2、N2与V的语义关系。文中对搜狗日志的查询内容进行了深入分析和实证,为搜索引擎用短语词典的构建研究提供理论依据。
- 肖诗斌赵红改王洪俊吕学强
- 关键词:搜索引擎日志句法特征句法功能语义关系
- 多情景跨领域中文文本智能校对关键技术及应用
- 2021年
- 数字化时代,多种应用情景的电子文本大量涌现,包括各种编码输入法、OCR识别、机器翻译、语音识别等产生的文本,并在新闻和图书出版、各种公文处理、网络媒体处理等跨领域得到广泛应用。电子文本中经常会出现字词、句法、语义级的各种错误,直接影响文本的质量,敏感性、政治性错误还会影响社会安全和稳定。人工对文本内容的审核校对,成本高且质量得不到保证。开展多情景跨领域的中文文本智能校对技术研究,可以发现各种错误的出现机理,有利于规范文本内容,减轻劳动强度,降低出版成本,具有重要的科学、社会意义及应用价值。项目历时近20年,在国家自然科学基金等项目支持下,通过校企合作,对中文文本校对的关键技术进行深入研究并取得突破,形成多项创新性技术成果,部分成果在国内外实现了重大技术突破。
- 张仰森亓文法亓文法施水才吴云芳陈若愚黄改娟王洪俊吴云芳肖诗斌尤建清黄改娟张良
- 关键词:电子文本中文文本文本校对机器翻译公文处理国家自然科学基金