乔春庚
- 作品数:5 被引量:1H指数:1
- 供职机构:北京信息科技大学更多>>
- 发文基金:北京市教委科技发展计划北京市属高等学校人才强教计划资助项目北京市教育委员会科技发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 多情景跨领域中文文本智能校对关键技术及应用
- 2021年
- 数字化时代,多种应用情景的电子文本大量涌现,包括各种编码输入法、OCR识别、机器翻译、语音识别等产生的文本,并在新闻和图书出版、各种公文处理、网络媒体处理等跨领域得到广泛应用。电子文本中经常会出现字词、句法、语义级的各种错误,直接影响文本的质量,敏感性、政治性错误还会影响社会安全和稳定。人工对文本内容的审核校对,成本高且质量得不到保证。开展多情景跨领域的中文文本智能校对技术研究,可以发现各种错误的出现机理,有利于规范文本内容,减轻劳动强度,降低出版成本,具有重要的科学、社会意义及应用价值。项目历时近20年,在国家自然科学基金等项目支持下,通过校企合作,对中文文本校对的关键技术进行深入研究并取得突破,形成多项创新性技术成果,部分成果在国内外实现了重大技术突破。
- 张仰森亓文法亓文法施水才吴云芳陈若愚黄改娟王洪俊吴云芳肖诗斌尤建清黄改娟张良
- 关键词:电子文本中文文本文本校对机器翻译公文处理国家自然科学基金
- 规则与统计相结合的案件名称识别
- 在公安领域信息中,案件名称有着举足轻重的作用。因此,如何准确的识别出文本中的案件名称是一个非常重要的研究课题。在对公安领域文本进行了深入地分析和研究的基础上,总结出了案件名称的结构特征及其上下文信息,建立了用于识别案件名...
- 乔春庚肖诗斌孙丽华施水才
- 关键词:公安领域信息抽取
- 文献传递
- 公安领域案件信息抽取系统设计与实现
- 近年来,随着公安刑侦专业信息及案件新闻报道等信息的急剧增长,以及犯罪分子作案手段的多样性和隐蔽性的增加,在如此多的资源信息中如何获得破案线索信息,如何提高破案效率,如何快速有效的找到相关案件信息,已经成为刑侦工作迫切解决...
- 乔春庚
- 关键词:公安领域信息抽取命名实体识别
- 文献传递
- 基于未标注语料的领域词汇自动抽取
- 领域词汇集中体现和承载了一个学科领域的核心知识,领域词汇的抽取是很多自然语言处理应用的一个起始点。文中提出了一种基于未标注语料的领域词汇自动抽取方法。首先计算了词语间的结合紧密度,然后统计词汇特征,最后使用 SVM 分类...
- 肖诗斌乔春庚李渝勤施水才
- 文献传递
- 规则与统计相结合的案件名称识别
- 在公安领域信息中,案件名称有若举足轻重的作用.因此,如何准确的识别出文本中的案件名称是一个非常重要的研究课题.在对公安领域文本进行了深入地分析和研究的基础上,总结出了案件名称的结构特征及其上下文信息,建立了用于识别案件名...
- 乔春庚肖诗斌孙丽华施水才
- 关键词:公安领域信息抽取知识库
- 文献传递