金奕江
- 作品数:48 被引量:80H指数:5
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 一种快速检索方法及系统
- 本发明涉及一种快速检索方法及系统,该方法包括:收集待检索对象列表及文档;在文档中标注出现在待检索对象列表中的待检索对象;抽取文档中已标注的待检索对象前后各若干个字符信息;将由同一待检索对象抽取的字符信息汇集为一个文档,得...
- 富羽鹏张敏刘奕群金奕江马少平
- 文献传递
- 用于免疫注射的动作推理方法及装置
- 本公开提出一种用于免疫注射的动作推理方法及装置,涉及计算机技术领域。其中,方法包括:根据当前的注射图像确定注射器位姿信息和待注射目标位姿信息;将注射器位姿信息与待注射目标位姿信息输入至预先训练的多模态大模型LLaVA中,...
- 孙富春周怀东金奕江胡振宇黄保林
- 一种基于用户行为信息的搜索引擎检索结果重排序方法
- 本发明属于互联网信息处理领域,其特征在于:它根据单个或多个搜索引擎日志,首先利用查询对应的用户数信息,从中筛选出用户关注的常用查询集合;随后计算常用查询集中各查询对应的用户点击页面对应的用户点击率,若利用多搜索引擎日志信...
- 岑荣伟刘奕群张敏金奕江马少平
- 文献传递
- 一种基于文档相似度的检索结果重排序方法被引量:9
- 2010年
- 对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。
- 周博岑荣伟刘奕群张敏金奕江马少平
- 关键词:计算机应用中文信息处理信息检索
- 群体智能支撑的互联网搜索技术及其应用
- 刘奕群张阔张敏王小川茹立云马少平许静芳王超佟子健张坤余浩李毅刘明荣仙云森金奕江
- 该成果属于信息技术领域。成果围绕现代互联网搜索技术提升的迫切需求,针对搜索引擎在组织、利用海量规模异构异质网络数据,理解、匹配高度动态复杂的用户信息需求等方面存在的技术挑战开展了深入研究探索。从互联网搜索用户的群体交互规...
- 关键词:
- 关键词:互联网搜索引擎系统
- 汉字文本识别的自动后处理被引量:5
- 1997年
- 在汉字识别率不是很高时,可利用上下文相关信息(词汇及字字相邻出现概率),把一个汉语句子或短语作为一个处理单元,利用词匹配信息修改汉字识别的可信度,再用动态规划方法找到最佳结果。这种基于统计概率和词汇匹配相结合的方法,对脱机手写汉字识别文本进行自动后处理。
- 夏莹马少平孙茂松朱小燕金奕江常新功
- 关键词:文本识别手写汉字识别后处理方法正确率基于统计
- 采用“否定概率和”合成两类判别的汉字识别方法
- 汉字识别是一种典型的大规模模式识别问题。解决多类模式识别问题的一种方法就是把它分解成一组更简单的类数更少的识别问题的组合。本文研究了这样一种方法,把多类问题分解成最简单的两类问题的组合,提出了“否定概率和”合成方法。并把...
- 金奕江马少平
- 关键词:汉字识别
- 文献传递
- 基于ASIC识别卡的脱机手写体汉字识别系统
- 脱机手写体汉字识别是汉字识别的一个热点,也是机器字符识别最为困难的一个课题.传统上我们采取纯软件识别的方法,这样识别率可以达到比较高的水平,但是识别速度很低.模板匹配是脱机手写体汉字识别的主要部分,它也是整个识别速度的瓶...
- 宁薇郑翔金奕江赵雁南马少平
- 关键词:脱机手写体汉字识别ASIC
- 文献传递
- 计算机语言学方法在中文文字识别后处理中的应用被引量:2
- 1996年
- 近年来,脱机手写汉字识别[OCR]研究取得了很大进步,识别率在提高,前十选识别可达95%以上,但第选识别率仍不够高。OCR 的研究者们已看到单纯的单字(Isolatedcharacter)识别的方法对整个文本识别是不够的。
- 夏莹马少平孙茂松朱小燕金奕江李国华
- 关键词:汉字识别文字识别汉字处理计算机语言学
- 利用上下文相关信息的汉字文本识别被引量:10
- 1996年
- 为了改善汉字文本识别率,本文提出了一种基于语料库统计概率的后处理方法,该方法利用上下文相关信息,超过词汇。对于汉字文本识别,把具有确定性边界的一个汉字序列(多数情况为一个句子)作为一个处理单元,利用统计获得的字字同现概率,采用动态规划方法,获得了令人满意的效果。
- 夏莹常新功马少平朱小燕金奕江
- 关键词:汉字识别语料库语言学