搜索到180篇“ 中文信息检索“的相关文章
基于交叉词项的中文信息检索方法研究
近十年来,伴随着万维网的繁荣发展,信息数据以爆炸式的增长,如何有效和高效的从如此庞大的信息中获取所需,正是信息检索方法研究中亘久不变的重要主题,旨在更好的解决用户日益激增的信息需求。  在大部分传统的中文信息检索模型中,...
周国亮
关键词:中文信息检索
基于位置语言模型的中文信息检索方法研究
伴随着全球信息化进程的迅猛发展,网络上的中文信息资源变得越来越丰富,如何从这些海量数据中挖掘出有价值的中文信息,已逐渐成为信息检索领域的研究热点,信息检索技术的提高也随之变得重要起来。  在现有的检索模型中,文档的得分主...
陈雅兰
关键词:中文信息检索
基于Web Services的中文信息检索系统的研究与实现
网络科技的快速发展,使得人们的生活越来越离不开网络的支持,Web搜索技术的兴起更是将网络的作用体现出来。现有的WEB搜索技术主要是目录式检索、元数据引擎检索,但是目录式检索虽然可以实现检索时间快、工作量相对较少等优点,但...
吴星同
关键词:中文信息软件设计
基于位置语言模型的中文信息检索系统的研究被引量:3
2015年
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、BM25概率模型、统计语言模型。
陈雅兰胡小华涂新辉何婷婷
中文信息检索中词典机制分词算法的研究被引量:6
2014年
中文自动分词是实现搜索引擎信息检索的基础,分词词典是汉语自动分词系统的一个重要组成部分,词典的加载和查询速度直接影响到分词系统的速度。文中在研究传统词典机制的基础上,分析了基于双字哈希词典机制对词条除首次字外剩余词的不足,给出了一种改进的双字哈希的词典机制。最后,文中对改进算法从准确率、分全率和分词速度等方面进行了测试,结果表明,改进后的分词算法在不提升已有典型词典机制维护复杂度的情况下,提高了词条匹配的查询速度和效率。
宗中
关键词:信息检索中文分词哈希
基于词项依赖信息中文信息检索方法研究
随着我国智能手机的普及,移动互联网使用人数的增加,促使了移动互联网的飞速发展,网络中存储的各种数据呈指数级增长。如何利用信息检索技术快捷有效地从这些海量的数据中获取有用的信息,是工业界和学术界都极其关注的问题。  传统的...
尹浩传
关键词:移动互联网文本特征
中文信息检索方法、中文信息检索装置
本发明实施例提供了一种中文信息检索方法、中文信息检索装置。所述方法包括:接收检索关键字的全拼组合,从全拼组合中提取声母的首字母及韵母;在预置的二级检索索引集中,检索首字母对应的起始偏移量;在一级检索索引集中起始偏移量对应...
吴跃进
基于语义扩展的中文信息检索系统设计与实现
信息技术和因特网快速发展的同时,网上的文本数量大量增长,在多样及不同层次变化的信息库中获取所需的信息是一项艰巨的任务。现在市场上大多的检索系统中,用户基本上是通过查询核心词来表达的,用户的实际需求与查询核心词之间往往存...
毛媛媛
关键词:信息检索数据挖掘语义分析程序语言
基于布尔模型和扩展布尔模型的中文信息检索系统
当今国际互联网快速普及,通过网络搜索信息资源,以接近指数级的速度递增。要从如此多的网页信息中找到需要的信息,可想而知是多么的困难,而信息检索技术就是为了帮助使用者快速地找到所需要的信息。它以一定的策略在互联网中搜集、发现...
马强
关键词:文本检索信息检索用户模型
中文信息检索方法、中文信息检索引擎及嵌入式终端
本发明实施例提供了一种中文信息检索方法、中文信息检索引擎及嵌入式终端。所述方法包括:接收检索关键字的全拼组合,从全拼组合中提取声母的首字母及韵母;在预置的二级检索索引集中,检索首字母对应的起始偏移量;在一级检索索引集中起...
吴跃进

相关作者

贺宏朝
作品数:4被引量:57H指数:3
供职机构:天津大学电子信息工程学院
研究主题:查询扩展 中文信息检索 信息检索系统 自动生成 测试集
孙乐
作品数:135被引量:505H指数:12
供职机构:中国科学院软件研究所
研究主题:语言模型 中文信息处理 自然语言处理技术 抽取 自然语言处理
韩咏
作品数:28被引量:9H指数:2
供职机构:黑龙江工程学院
研究主题:信息检索 索引 中文信息检索 索引策略 N元文法
何丕廉
作品数:148被引量:877H指数:15
供职机构:天津大学计算机科学与技术学院
研究主题:数据挖掘 向量空间模型 神经网络 人工智能 WEB
张俊林
作品数:14被引量:70H指数:5
供职机构:中国科学院软件研究所
研究主题:语言模型 中文信息处理 信息检索 跨语言信息检索 计算机应用