搜索到194篇“ 索引压缩“的相关文章
索引压缩方法、装置、计算设备集群及存储介质
本申请公开了一种索引压缩方法、装置、计算设备集群及存储介质,属于数据库领域。所述方法包括:获取数据库中的树状索引结构,树状索引结构包括至少两层索引节点;扫描至少两层索引节点中的索引节点;在扫描到的第一索引节点满足选择条件...
胡超越李清佘松
一种基于索引压缩的生成三维建筑GLTF文件的方法
本发明公开了一种基于索引压缩的生成三维建筑GLTF文件的方法,包括以下步骤:S1,采集建筑物的三维坐标数据;S2,根据楼层对数据进行分组并分类,形成基于哈希表的分类索引结构;S3,选择基准模型并记录其Mesh数据和顶点坐...
田威威张建军
数据库索引压缩方法、装置、电子设备及存储介质
本申请公开了数据库索引压缩方法、装置、电子设备及存储介质,涉及索引技术领域。通过获取包括多个叶子节点的索引树,对叶子节点列表中叶子节点提取公共前缀。在叶子节点列表中确定初始滑窗的第一边界和第二边界,并计算第一收益,根据第...
胡浩陈宇凡郑启洋夏文邹翔宇李诗逸张程伟张皖川熊艳辉蒋兆恒
一种基于分词的索引压缩方法、存储装置及电子设备
本发明公开一种基于分词的索引压缩方法、存储装置及电子设备,其中,基于分词的索引压缩方法包括数据写入流程:通过分隔符将索引字符串进行分词,得到一组索引分词;将各个索引分词映射成整数编号,生成整数编号与索引分词的内存映射ma...
徐锐波幸福卢文伟刘方
索引压缩方法、装置、计算机可读存储介质及电子设备
本发明涉及索引压缩方法、装置、计算机可读存储介质及电子设备,该方法包括:将所述索引文件原有key分为高位部分和低位部分;复用所述高位部分与所述低位部分表示新offset;其中,作为新offset时,所述高位部分用于表示b...
郭乃洪黄瑞祺陈吉胜
基于CRF的分区倒排索引压缩算法
2024年
倒排索引是大型搜索引擎的核心数据结构,本质是倒排列表中整数序列的集合。倒排索引压缩可以有效减少倒排索引所占空间,提高对关键词的检索效率。本文提出的基于条件随机场(CRF)的分区倒排索引压缩算法主要关注域值分区的分区方式。该算法对序列进行预分区,并且使用条件随机场对预分区进行标注并重组,有效减少了压缩时间。根据分区类型,该算法使用相应的编码方式,进一步减少了压缩后的空间占用。与其他倒排索引压缩算法进行对比实验分析,结果表明本文算法在压缩率上超过目前一些域值分区的算法,并且在解压时间上与其他域值分区算法相当。该算法在时间和空间上取得了较好的平衡。
王子琛瞿有利
关键词:倒排索引数据压缩条件随机场搜索引擎
一种索引压缩方法、索引压缩方法及装置
本申请实施例提供一种索引压缩方法、索引压缩方法及装置,涉及网络与基础架构安全技术领域。该方法包括利用自定义类CompressedDirect拦截原始Lucene的写索引数据流;将所述写索引数据流存储至利用自定义类预先创...
沈明正
一种位图索引压缩方法、解压缩方法、设备及介质
本发明提供一种位图索引压缩方法、解压缩方法、设备及介质,该压缩方法包括:建立索引表,确定颜色值与索引值的对应关系,将颜色值按照出现频率从大到小对应到从小到大的索引值上,并用可变字长编码的从短到长的编码表示;根据创建的索引...
陈成秋李宗宇邱文庆蓝涛
数据库索引压缩方法、装置、电子设备及存储介质
本申请公开了数据库索引压缩方法、装置、电子设备及存储介质,涉及索引技术领域。通过获取包括多个叶子节点的索引树,对叶子节点列表中叶子节点提取公共前缀。在叶子节点列表中确定初始滑窗的第一边界和第二边界,并计算第一收益,根据第...
胡浩陈宇凡郑启洋夏文邹翔宇李诗逸张程伟张皖川熊艳辉蒋兆恒
一种针对网络流数据及其位图索引压缩编码及解码方法
本发明公开一种针对网络流数据及其位图索引压缩编码方法,过程如下:步骤1:将原始流数据序列按照字段属性拆分,以列式数据库进行存储;步骤2:将每一列数据序列以4K行为单位进行分块得到原始数据块;步骤3:将每一个原始数据块内的...
马戈顾维玺黄启洋王青春

相关作者

瞿有利
作品数:42被引量:179H指数:7
供职机构:北京交通大学计算机与信息技术学院
研究主题:本体 文本分类 语义 倒排索引 文本预处理
李海丰
作品数:16被引量:0H指数:0
供职机构:华为技术有限公司
研究主题:页面 索引 事务 存储设备 磁盘I/O
朱敏
作品数:205被引量:467H指数:12
供职机构:四川大学
研究主题:可视化方法 可视化 神经网络 信息可视化 杀菌作用
刘洪健
作品数:3被引量:3H指数:1
供职机构:清华大学
研究主题:索引压缩 信息检索 计算机网络 搜索引擎 移动网络
孙良
作品数:22被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:用户 文档 搜索方法 移动搜索 信息搜索