陈翠婷
- 作品数:9 被引量:9H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:天文地球自动化与计算机技术政治法律更多>>
- 并行地理计算算法性能评测技术研究
- 2015年
- 从并行地理算法的正确性评测、性能评测、评测流程和评测工具实现等角度,研究了高性能集群环境下的评测技术。在正确性评测假设基础上,将评测用例在不同进程数环境下的计算结果与该算法在单进程环境下的运算结果逻辑求差得出相对误差,提出了问题规模计算方法。根据评测用例的问题规模确定评测用例的权重,提出了性能指标和评测流程,并通过评测工具自动获得同一个并行地理计算算法。在多个不同评测用例下的评测指标来衡量算法的计算误差与性能,形成评测报告。经实验验证,本文方法能较好地满足并行地理计算算法评测的需求,为并行空间分析算法性能优化提供技术保障。
- 陈翠婷方金云邱强姚晓李栋宾
- 关键词:地理计算性能评测
- 基于自适应权重的语义检索模型融合方法及系统
- 本发明提出一种基于自适应权重的语义检索模型融合方法,包括:以检索信息进行稀疏检索,获取稀疏检索结果及对应的稀疏排序分值;以该检索信息进行稠密检索,获取稠密检索结果及对应的稠密排序分值;构建权重预测模型,基于该检索信息、该...
- 薛源海夏浩耘贺广福陈翠婷俞晓明沈华伟程学旗
- 一种大数据场景下的数据分割方法
- 本发明实施例提供了一种大数据场景下的数据分割方法,包括:获取探测区间,确定待分割的数据集合中属于探测区间内的区内数据条数;在区内数据条数不处于预定的容忍范围内时,对探测区间的右端点进行一次或者多次指数型调整直至得到使得区...
- 贺广福薛源海陈翠婷俞晓明刘悦沈华伟程学旗
- 文献传递
- 一种基于实体增强的文本语义表示方法及系统
- 本发明提出一种基于实体增强的文本语义表示方法和系统,包括:获取文本编码模型和实体增强编码模型,实体增强编码模型由串联的外部实体向量表示模块和上下文相关的实体信息编码模块组成;通过文本编码模型提取目标文本的第一表示向量;以...
- 薛源海夏浩耘陈翠婷贺广福俞晓明沈华伟程学旗
- 一种文本聚合方法以及文本推荐方法
- 本发明提供了一种文本聚合方法以及文本推荐方法,该一种文本聚合方法包括获取待处理的文本;利用经改进的SimHash算法计算文本的指纹信息,其中,经改进的SimHash算法在对文本中相应词语的哈希值进行加权时,利用词语在该文...
- 贺广福薛源海陈翠婷俞晓明刘悦沈华伟程学旗
- 基于Spark的空间数据实时访存技术的研究被引量:7
- 2015年
- 研究并实现了基于Spark的空间查询算法。根据空间查询特性和Spark分布式内存计算模型,设计了HBase分布式存储、分布式空间索引、Spark分布式内存计算框架的空间区域查询算法和Spark Streaming的空间查询算法,提供实时在线空间查询服务。实验表明,基于Spark streaming并行空间查询算法*可以提供空间数据的实时空间查询服务。
- 方金云刘羽姚晓陈翠婷张梦菲肖茁建张广发
- 关键词:地理信息系统
- 基于容忍因子的近似最近邻混合查询算法
- 2024年
- 近似最近邻搜索(ANNS)是计算机领域中一种重要的高效相似度搜索技术,可用于在大规模数据集中进行快速信息检索。随着人们对高精度信息检索的需求不断增长,同时使用结构化信息和非结构化信息进行混合查询的方式也得到了广泛应用。然而,基于近邻图的过滤贪心算法在混合查询时可能会因结构化约束条件的影响导致连通性降低,进而损害搜索精度。为此,提出了一种基于容忍因子的过滤贪心算法,通过容忍因子控制不满足结构化约束条件的顶点参与路由,在不改变索引结构的前提下维持原有近邻图的连通性,克服了结构化约束条件对检索精度的负面影响。实验结果证明,新算法可以在不同结构化约束强度下实现ANNS的高精度搜索,同时保持检索效率。该研究解决了基于近邻图的ANNS在混合查询场景中的问题,为大规模数据集的快速混合查询信息检索提供了一种有效的解决方案。
- 贺广福薛源海陈翠婷俞晓明俞晓明程学旗
- 关键词:最近邻搜索
- 纪检监察大数据建设助推社会治理科技化
- 2019年
- 党的十九大以来,以大数据等为技术手段,坚定不移推进全面从严治党成为重要的纪检监察工作方向。本文从纪检监察大数据系统建设需求出发,秉持"互联网+监督”理念,运用关联分析、线索发现、人物画像等分析技术,构建了纪检监察大数据从数据感知到数据认知再到决策分析的关键技术,进一步从系统架构和技术架构的角度阐述了纪检监察大数据系统建设的主流架构。纪检监察大数据系统建设为科技反腐提供了更加客观公正的技术评价,具有重要的实用价值和意义。
- 邱强陈翠婷方金云
- 关键词:资源管理
- 复杂地理计算并行算法性能评估技术研究被引量:2
- 2013年
- 并行地理计算与面向计算密集型的高性能计算和面向数据密集型的分布式计算不同,因此迫切需要一套针对地理计算的监测评估工具,以发现并行程序性能的瓶颈和热点,获得程序设计、实现和优化指导。该文通过代码自动插桩、热点监控、事件日志并行分析等技术实现了复杂地理计算并行算法性能评估,经过初步验证,并行工具性能良好,能够满足地理计算并行算法评估要求。
- 方金云闵伟陈翠婷李栋宾
- 关键词:地理计算