阎保平 作品数:279 被引量:2,217 H指数:19 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 生物学 更多>>
大数据与科研信息化的关系 2014年 大数据与科研信息化的关系,在四个方面问题上值得探讨。第一,在信息化社会里,科研信息化本质就是数据驱动的科学研究。第二,信息化的整个科研活动,呈现的是以科学数据为生命周期的过程,包含了从数据的采集、数据的传输、数据的存储,以及数据的分析计算,到最终的数据的可视化展示等等过程。这个过程是周而复始不断深化的过程,涉及到大量的信息技术问题。第三,以前的科学家们在科研现场做研究,现在则通过大量的数据获取来分析数据,最后分析数据呈现的形态。 阎保平关键词:科研信息化 计算机网络信息 生态保护区 科学学科 生态监测 黑冠长臂猿 科学数据库元数据标准体系设计 被引量:14 2003年 元数据标准体系是科学数据库元数据系统的核心模块,标准体系设计的合理性和实用性直接影响元数据的质量。本文首先分析了科学数据库资源特点和元数据标准的使用需求,然后提出了科学数据库元数据标准体系的一套设计方案,说明了该体系的结构和功能。接着,着重阐述了该体系中核心模块的详细设计内容,最后分析了该设计方案的互操作策略和扩展策略,并对该方案进行了评估。 杨德婷 阎保平关键词:科学数据库 元数据 下一代Internet协议—IPv6的服务质量机制探讨 被引量:6 1999年 IPv6 与IPv4 在网络服务质量的机制上有明显的不同。本文结合IPv6 头结构具体分析了IPv6 的QOS机制,并讨论了它的发展前景。 罗万明 阎保平关键词:IPV6 服务质量 网络协议 INTERNET网 新的Web用户行为统计分析系统研究和实现 被引量:3 2008年 随着互联网的飞速发展,Web用户行为模式挖掘研究工作日益重要,但目前的挖掘工作中存在如用户识别不准确、路径补充存在误差、无法及时有效地了解某一区域的互联网使用情况等问题。为解决这些问题,研究、实现了一种新的Web用户行为统计分析系统。 杨风雷 阎保平关键词:WEB用户行为 青海湖生态水文监测数据可视化平台 被引量:4 2018年 青海湖是中国最大的内陆湖泊和咸水湖,是候鸟的栖息地,具有重要的生态研究价值.为了有效管理和应用青海湖获取采集的生态监测数据,本文设计并实现了青海湖生态水文监测数据可视化平台.平台使用Spring MVC作为后台开发框架.数据库使用开源时序数据库InfluxDB,并利用InfluxDB的数据保留策略和连续查询对数据进行聚合存储.可视化功能使用开源的JavaScript工具Echarts实现,对青海湖的大气环境、水文、土壤等生态数据进行可视化. 萧晓俊 罗万明 罗泽 阎保平关键词:生态监测 可视化 科学工作流溯源表示和查询技术综述 2015年 溯源管理是科学工作流系统的核心功能之一。科学工作流语境下的溯源,可分为工作流定义溯源和工作流执行溯源,分别描述工作流定义和执行阶段的元数据、过程依赖及数据演化。本文重点关注工作流定义溯源和执行溯源的表示及查询技术,并阐释针对科学工作流领域内独有问题,如"黑盒"问题、依赖区分问题以及细粒度溯源等问题的解决方案。文中还将介绍现存的一些面向科学工作流的溯源系统,并提出对溯源技术未来的展望。 林晨 罗万明 阎保平关键词:科学工作流 MPEG-7中可伸缩颜色描述符的研究 被引量:1 2006年 从最基本的概念出发,介绍了MPEG-7中可伸缩颜色描述符出现的背景、描述符分量的语义、位平面、Haar变换等详细情况及匹配算法,并对可伸缩颜色描述符的应用范围作了说明. 李志全 黎建辉 阎保平关键词:HAAR变换 位平面 基于高斯模型的T-LoCoH候鸟家域估计算法研究及应用 被引量:4 2015年 近年来,随着GPS定位技术的发展,动物轨迹数据成为了当前的研究热点,其中动物家域估计是轨迹数据研究的重要部分。已有的T-Lo Co H家域估计算法没有考虑候鸟迁徙行为在速度上的显著差异性,不适合候鸟家域估计。针对以上问题,本文提出将候鸟运动轨迹数据按其活动的周期性分段,并使用高斯模型估算其各阶段的最大运动速度,再结合T-Lo Co H方法估计出候鸟在各个运动阶段的家域。实验表明,这种基于高斯模型的T-Lo Co H候鸟家域估计算法能更精确地划分候鸟在各阶段的活动范围。 何久娣 罗泽 苏锦河 阎保平关键词:候鸟 家域 高斯模型 基于簇的孤立点检测 2008年 提出一个新的概念——基于簇的孤立点概念,这个概念的提出有助于理解局部数据的行为,同时也描述了如何利用LDBSCAN算法发现基于簇的孤立点,并为每一个对象计算局部偏离因子. 段炼 阎保平 李俊关键词:孤立点检测 使用特征文本密度的网页正文提取 被引量:14 2010年 针对当前互联网网页越来越多样化、复杂化、非规范化的特点,提出了基于特征文本密度的网页正文提取方法。该方法将网页包含的文本根据用途和特征进行分类,并构建数学模型进行比例密度分析,从而精确地识别出主题文本。该方法的时间和空间复杂度均较低。实验显示,它能有效地抽取复杂网页以及多主题段网页的正文信息,具有很好的通用性。 王少康 董科军 阎保平关键词:文本特征 信息抽取 网页