陈东辉
- 作品数:19 被引量:90H指数:4
- 供职机构:国家气象信息中心更多>>
- 发文基金:青年科技基金国家自然科学基金更多>>
- 相关领域:天文地球自动化与计算机技术环境科学与工程电子电信更多>>
- 一种基于深度学习的手写气象档案资料的文本定位方法
- 本发明公开一种基于深度学习的手写气象档案资料的文本定位方法,图像预处理与数据集准备:将纸质气象档案扫描为数字图像格式,先做图像预处理,再提取表格制作文本定位数据集;文本定位:将数据集图像裁剪成小区域,使用CTPN深度学习...
- 鞠晓慧张强王妍陈东辉范邵华罗岚心
- 中国动植物自然物候长序列数据集研制
- 2021年
- 中国气象档案馆馆藏1981年以来的木本、草本、虫鸟两栖动物自然物候观测资料,是现有中国境内覆盖范围最广、持续时间最长的自然物候观测数据。通过对数字化档案与电子报文进行数据清洗与质量控制,研制出1981~2018年中国动植物自然物候长序列数据集,分为木本、草本、虫鸟两栖动物3个子集。其中草本植物子集样本13936条,42个物种,12种物候期,数据实有率94.8%;木本植物子集样本36495条,111个物种,18种物候期,数据实有率78.3%;虫鸟两栖动物子集样本15513条,18个物种,2种物候期,实有率95.9%。以北京地区木本植物物候数据分析为例,验证了该地区物候变化与现有气候变化研究结论相吻合。
- 罗岚心陈东辉任芝花
- 关键词:木本植物草本植物
- 基于Hadoop架构的气象大数据汇聚方法
- 本发明公开了一种基于Hadoop架构的气象大数据汇聚方法,技术方案可概括为:首先搭建并部署多源异构气象大数据资源汇聚环境,然后获取气象分析的需求信息,根据需求信息通过可视化界面Web端配置资源汇聚信息创建资源汇聚任务,并...
- 张强陈东辉刘一鸣韩瑞罗岚心高静石岩赵煜飞刘雨佳冯爱霞战云健姜筱玮王妍梁中军兰平范邵华李默予
- 文献传递
- 一种基于深度学习的手写气象档案资料的文本定位方法
- 本发明公开一种基于深度学习的手写气象档案资料的文本定位方法,图像预处理与数据集准备:将纸质气象档案扫描为数字图像格式,先做图像预处理,再提取表格制作文本定位数据集;文本定位:将数据集图像裁剪成小区域,使用CTPN深度学习...
- 鞠晓慧张强王妍陈东辉范邵华罗岚心
- 文献传递
- 基于HBase的气象地面分钟数据分布式存储系统被引量:25
- 2014年
- 针对气象地面分钟数据要素多样、信息量大、产生频次高等特点,传统的关系型数据库系统在存储和管理数据上出现负载饱满、读写性能不理想等问题。结合对分布式数据库HBase的存储模型的研究,行主键(row key)采用时间加站号的方式设计了气象分钟数据存储结构模型,实现对海量气象数据的分布式存储和元信息管理。对HBase的唯一索引在面对气象业务的复杂查询用例时响应时间过长的问题,使用搜索引擎solr提供的API接口并参考气象业务中的查询用例对相关字段建立辅助索引,来满足业务检索时效。实验结果表明,该系统具有很好的存储能力和检索效率,入库效率最高可达每秒34000条,并且在常规查询用例的结果返回时效达到毫秒级,能够满足大规模气象数据在业务应用中对存储和查询时效的性能要求。
- 陈东辉曾乐梁中军肖卫青
- 关键词:分钟数据分布式存储HADOOPSOLRHBASE
- 青藏高原地气系统气象科学数据集成和共享被引量:6
- 2021年
- 观测资料匮乏是制约青藏高原地球科学问题深入研究的关键因素。中国气象局国家气象信息中心联合中国气象科学研究院、中国科学院青藏高原研究所和西北生态环境资源研究院对近几十年来我国青藏高原区域的地气系统的大气和陆面观测资料及相关分析产品进行了整合集成,获得了高原区域长年代、多要素的地气系统综合气象数据,研发了综合气象数据库及其数据共享平台。本文系统介绍了相关科学数据的观测及数据情况,包括中国气象局长期业务观测数据、历次青藏高原大气科学试验数据、中国科学院部分野外台站长期观测试验数据和一些科学研究项目的产出数据成果,描述了多种数据的标准化集成技术和成果,设计并发布了青藏高原地气系统多源信息共享平台,为研究和解决青藏高原地球科学问题提供宝贵的数据资源。
- 熊安元冯爱霞高梅高峰张志强何文春马伟强孙方林张文华刘娜赵煜飞刘媛媛陈东辉杨和平杨笛
- 关键词:青藏高原地气系统气象共享平台
- 一种基于深度学习的手写气象档案资料的字符识别方法
- 本发明公开一种基于深度学习的手写气象档案资料的字符识别方法,包括如下步骤:A、图像预处理与字符识别数据集制作;B、字符识别;C、检查识别效果。本发明将纸质气象档案扫描为数字图像格式,先做图像预处理,再使用CTPN算法定位...
- 鞠晓慧张强战云健陈东辉王妍兰平
- 文献传递
- 一种气象纸质表格文档的快速数字化方法及系统
- 本发明提供了一种气象纸质表格文档的快速数字化方法及系统,属于气象数据处理领域。所述快速数字化方法包括:获取气象纸质表格文档的图像;对图像进行预处理后,提取表格线并进行字符识别,完成对字符的提取和定位,存储为第一类字符;对...
- 韩瑞石明远陈东辉
- 文献传递
- 基于Spark的气象历史台站沿革数据可视化方法及系统
- 本发明公开了基于Spark的气象历史台站沿革数据可视化方法,方法包括:在服务器上搭建Spark分布式批处理引擎;获取气象历史台站的沿革数据,并对数据按照标识码进行拆分存储到数据库中;设计大文件批处理切分方法,将沿革数据文...
- 陈东辉韩瑞王妍兰平鞠晓慧梁中军罗岚心战云健高静范邵华李默予谭婷婷石明远
- 文献传递
- 基于Hadoop的气象数据存储检索应用研究被引量:11
- 2014年
- 随着气象数据规模快速增长,气象预报和气候分析对数据服务时效性要求的提高,传统的气象数据存储和服务模式面临一定的挑战。本文提出了结合了hadoop技术的气象数据存储检索应用模式,并进行了实验和性能测试,以评估其实现效果。实现中针对代表性的结构化与非结构化气象业务数据,分别进行了测试,并提出优化方法。性能测试中对于自动站结构化数据的检索,大部分响应时间在毫秒级;对于大结果集的雷达基数据非结构化数据的检索响应时间也在秒级。本文认为基于hadoop的气象数据存储检索可作为应对海量气象数据增长带来的存储服务问题的有效解决途径之一。
- 曾乐陈东辉肖卫青梁中军
- 关键词:气象分布式存储数据检索