王彦青 作品数:8 被引量:79 H指数:3 供职机构: 中国科学院北京基因组研究所 更多>> 发文基金: 中国科学院战略性先导科技专项 国家自然科学基金 更多>> 相关领域: 生物学 自动化与计算机技术 医药卫生 更多>>
生命组学大数据安全管理实践 2024年 生命组学大数据是国家重要基础性、战略性资源,对支撑生命科学基础研究和应用创新、推动生物经济创新发展、维护国家安全具有重要意义。随着数据规模的不断增长,生命组学大数据的安全管理问题逐渐凸显。国家基因组科学数据中心(National Genomics Data Center,NGDC)面向我国人口健康和社会可持续发展的重大战略需求,建立了生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,形成了一系列数据安全管理的制度和措施。本文聚焦于生命组学大数据全生命周期的安全管理问题,探讨生命组学大数据安全管理框架,全面分析在数据汇交、存储、管理、共享全生命周期中涉及的安全管理内容,并总结了NGDC在生命组学大数据安全管理方面的成效。最后,本文展望了生命组学大数据安全管理的发展方向,包括完善数据分级分类制度、提升数据分级安全管理技术和加强数据异地灾备建设,以期实现生命组学大数据的安全管理与可持续发展。 王彦青 王彦青 张思思 陈婷婷 陈焕新 张思思 宋述慧 朱军伟 赵文明 陈焕新关键词:数据汇交 数据共享 安全管理 GSA:组学原始数据归档库 被引量:10 2018年 生命科学的发展已进入组学大数据时代,然而我国至今尚未形成公共数据库存储体系。为弥补国内空白,组学原始数据归档库(Genome Sequence Archive, GSA, http://bigd.big.ac.cn/gsa)系统遵循国际核苷酸序列数据联盟(International Nucleotide Sequence Database Collaboration,INSDC)相关数据库建设标准,广泛收集各类生命组学原始数据。自2015年底上线运行以来,已获得了包括Cell、Nature、PNAS、GPB等30余个国内外期刊的认可,收录的数据量呈显著增长趋势,提供的数据服务受到国内外广大科研人员的认可。GSA有效缓解了当前我国生命组学数据汇交、存储与共享困难的问题,为我国国家生物信息中心的建设奠定了坚实基础。本文对目前GSA数据汇交、审核、发布与管理等机制进行了深入阐述,以方便用户了解GSA的各项功能,提供更高效的数据服务。 张思思 陈婷婷 朱军伟 周晴 陈旭 王彦青 赵文明关键词:数据汇交 数据共享 GSA-Human:人类遗传资源数据管理的公共系统 被引量:10 2021年 GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资源管理条例》数据安全管理策略,提供公开访问和受控访问相结合的数据使用模式。公开访问数据允许用户自由下载与获取;受控访问数据采用申请-审核的模式,即需要通过数据管理委员会(Data Access Committee,DAC)的授权方可获得下载和使用权限。系统自上线以来,截至2021年7月,汇集数据总量已超5.27 PB。 张思思 张思思 陈婷婷 陈旭 唐碧霞 陈婷婷 董丽莉 朱军伟 孙艳玲 唐碧霞 翟爽 孙玉彬 陈焕新 杜政霖 肖景发 章张 鲍一明 王彦青 陈焕新关键词:数据汇交 数据共享 2019新型冠状病毒信息库 被引量:60 2020年 2019年12月在中国武汉开始爆发的新型肺炎已造成全球25个国家/地区的31516人感染、638人死亡(截止2020年2月7日16时),引起该肺炎的病毒被世界卫生组织命名为2019新型冠状病毒(2019-nCoV)。为促进2019-nCoV数据共享应用并及时向全球公众提供病毒的相关信息,国家生物信息中心(CNCB)/国家基因组科学数据中心(NGDC)建立了2019新型冠状病毒信息库(2019nCoVR,https://bigd.big.ac.cn/ncov)。该信息库整合了来自德国全球流感病毒数据库、美国国家生物技术信息中心、深圳(国家)基因库、国家微生物科学数据中心及CNCB/NGDC等机构公开发布的2019-nCoV核苷酸和蛋白质序列数据、元信息、学术文献、新闻动态、科普文章等信息,开展了不同冠状病毒株的基因组序列变异分析并提供可视化展示。同时,2019nCoVR无缝对接CNCB/NGDC的相关数据库,提供新测序病毒株系的基因组原始测序数据、组装后序列的在线汇交、管理与共享、国际数据库同步发布等数据服务。本文对2019nCoVR数据汇交、管理、发布及使用等进行全面阐述,以方便用户了解该信息库各项功能及数据状况,为加速开展病毒的分类溯源、变异演化、快速检测、药物研发以及新型肺炎的精准预防与治疗等研究提供重要基础。 赵文明 宋述慧 宋述慧 陈梅丽 马利娜 马利娜 李茹姣 李茹姣 郝丽丽 田东梅 田东梅 唐碧霞 王彦青 朱军伟 陈焕新 章张 鲍一明面向生物组学大数据计算的云平台系统及方法 本发明公开了一种面向生物组学大数据计算的云平台系统及方法,涉及用于维护或管理的装置技术领域。所述系统包括系统管理模块、数据管理模块、应用程序管理模块、流程管理模块、任务管理模块、数据可视化操作模块以及用户与权限管理模块。... 唐碧霞 赵文明 朱军伟 王彦青文献传递 系统生物学中多组学综合数据库的设计与实现 系统生物学中多组学综合数据库以建立综合型组学数据库为目标,目前集成了水稻、家鸡、家蚕、流感病毒以及人的dbSNP数据供用户访问。本文结合系统生物学中多组学综合数据库系统的建设过程,详细描述了系统架构设计以及数据库结构设计... 唐碧霞 王彦青 陈旭 庞博 赵文明关键词:系统生物学 系统设计 功能模块 文献传递 面向生物组学大数据计算的云平台系统及方法 本发明公开了一种面向生物组学大数据计算的云平台系统及方法,涉及用于维护或管理的装置技术领域。所述系统包括系统管理模块、数据管理模块、应用程序管理模块、流程管理模块、任务管理模块、数据可视化操作模块以及用户与权限管理模块。... 唐碧霞 赵文明 朱军伟 王彦青基因组可视化工具GBrowse及其应用 基因组可视化工具是生物学领域一个比较重要的数据辅助分析工具,到目前为止,己有许多满足各种不同需求的可视化工具被开发出来并被使用。本文介绍了GBrowse的功能、特点,并结合实际给出了GBrowse在水稻基因组浏览器中的简... 唐碧霞 王彦青 陈旭 庞博 赵文明关键词:基因组 可视化工具 用户体验 文献传递