牛北方 作品数:23 被引量:80 H指数:3 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家自然科学基金 中国科学院“百人计划” 中国科学院战略性先导科技专项 更多>> 相关领域: 自动化与计算机技术 医药卫生 生物学 农业科学 更多>>
区块链技术研究综述 被引量:58 2021年 随着比特币等虚拟数字货币的日益普及与发展,区块链技术受到了研究人员的广泛关注。区块链技术是一种按照时间顺序将区块以链式结构组合而成的分布式数据账本,具有去中心化、可编程、可溯源、不可篡改等特性,在金融领域中的研究尤为广泛。文章面向区块链技术的发展,介绍区块链技术的起源和概述,详细地讨论环签名、零知识证明、数字签名和同态加密等区块链关键技术,综述区块链技术的特点和种类。对区块链技术的应用领域进行概括,重点关注其应用原则和应用领域相关的案例,分析区块链应用当前的发展现状,并对未来区块链技术的发展方向进行分析与预测。 代闯闯 栾海晶 杨雪莹 过晓冰 陆忠华 牛北方关键词:区块链 环签名 零知识证明 数字签名 去中心化 分子空间结构比较方法优化与点部署的并行实现 2005年 分子空间结构相似性比较的指标函数可以定量地描述两个分子空间结构相似性大小,但难题在于如何确定分子初始相对位置,以保证得到全局最优叠合.由于以往都是利用程序随机生成初始相对位置,所以没有规则也不确定.为保证得到全局最优叠合,需要大量的初始相对位置优化计算.利用“均匀设计”的实验设计手段,在空间规则地筛选部署分子初始相对位置,使其具有代表性和均匀分布性,这样只需少数确定数目的初始相对位置,便可以稳定地得到指标函数的全局最优解.而后利用并行处理方法,把初始相对位置集合部署在Np个处理器上同时工作,大幅度地减少了运行时间,并输出与串行执行相同的运算结果. 郎显宇 牛北方 沈斌 陆忠华 迟学斌关键词:全局优化 叠合 面向国家高性能计算环境的虚拟数据空间系统 被引量:6 2021年 高性能计算环境是支撑国家科技创新、经济发展、国防建设的核心信息基础设施,世界高性能计算强国纷纷建设基于多超算中心资源的广域高性能计算环境。然而,高性能计算环境中资源种类繁多且地域分布广,无法有效发挥资源的聚合效应,难以满足大型应用对广域分布数据的统一管理和高效访问需求。为此,提出了一套可用于构建广域全局虚拟数据空间的完整技术体系,包括虚拟数据空间模型、跨域虚拟数据空间构建、广域环境中数据高效迁移、广域环境中存算协同调度、跨域高并发数据聚合处理等技术,并研发了一个可运行于国家高性能计算环境的虚拟数据空间系统,可有效支撑广域分散异构存储资源的统一高效访问,实现广域环境中分布数据的跨域共享和协同处理。目前,该软件系统已在国家高性能计算环境实验性部署,并验证了分子对接、全基因组关联分析、天气预报模式3类典型大型应用。验证结果表明,所研虚拟数据空间构建方法和系统可有效聚合广域分散的存储资源,满足大型应用的数据空间需求。 秦广军 肖利民 张广艳 牛北方 陈志广关键词:高性能计算环境 国家高性能计算环境的虚拟数据空间运行支撑技术研究 被引量:3 2021年 国家高性能计算环境的特点是广域分散、系统异构、存储资源隔离自治,这对存储设备管理、数据跨域共享等提出了极大的挑战。首先阐述了虚拟数据空间系统的概念,然后分析了其作为国家高性能计算环境的一部分,如何通过视图访问、数据共享、计算环境对接有效降低跨域的访问开销;接着通过模块化方式将虚拟数据空间系统与国家高性能计算环境进行深度的融合,将其功能补充到国家高性能计算环境中;最后通过统一的虚实空间用户管理框架实现了跨域统一、透明安全的存储服务和对大型计算应用的支撑,这对于国家高性能计算环境的发展具有十分重要的意义。 何小雨 邓笋根 栾海晶 牛北方关键词:数据分布 用户视图 环境集成 六倍体小麦基因组注释流程构建与优化 被引量:1 2019年 野生小麦是异源六倍体,基因组规模较大(约14 GB),且包含大量重复序列.为了培育具有优良性状的新品种,首先要定位控制目标性状的基因,因此建立一个完整准确的基因组注释软件流程至关重要.传统的基因组注释方法基于数据库比对,具有三个明显的缺点:一是比对速度慢;二是难以发现新基因;三是软件选择没有统一标准.本文提出了一种新的生物信息学注释流程,结合了基因数据库比对、转录组高通量测序数据分析、全长转录组单分子测序数据分析等多种技术手段,实现了六倍体小麦科农9204基因组完整准确的注释,为揭示小麦生长发育规律和培育新品种提供了重要参考和软件技术支撑. 祝海栋 李瑞琳 何小雨 赵丹 韩鑫胤 牛北方关键词:基因组 基因注释 高通量测序 基于国家高性能计算环境的中小企业计算社区系统 本说明书实施例公开了一种基于国家高性能计算环境的中小企业计算社区系统,系统可分为三大部分,第一部分为核心功能模块,实现计算社区与各超算节点的联系,包括资源获取、作业上传、结果下载、作业查询等功能,同时完成对超算节点资源的... 陈义夫 冯仰德 牛北方 刘威尔文献传递 四种肿瘤体细胞单核苷酸突变检测方法的比较 2017年 随着高通量测序成本的不断降低,基于DNA测序技术的肿瘤基因组研究已经成为揭示肿瘤分子机制的主流方法,并在临床诊断和治疗中逐渐得到应用。肿瘤体细胞单核苷酸突变变异(single nucleotide variant,SNV)作为最简单的一种基因变异类型,其检测会受到家系多态性、肿瘤异质性、测序和分析误差等多个因素的影响,从而导致一些假阳性的结果。目前,已有一些基于肿瘤基因组测序数据的体细胞SNV检测软件,如Varscan2,Mutect2,Strelka,Somatic Sniper等。本文选取四种典型的检测方法,对每种方法的检测原理进行研究,并使用ICGC-TCGA提供的全基因组数据,对上述四种变异检测软件进行测试。参照每种方法的分析流程,获得每种方法识别的候选变异位点集,并与真实的变异位点集合进行比较,分析每种算法的优缺点,从而为研究人员使用这些方法提供指导。 李晓东 何小雨 陈玮 李瑞琳 李瑞琳 祝海栋 张裕 代闯闯 陆忠华 迟学斌 陆忠华 迟学斌关键词:基因序列 突变检测 假阳性 基于新测序技术的比对与组装算法 被引量:2 2009年 针对新型超高通量测序仪Solexa测序仪所产生的测序片段read的比对与组装问题,提出一种短序列比对与组装算法SRMA,采用对参考序列进行hash的方法,将测序片段read分3段快速、准确地定位于参考序列,对不能定位的read采取从头(Denovo)组装的方法进行组装。测试结果表明SRMA算法具有较高的性能和敏感度,以及良好的应用前景。 牛北方 张西广 刘涛 郎显宇 陆忠华 迟学斌基于卷积神经网络的皮肤病诊断多二分类器研究 2022年 近年来,随着深度学习技术的日益普及与发展,卷积神经网络(CNN)被广泛应用于辅助医学诊断,并在医学影像诊断领域取得了重要的研究成果。本研究基于皮肤病数据种类繁多、特征不显著等特点,引入多二分类的研究方法搭建了从医学影像到计算机辅助诊断的框架,解决了目前皮肤病难以区分的问题,并在常见的皮肤病分类识别问题中得到具体检验。首先,本研究以3类常见的皮肤病数据集(白癜风、痤疮和银屑病)为例,实现了图像数据的增强、分割、多二分类器的构建、图像块的分类、皮肤病的判别等完整的工作流程。其次,在分组数据交叉验证下,三分类判别准确率为0.8320,四分类判别的准确率达到0.9125。最后,为了获得更高的准确率,在随机森林方法结果不理想的情况下,本研究引入了多二分类器网络架构,准确率达到了0.9377。 代闯闯 栾海晶 杨雪莹 过晓冰 牛北方 陆忠华关键词:皮肤病 高可用弹性宏基因组学计算平台 被引量:1 2021年 下一代测序技术(Next Generation Sequencing,NGS)以其低成本、超高通量的特性,显著推动着宏基因组学的发展,同时也为领域内科研人员带来了巨大的挑战。随之而来的大规模、高复杂度测序数据,让研究人员在处理过程中面临诸多困难:一方面,大规模测序数据的分析消耗资源,如硬件资源、时间成本等;另一方面,计算分析过程中必然涉及到的大量宏基因组学计算分析工具很难由普通使用者自行部署、调试与维护。文中对比了领域内主流的宏基因组学计算平台,综合分析了各平台主要的优势与不足;进一步结合当前有效的计算服务技术,构建完成了一个专注于宏基因组学计算分析的高可用弹性宏基因组学计算平台MWS-MGA(More than a Web Service for Metagenomic Analysis);并通过提供多种交互接入方式以及丰富灵活的计算工具,较大程度地降低了科研人员进行宏基因组学NGS数据分析的科研门槛。 何志鹏 李瑞琳 牛北方关键词:宏基因组学 高可用