谢民主
- 作品数:21 被引量:36H指数:2
- 供职机构:湖南师范大学物理与信息科学学院更多>>
- 发文基金:国家自然科学基金湖南省教育厅科研基金湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学医药卫生建筑科学更多>>
- 单体型组装问题计算模型的比较与分析被引量:1
- 2008年
- 单体型检测在遗传病基因的定位、药理反应的研究、个体识别等方面有极其广阔的应用前景。单体型组装问题指如何利用个体的基因测序片断数据,根据不同的优化准则确定该个体单体型的计算问题。对MSR,MFR,MEC,WMLF,MEC/GI等单体型组装模型做了详细的分析比较,得出了如下结论:在没有引入测序误差情况下,上述模型的重构精度基本一致。随着测序误差的增加,MEC/GI模型的容错性最好,重构精度最高;MSR模型受测序误差的影响最大,只适用于测序误差极小的情形。
- 周伟王建新谢民主陈建二
- 关键词:单核苷酸多态性基因型单体型NP难问题
- 复杂疾病模型快速参数求解算法被引量:1
- 2012年
- 全基因组关联研究(GWAS)是在探究人类复杂疾病相关基因的重要方法,实用有效的算法是GWAS成功的关键,因此根据疾病模型生成模拟数据对GWAS算法进行比较测试具有重要的意义。模拟测试要求根据各种输入的控制量计算出疾病模型的相关参数,但是目前缺乏相关公开的算法。提出了一个求解这些参数的分支限界算法。大量实验测试表明该算法能快速精确地计算出疾病模型的相关参数,可用于搭建GWAS算法测试平台。
- 谢民主杨洋
- 关键词:发病率
- N阶魔方阵的算法被引量:1
- 2002年
- 本文首先介绍了魔方阵的概念及其奇数阶的解法 ,进而提出了偶数阶魔方阵的一种算法 ,并给出了
- 蒋外文谢民主
- 关键词:偶数阶C++语言程序设计
- 机器学习方法在基因交互作用探测中的研究进展被引量:2
- 2018年
- 复杂疾病是基因与基因、基因与环境交互作用的结果,高维基因交互作用的探测给计算带来了极大的挑战。在过去20年间,机器学习方法被用于探测基因-基因交互作用,并取得了一定的效果。本文综述了机器学习方法在基因交互作用探测中的研究进展,系统地介绍了神经网络(neural networks,NN)、随机森林(random forest,RF)、支持向量机(support vector machines,SVM)和多因子降维法(multifactor dimensionality reduction,MDR)等机器学习方法在全基因组关联研究(genome wide association study,GWAS)中探测基因交互作用的原理和局限性,并对未来的研究进行了展望。
- 彭哲也唐紫珺谢民主赵方庆
- 关键词:全基因组关联分析单核苷酸多态性上位性
- 一种基于Stirling图枚举算法的分球入盒问题求解
- 2017年
- 已有的分球入盒问题解法通常只关注分球的总方案数,目前尚没有公开的计算机算法来枚举出所有具体的分球方案,而方案的枚举是生物信息学中一些分区优化算法的基础。受第二类Stirling数的递推公式的启发,提出一个新的数据结构——Stirling图。在此基础上设计一个算法来枚举p个不同球分配到q个相同盒子里的所有不同的方案。当p和q较大,枚举出所有的方案不可行时,设计另一个算法在整个方案空间实现均匀采样,输出指定个数的方案。测试结果表明,这些算法在内存为8 GB的普通PC上可在合理的时间内枚举出上百万组不同的方案。
- 彭哲也谢民主
- 关键词:第二类STIRLING数
- 单体型组装MEC问题的参数化算法研究被引量:2
- 2007年
- 单体型组装MEC问题指如何利用个体的DNA测序片断数据,翻转最少的SNP位点值以确定该个体单体型的计算问题。根据片段数据的特点提出了一个时间复杂度为O(nk22k2+mlogm+mk1)的参数化算法,其中m为片段数,n为单体型的SNP位点数,k1为一个片断覆盖的最大SNP位点数(通常小于10),k2为覆盖同一SNP位点的片段的最大数(通常不大于10)。对于实际DNA测序中的片段数据,即使m和n都相当大,该算法也可以在较短的时间得到MEC问题的精确解,具有良好的可扩展性和较高的实用价值。
- 谢民主王建新陈建二
- 关键词:生物信息学参数化算法单核苷酸多态性
- 负荷预测多维数据模型及实视图研究
- 本论文根据电力负荷预测系统的历史数据集的特点及各种预测方法、OLAP及数据挖掘的对数据源的需求,研究了多维数据建模及实视图维护的理论,以增强数据源独立性、可维护性和提高联机分析处理和数据挖掘的效率.本文分为五个部分.第一...
- 谢民主
- 关键词:负荷预测数据仓库多维数据模型实视图OLAP数据挖掘
- 文献传递
- 分布式数据源的实视图维护算法研究被引量:2
- 2005年
- 数据仓库作为决策支持系统的集成化数据中心,其数据可以认为是定义在多个不同数据源的实视图集。近年来数据仓库中实视图维护算法的研究激起很多学者的重视。当多个独立的数据源出现并发更新时传统的实视图维护算法可能导致视图维护异常,本文提出了一个双向扫描并行处理实视图维护(BSP)算法,能确保实视图与数据源的完全一致性,并通过实验与其它类似的算法进行了比较,说明本算法具有较高的效率。
- 谢民主伍祥生
- 关键词:数据仓库实视图维护
- 单体型组装问题参数化建模及算法研究
- 分析和识别单体型对复杂疾病致病基因的精确定位有重要作用。单体型组装问题是利用个体DNA测序片段数据推出该个体一对单体型的计算问题。根据不同的优化准则,单体型组装问题有MSR、MFR、MEC和MEC/GI等计算模型。单体型...
- 谢民主
- 关键词:参数化建模致病基因
- 文献传递
- 两位点疾病模型的快速参数求解算法
- 2012年
- 生成模拟数据对全基因组关联分析(GWAS)算法进行测试时,要求按单位点边缘效应大小计算出疾病模型的相关参数,而目前缺乏对应的公开算法。为此,基于二分搜索提出一个数值算法,根据单位点边缘效应和人群疾病发病率计算出3个典型的两位点疾病模型的控制参数。实验结果表明,该算法能快速精确地进行疾病模型参数求解,便于对GWAS算法进行大规模模拟测试。
- 谢民主刘新求杨洋
- 关键词:单核苷酸多态性发病概率全基因组关联分析二分搜索