左晓宇 作品数:8 被引量:10 H指数:2 供职机构: 中山大学公共卫生学院 更多>> 发文基金: 广东省科技计划工业攻关项目 国家自然科学基金 广东省自然科学基金 更多>> 相关领域: 生物学 医药卫生 农业科学 自动化与计算机技术 更多>>
基于知识学习的冠心病风险功能模块挖掘方法研究 2013年 目的发展基于先验知识策略挖掘冠心病风险功能模块的网络分析方法。方法通过蛋白-蛋白互作知识引导扩展冠心病风险基因,构建冠心病特异性基因网络。应用Newman谱算法分解网络获取其中的高度模块化的网络模块(子网),并对各模块进行网络拓扑性质评价和功能富集分析。结果应用266个冠心病易感基因作为种子基因,由蛋白-蛋白互作知识引导构建了冠心病特异性网络,其中包含1819个基因和9767个互作对。应用谱分解法提取了14个模块,其中多数符合无标度网络特性。功能富集分析发现这些模块参与系列已知的冠心病风险生物学通路以及一些新的冠心病风险通路。结论应用表明本文提出的知识学习方法是一种识别复杂疾病风险功能模块的有效方法。 李豪丽 左晓宇 欧阳平 林美华 赵忠 梁岩 钟寿强 饶绍奇关键词:数据挖掘 冠心病 基于全基因组SNP数据的冠心病易感通路识别及功能模块挖掘 背景与目的:冠心病是一种复杂疾病,其遗传机制涉及众多基因的叠加作用和非线性互作.全基因组单核苷酸多态性(SNP)数据为全面解析复杂疾病的多基因互作以及致病分子通路提供了机遇.本研究旨在发展和利用新颖的通路分析方法,通过对... 栾奕昭 覃继恒 左晓宇 饶绍奇基于数据采矿的基因互作分析软件的研发 背景与目的:基因互作分析是多基因复杂疾病遗传学研究的一项重要内容.本研究旨在整合我们团队近年来在该领域的方法学研究成果,研发基于全基因组SNP数据的基因互作及下游生物信息学分析软件,以期为当代复杂疾病大型遗传学数据分析提... 覃继恒 左晓宇 栾奕昭 林美华 饶绍奇基于分治法的海量生物数据处理的研究与应用 被引量:1 2014年 海量生物数据的不断涌现,在数据处理方面所面临的诸多问题亟待解决,例如在算法设计上会存在内存读写溢出和算法效率低下等问题;本文提出了一种基于分治法进行海量生物数据处理的方法。首先对计算机可用的内存资源进行评估,并对处理数据过程中产生的内存读写开销进行计算,进而与面向对象设计相结合,基于分治法对存储于mysql中的WTCCC数据库数据进行分块,最终将数据处理成可以被Plink软件识别的标准数据。 覃继恒 赵小蕾 左晓宇 林美华 栾奕昭 饶绍奇关键词:生物数据 分治法 面向对象设计 数据库数据 内存资源 基于单核苷酸多态性的基因互作分析方法学进展 被引量:5 2013年 基于单核苷酸多态性的关联分析已成为当前解析人类常见复杂疾病遗传机制的重要手段之一,然而,目前普遍使用的单位点分析策略仅能发现部分单独效应显著的易感SNP位点,因此遗漏了重要的遗传力组分——基因上位效应或联合效应。识别全基因组多基因间复杂的互作关系已成为全面解析复杂疾病致病分子机制必不可少的一项任务。已有很多方法被应用于全基因组交互作用分析,加深了人类对复杂疾病遗传机制的进一步认识。基于各类方法的理论基础及算法的异同,文章对目前应用较为广泛的基于遗传互作模型的方法、不基于互作模型的方法和数据挖掘类算法3类方法进行了系统地评述,着重介绍了这些方法的主要思想、实现过程及应用中的注意事项等,并指出开展大规模全基因组范围互作检测面临的问题,以期能为相关领域的研究者提供方法学参考。 栾奕昭 左晓宇 刘轲 李谷 饶绍奇关键词:SNP 基因互作 数据挖掘算法 DNA修复基因和EB病毒的交互作用与鼻咽癌易感性初步研究 被引量:2 2011年 【目的】探讨在鼻咽癌群体中DNA修复基因与EB病毒的交互作用。【方法】选取广东地区以广东话为主要语言的人群建立匹配的鼻咽癌病例和健康对照(病例/对照=755/755),收集其临床流行病学资料、采集外周血样并进行EB病毒抗体检测和SNP基因型分型。利用决策森林方法,分析DNA修复通路104个基因中768个SNP位点和EB病毒在鼻咽癌中的交互作用。【结果】MDC1、ATM、GTF2H4、MLH1、RAD51L1、XPC、GTF2H1与EB病毒的交互作用达到Bonferroni多重检验校正的显著性水准(0.05),P值皆<0.001;其鼻咽癌患病风险比OR(95%CI)分别为15.97(4.17~61.11)、11.32(7.22~25.45)、15.94(4.17~64.01)、5.38(4.88~6.74)、151.47(53.79~380.39)、40.92(15.09~112.67)和142.38(53.38~377.5)。进一步生物信息学基因网络分析表明,这些基因可能通过影响EB病毒DNA复制过程等多种直接或间接的方式,改变广东人群鼻咽癌的易感性。【结论】EB病毒与修复基因的交互作用可能是鼻咽癌的另一重要的易感性机制。 苏伟扬 黄珂 左晓宇 郝元涛 贾卫华 饶绍奇关键词:鼻咽癌 DNA修复基因 EB病毒 易感性 决策树集成法中轴型脊柱关节病基因表达谱的疾病相关基因 廖泽涛 古洁若 左晓宇 苏伟扬 饶绍奇 余得恩基于蛋白质互作知识的生物学通路扩充新方法 被引量:2 2014年 生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质?蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质?蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质?蛋白质互作信息进行预测。结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。 赵小蕾 左晓宇 覃继恒 梁岩 张乃尊 栾奕昭 饶绍奇关键词:基因本体论