王黎黎
- 作品数:3 被引量:17H指数:2
- 供职机构:南京航空航天大学计算机科学与技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于RNA-seq数据的差异基因和异构体检测被引量:2
- 2016年
- 基因和异构体表达水平的差异检测是获取基因和异构体功能的重要途径,目前差异检测已经是转录组研究中一个重要的研究方向.RNA-seq技术近年来被广泛用于差异基因的检测.为模拟读段的非均匀分布,通常采用负二项分布对读段计数进行建模.现存的负二项分布模型大都是直接对基因读段计数进行建模,不能进行差异异构体检测.提出基于PGseq模型计算出的基因和异构体表达水平的负二项分布模型,采用exact test方法进行差异分析,解决了异构体的差异检测的问题.经实验验证,该方法在基因和异构体两方面的差异检测中都具有较高的准确度和灵敏度.
- 王黎黎刘学军张礼
- 关键词:RNA-SEQ差异基因负二项分布EXACTTEST
- 基于模型选择的差异基因和异构体检测被引量:2
- 2016年
- 基因和异构体差异表达分析是获取基因和异构体功能的重要途径,现已成为生物信息学的一个重要领域。RNA-seq是一种高通量测序技术,近年来广泛用于转录组研究。RNA-seq数据的读段多源映射现象给差异异构体检测带来挑战。针对该问题,本文采用先计算基因和异构体的表达水平,再进行差异分析的方法,以计算表达水平的PGseq模型为基础,采用贝叶斯因子方法进行模型选择,提出一个新的差异检测方法 PG_bayes,解决了基因和异构体两方面的差异检测问题。将PG_bayes应用于人类和小鼠共4个真实数据集中,并与目前流行的差异检测方法进行对比。实验结果表明,PG_bayes方法在差异基因和差异异构体检测中具有较高的准确度和灵敏度,并且在差异异构体检测方面表现出优势。
- 王黎黎刘学军张礼
- 关键词:RNA-SEQ贝叶斯因子
- 决策树C4.5算法在成绩分析中的应用被引量:13
- 2014年
- 对学生的成绩进行分析并找出影响成绩的主要因素和规则,有利于科学指导学生的学习.介绍了一种以决策树C4.5算法为基础的学生成绩分析方法并以考研英语成绩分析为例,进行属性选择、构建数据集、数据预处理并建立模型,以提取影响考研英语成绩的主要因素和规则.实验表明,该模型有较好的交叉验证率和正确预测率,用此方法对学生成绩进行分析是合理的.
- 王黎黎刘学军
- 关键词:决策树C4.5算法影响因素