林丽娟
- 作品数:3 被引量:37H指数:3
- 供职机构:南京医科大学公共卫生学院生物统计学系更多>>
- 发文基金:国家自然科学基金江苏省临床医学科技专项更多>>
- 相关领域:医药卫生理学更多>>
- 多组学联合缺失数据填补方法的评价被引量:6
- 2017年
- 目的本研究旨在评价不同平台间"块缺失"数据的填补方法。如何在保证方差-协方差结构相对稳定的前提下提高多组学数据填补的精确度,对于后期数据挖掘有重要的意义。方法利用癌症基因组图谱(TCGA)数据库的肺癌数据(甲基化数据、基因表达数据),构建不同缺失比例的数据集(缺失比例分别为5%、20%、35%、50%和65%)。采用统计学填补方法均值法,马尔科夫蒙特卡洛法(MCMC)和机器学习填补法[邻近法(kNN),随机森林法(RF),多层感知机法(MLP)]对缺失数据进行填补,填补后数据集与原数据集进行比较。评价指标包括估计偏差和矩阵-2-范数。根据评价指标和填补时间,比较出填补效果最优、填补时间较短的方法。结果 MLP和kNN算法在各种缺失比例下均比其他填补方法有更优的效果,填补时间也相对较短。均值法的时间最短,在数据集缺失比例较小时(≤5%),填补效果与其他填补方法相当,但在高比例缺失情况下表现较差。在数据集高比例缺失情况下,RF和MCMC的填补效果优于均值法,但填补时间过长,不适用于实际工作。结论综合比较,机器学习填补方法中的MLP和kNN两法适合于甲基化数据和表达数据的填补。
- 董学思林丽娟赵杨魏永越戴俊程陈峰
- 年龄因素对脑梗死患者急性期神经功能和日常生活活动能力恢复的影响被引量:27
- 2015年
- 目的:比较不同年龄组脑梗死患者急性期神经功能及日常生活活动能力恢复的差异。方法:2012—2014年住院介入康复治疗的脑卒中急性期患者126例,根据年龄分为4组:A组(≤54岁)、B组(55—64岁)、C组(65—74岁)、D组(75岁及以上),于康复治疗前和出院时,分别采用美国国立卫生院脑卒中量表(NIHSS)、Barthel指数(BI)对各年龄组患者的神经功能缺损水平、日常活动能力进行评定和分析。结果:D组患者康复治疗前后BI差值显著低于B组(P<0.05),相关分析显示BI差值跟年龄呈线性负相关(P<0.05,相关系数r=-0.212);D组出院时NIHSS评分(NIHSS1)显著低于B、C组(P<0.05),BI日均改善率(|BI1-BI0|/介入时程)显著低于A、B组(P<0.05)。结论:年龄是影响脑梗死患者神经功能和日常生活能力恢复的重要因素,75岁以上高龄患者其功能恢复程度和速度均降低,而低于75岁者脑梗死急性期其神经功能和日常活动能力恢复无显著差异。
- 夏楠王红星任彩丽彭志行林丽娟励建安
- 关键词:年龄因素脑梗死急性期康复神经功能日常活动能力
- 三种块缺失数据处理方法的比较被引量:6
- 2017年
- 跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,则块缺失(block missing)是不可避免的。由于块缺失的缺失比例比较高,如果将含有缺失的观测全部剔除,仅对完整数据进行分析,则会损失大量信息,甚至无信息可用。
- 林丽娟董学思赵杨魏永越戴俊程陈峰
- 关键词:缺失数据蛋白组学代谢组学基因组学MISSING