杨凯 作品数:4 被引量:11 H指数:2 供职机构: 哈尔滨医科大学 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 医药卫生 更多>>
DiffRank-RF差异网络分析方法的研究与应用 2019年 差异表达分析常被用于各种疾病标志物的筛选研究中,如传统的t检验、显著性分析(significance of microarrays,SAM)检验、偏最小二乘(pa least square,PLS)等方法。然而,这些方法主要是通过比较不同分组之间基因表达均值的差异筛选标记物,忽视了物质之间的相互调控关系,致使研究结果不够稳定或检验效率低。在组学研究中,由于基因调控和蛋白质的互相作用,很有可能在表达量上还没有呈现出明显差别时. 蔡雨晴 李轶群 徐欢 宋微 杨凯 王文杰 李康关键词:偏最小二乘 疾病标志物 网络分析方法 差异表达分析 T检验 MICROARRAY 基于随机森林回归的网络构建方法及应用 被引量:8 2015年 目的探讨基于随机森林(RF)回归估计因果关系网络的效果。方法通过模拟实验设定因果关系网络,对数据标准化后,利用全条件RF回归对其进行估计并评价其准确性。另外将该方法用于卵巢癌基因表达谱数据,并对分析结果进行验证。结果模拟实验结果表明RF回归对于预先设定网络关系的识别能力明显优于贝叶斯网络方法。当选择合适的阈值时,随着样本含量的增加基于随机森林回归方法构建的网络准确性不断提高,但传统经典的贝叶斯方法效果基本保持不变;实例分析结果验证,基于RF回归方法能够得到与现有数据库的网络结构。结论应用基于RF回归方法估计的网络,能够在样本量较少的情况下得出准确度较高的网络。 侯艳 杨凯 李康关键词:调控网络 贝叶斯网络 肺心病红细胞免疫功能的动态观察 杨凯条件推断森林在高维组学数据分析中的应用 被引量:3 2016年 目的探讨条件推断森林(CIF)在自变量相关情况下变量筛选和分类研究中的应用。方法通过模拟实验和实例比较RF和CIF的变量筛选和分类,并通过变量重要性评分和OOB错误率进行评价。结果模拟实验表明,在自变量相关的情况下,CIF的变量筛选结果明显优于RF的变量筛选结果;实例数据分析结果表明,CIF筛选出变量的OOB错误率低于RF。结论 CIF适用于变量相关的情况,具有实用价值。 杨凯 侯艳 李康