尚学群
- 作品数:34 被引量:97H指数:5
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理医药卫生更多>>
- 从基因芯片数据快速有效地挖掘共调控基因
- 2010年
- 针对基因芯片数据高噪音、列(基因)数比行(实验条件)数多几个数量级的特殊性,为了进一步提高从基因芯片数据挖掘共调控基因的时间效率和挖掘结果的有效性,首先根据所有两两基因对之间的Pearson相关系数对原始完整数据集进行分组,然后使用列(基因)枚举方法对各组数据分别进行闭合频繁模式挖掘,并对活化和抑制共调控关系的挖掘分别进行处理。实验结果证明:算法快速有效地挖掘出了两种共调控基因。
- 赵倩尚学群
- 关键词:基因芯片数据
- 基于不确定PPI网络的功能模块挖掘
- 2011年
- 近年来,挖掘具有生物学意义的功能模块,吸引了很多人的关注。但是,生物信息学中的蛋白质交互(PPI)网络和其他的一些生物数据常常会由于实验检测方法的局限性而呈现出不确定性。以具有不确定性的PPI数据为研究对象,挖掘蛋白质复合物。引入了一些新概念,并给出了一个深度优先算法。使用MIPS数据库评估实验结果表明,该算法在精确度和覆盖率两个方面性能优良。在基因拓扑上分析实验结果证实了所得到的大多数蛋白质复合物具有很高的相似性。最后也对算法的可扩展性进行了验证。总之,可以有效地从不确定PPI网络中挖掘出功能模块。
- 孟雅尚学群缪苗王淼
- 关键词:功能模块相关度
- 面向金融风险预测的时序图神经网络综述被引量:1
- 2024年
- 金融风险预测在金融市场监管和金融投资中扮演重要角色,近年来已成为人工智能和金融科技领域的热门研究主题.由于金融事件的实体之间存在复杂的投资、供应等关系,现有的金融风险预测研究常利用各种静态和动态的图结构来建模金融实体间的关系,并通过卷积图神经网络等方法将相关的图结构信息嵌入金融实体的特征表示中,使其能够同时表征金融风险相关的语义和结构信息.然而,以前的金融风险预测综述仅关注了基于静态图结构的研究,这些研究忽视了金融事件中实体间关系会随时间动态变化的特性,降低了风险预测结果的准确性.随着时序图神经网络的发展,越来越多的研究开始关注基于动态图结构的金融风险预测,对这些研究进行系统、全面的回顾有助于学习者构建面向金融风险预测研究的完整认知.根据从动态图中提取时序信息的不同途径,首先综述3类不同的时序图神经网络模型.然后,根据不同的图学习任务,分类介绍股价趋势风险预测,贷款违约风险预测,欺诈交易风险预测,以及洗钱和逃税风险预测共4个领域的金融风险预测研究.最后,总结现有时序图神经网络模型在金融风险预测方面遇到的难题和挑战,并展望未来研究的潜在方向.
- 宋凌云马卓源李战怀尚学群
- 关键词:贷款违约风险
- 临界布尔网络的函数泛化问题研究
- 2015年
- 布尔网络是研究基因调控网络的一种非常重要的模型,通过时序数据推理基因之间的调控关系是研究网络动态行为和干预策略的基础.现有的预测研究主要集中在基因之间的调控关系,而对调控基因与目标基因之间的布尔函数的作用方式研究甚少.由于基因调控网络是一种处于有序和无序之间的临界网络,本文研究了众数规则、基于偏斜和基于互信息的三种泛化方法对临界布尔网络的稳态分布距离和灵敏度误差的影响.结果表明合理的泛化能够明显提高预测网络的稳态分布距离和灵敏度误差指标.三种泛化方法中,基于互信息的泛化方法的总体性能最好.
- 于雄香沈良忠尚学群刘文斌
- 关键词:基因调控网络泛化
- 个性化学习路径推荐综述被引量:16
- 2022年
- 近年来,伴随着现代信息技术的迅猛发展,以人工智能为代表的新兴技术在教育领域得到了广泛应用,引发了学习理念和方式的深刻变革.在这种大背景下,在线学习超越了时空的限制,为学习者“随时随地”学习提供了更多的可能性,从而得到了蓬勃发展.然而,在线学习中师生时间、空间分离的特征,导致教师无法及时掌握学生的学习状态,一定程度上制约了在线学习中教学质量的提升.面对多元化的学习需求及海量学习资源,如何迅速完成学习目标、降低学习成本、合理分配学习资源等问题成为限制个人和时代发展的重大问题.然而,传统的“一刀切”的教育模式已经不能满足人们获取知识的需求了,需要一个更高效、更科学的个性化教育模式,以帮助学习者以最小的学习成本最大限度地完成学习目标.基于以上背景,如何自动高效识别学习者特征,高效地组织和分配学习资源,为每一位学习者规划个性化路径,成为面向个体的精准化教育资源匹配机制研究中亟待解决的问题.系统地综述并分析了当前个性化学习路径推荐的研究现状,并从多学科领域的角度分析了对于同一问题的不同研究思路,同时也归纳总结了当前研究中最为主流的核心推荐算法.最后,强调当前研究存在的主要不足之处.
- 云岳代欢张育培尚学群李战怀
- 关键词:人工智能个性化学习资源规划
- 基于蛋白质网络的模块动态特性挖掘研究被引量:1
- 2012年
- 目前对于蛋白质网络的多数分析方法都是基于静态网络框架提出的,然而,事实上蛋白质之间的相互作用关系是随着时间变化的,具有明显的动态特性。从动态角度出发,基于蛋白质交互网络,结合时间序列的基因表达数据,揭示蛋白质功能模块变化的动态特性,提出了一种动态网络的构建方法及在动态快照网络中挖掘功能模块的算法,采用模糊匹配的方法揭示了蛋白质功能模块的变化过程。实验证明,该方法能够有效地揭示蛋白质功能模块的动态变化特性。
- 郭阳尚学群李晶
- 关键词:蛋白质网络功能模块动态特性
- 一种基于蛋白质交互网络链接预测的新方法被引量:3
- 2012年
- 当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互信息(protein-protein interac-tion,PPI)还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的。近年来,对未知生物信息的挖掘和研究吸引了很多人的关注。通过实验检测方法来发现这些信息是非常耗时耗力的,所以链接预测成为一种新的挖掘这些信息的指导方法。基于蛋白质交互网络并融合了基因表达数据信息,从拓扑和基因表达两个方面的信息来构建PPI权值网络,提出了一种在权值网络中基于相似度比较的链接预测的新方法来预测PPI网络中未知的交互信息。使用MIPS数据库评估了实验结果,表明了该算法有很好的准确率和良好的性能。
- 李晶尚学群郭阳李晓园
- 关键词:链接预测剪枝
- 基于权值图的基因芯片数据差异双聚类挖掘算法被引量:2
- 2011年
- 研究了从基因芯片中挖掘差异双聚类的算法。差异双聚类中的基因在不同类别的数据中表达水准不同,这样的差异双聚类可以有效地找出影响基因表达水平的关键实验因素以及对实验条件敏感的基因。传统的双聚类方法采取分别在两类基因数据中找出聚类,再进行比较以得到最终的差异双聚类,该策略的时间效率不高。为了快速地找出差异双聚类,提出一个全新的基于权值图的差异双聚类方法,该方法的主要创新之处在于直接在由两类数据构成的权值图上挖掘双聚类,避免了分别挖掘再比较的步骤。实验结果证实该算法具有较高的运行效率。
- 刁静霓尚学群王淼缪苗
- 关键词:聚类子空间聚类
- 基因表达数据中局部模式的查询被引量:1
- 2016年
- 基因表达数据分析一般是通过挖掘局部模式来实现的。保序子矩阵是局部模式挖掘中一种经典的模型,可以获取到在若干条件下表现出一致趋势的一组基因。高通量基因微阵列技术的进步,促进了海量基因表达数据的产生,使得对高性能基因表达数据分析算法的需求极为迫切。现有方法大多数是通过批量挖掘的方法来分析数据,即使有通过查询方式来获取精确结果的方法,其全面性与性能也有待提高。为了提高数据分析的效率与准确性,首先提出一种基于前缀树的基因表达数据索引gIndex,然后给出了一种基于列关键词查询的保序子矩阵分析方法 GEQc。其不经过批量挖掘,只需要建立索引并通过关键词来完成正相关/负相关/时滞等模式的查询。实验结果表明,与现有方法相比,所提算法具有良好的数据分析效率与可扩展性。
- 姜涛李战怀尚学群陈伯林李卫榜
- 关键词:基因表达数据关键词查询
- 从基因表达数据中有效挖掘差异共表达双聚类——DiCluster算法被引量:1
- 2012年
- 双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法,它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析,从不同基因表达数据集中挖掘差异表达双聚类可以发现具有生物意义的转录因子等信息。因此,提出一种挖掘不同数据集上差异共表达双聚类的算法——DiCluster。该算法采用深度优先基因扩展方法,并引入了剪枝策略,有效挖掘最大差异表达双聚类。实验结果表明,DiCluster不仅比已有算法具有更高的效率,而且挖掘出的结果具有更好的统计学和生物学意义。
- 李晓园尚学群王淼
- 关键词:基因表达数据