您的位置: 专家智库 > >

王杰

作品数:15 被引量:63H指数:5
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金山西省回国留学人员科研经费资助项目山西省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 15篇中文期刊文章

领域

  • 15篇自动化与计算...

主题

  • 9篇网络
  • 6篇聚类
  • 5篇复杂网
  • 5篇复杂网络
  • 3篇蛋白
  • 3篇蛋白质
  • 3篇白质
  • 2篇蛋白质复合体
  • 2篇软聚类
  • 2篇向量
  • 2篇模块性
  • 2篇复合体
  • 2篇半监督学习
  • 2篇簇结构
  • 1篇蛋白质复合物
  • 1篇学习算法
  • 1篇样本点
  • 1篇一致性
  • 1篇遗传算法
  • 1篇正则

机构

  • 15篇山西大学
  • 1篇教育部

作者

  • 15篇王杰
  • 8篇郑文萍
  • 7篇梁吉业
  • 3篇王素格
  • 3篇李德玉
  • 2篇钱宇华
  • 2篇刘全明
  • 1篇赵兴旺
  • 1篇杨贵
  • 1篇张鹏
  • 1篇宋云胜
  • 1篇王杰
  • 1篇张浩杰
  • 1篇廖健
  • 1篇王丹

传媒

  • 3篇计算机科学与...
  • 2篇计算机研究与...
  • 2篇计算机科学
  • 1篇中国科学技术...
  • 1篇模式识别与人...
  • 1篇计算机学报
  • 1篇小型微型计算...
  • 1篇郑州大学学报...
  • 1篇山东大学学报...
  • 1篇智能系统学报
  • 1篇大数据

年份

  • 1篇2023
  • 1篇2022
  • 2篇2020
  • 2篇2019
  • 3篇2018
  • 2篇2017
  • 3篇2016
  • 1篇2015
15 条 记 录,以下是 1-10
排序方式:
基于数据划分的k-近邻分类加速算法机理分析被引量:1
2018年
k-近邻(k NN)分类算法因具有不对数据分布做任何假设、操作简单且泛化性能较强的特点,在人脸识别、文本分类、情感分析等领域被广泛使用.k NN分类算法不需要训练过程,其简单存储训练实例并根据测试实例与存储的训练实例进行相似度比较来预测分类.由于k NN分类算法需要计算测试实例与所有训练实例之间的相似度,故难以高效地处理大规模数据.为此提出将寻找近邻的过程转化为一个优化问题,并给出了原始优化问题与使用数据划分优化问题的最优解下目标函数差异的估计.通过对此估计的理论分析表明,聚类划分可以有效的减小此差异,进而保证基于聚类的k-近邻分类(DC-k NN)算法具有较强的泛化性能.在公开数据集的实验结果显示,DC-k NN分类算法在很大程度上为测试实例提供了与原始k NN分类算法相同的k个近邻进而获得较高的分类精度.
宋云胜王杰梁吉业
关键词:K-近邻数据划分局部信息聚类
面向复杂网络的节点相似性度量被引量:2
2020年
在复杂网络中,度量节点之间的相似性是一项基础且具有挑战性的工作。基于邻域节点的相似性度量仅考虑了节点的邻域信息。基于路径的相似性度量考虑了节点之间的路径信息,使得多数节点与大度节点相似。为了更准确地度量节点之间的相似性且避免多数节点与大度节点相似,定义了每个节点的距离分布,并在此基础上采用相对熵和距离分布提出了一种节点相似性度量方法(DDRE)。DDRE方法通过节点之间的最短路径生成每个节点的距离分布,根据距离分布计算节点之间的相对熵,进而得到节点之间的相似性。6个真实网络数据集的对比实验结果表明,DDRE方法在对称性以及SIR模型中影响其他节点的能力这两方面表现较好。
穆俊芳梁吉业郑文萍刘韶倩王杰
关键词:复杂网络相对熵
一种基于节点间路径度量的图聚类算法被引量:5
2020年
图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似性指标.以此为基础提出了一种面向复杂网络的基于“中心-扩展”策略的图聚类算法(A Graph Clustering Algorithm Based on Local Paths between Nodes in Complex Networks,PGC),包括节点相似性计算、中心节点选择、初始簇划分和簇优化四个主要过程.采用点不重复路径对节点相似性进行度量,消除了由大度节点引起较多的点重复路径对节点相似性的影响,提高了算法对大度节点邻域中节点的划分能力.通过与一些经典算法在11个真实网络、22个人工网络数据集上的实验比较分析,结果表明算法PGC在标准互信息、调整兰德系数、F度量、准确度等方面均表现出良好的性能.
郑文萍车晨浩钱宇华钱宇华杨贵
关键词:复杂网络簇结构连通性
基于稠密子图的社区发现算法被引量:4
2016年
基于密度的图聚类算法在社区发现中得到了广泛应用,然而由于其通过搜索网络中局部稠密子图来识别社区,使得大量结点因不能构成稠密子图而未被聚类。针对此问题,给出了一种基于稠密子图的软聚类算法(community detection based dense subgraphs,BDSG)。首先给出一种中心社区发现方法;进而定义了一种结点的社区归属度,并给出中心社区扩展策略;最终得到聚类结果。通过与CPM(clique percolation method)、k-dense算法在空手道俱乐部、海豚社交网络、大学生足球网络、电子邮件网络和合作网络等数据进行比较,表明BDSG算法在模块性指标与时间效率方面体现了良好性能,同时中心社区扩展策略能在一定程度上提高CPM、k-dense等基于密度算法的聚类有效性。
郑文萍张浩杰王杰
关键词:复杂网络软聚类模块性
基于遗传算法的蛋白质复合物识别算法被引量:8
2018年
蛋白质互作用网络是一种典型的复杂网络,呈现了明显的社区结构。网络中的社区对应于功能模块,通常被看作蛋白质复合物。蛋白质复合物识别对预测蛋白质功能,解释特定生物进程具有重要作用。基于种子节点扩展的图聚类方法在蛋白质复合物识别中应用广泛。针对此类算法最终结果受种子节点的影响较大,并且在簇的形成过程中搜索空间有限等问题,提出了一种基于遗传算法的蛋白质复合物识别算法GAGC(genetic algorithm based graph clustering),其中个体表示聚类结果(类别之间可能存在重叠节点),以F-measure值作为种群进化的目标函数。算法采用IPCA(improvement development clustering algorithm)算法产生初始种群;针对初始种群,设计了染色体对齐方式以进行交叉操作产生下一代种群。通过与DPClus、MCODE、IPCA、Cluster One、HC-PIN、CFinder等经典算法的对比实验表明,GAGC算法能够扩大图聚类算法的搜索空间,提高解的多样性,进而提高蛋白质复合物检测的性能。
郑文萍李晋玉王杰
关键词:遗传算法蛋白质复合物
一种基于标签传播的两阶段社区发现算法被引量:12
2018年
针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detectionalgorithm based on label propagation,LPA-TS),通过参与系数确定节点更新顺序,并在标签传播过程中依据节点间相似性更新节点标签,得到初始社区划分.将社区看作节点,社区间连边数作为边权重,得到社区关系网络.按照参与系数由低到高的顺序合并社区关系网络中的节点,得到最终社区划分结果.算法LPA-TS减少了传统LPA方法在节点更新和标签传播过程的随机性;在第2阶段,将不符合弱社区定义的初始社区与连边最多的相邻社区合并,再按照社区参与系数由低到高的顺序合并初始社区提升社区发现质量.通过与一些经典算法在8个真实网络及不同参数下LFR benchmark人工网络数据集上的实验比较表明LPA-TS算法表现了良好的稳定性,在NMI、ARI、模块性等方面表现良好.
郑文萍郑文萍钱宇华王杰
关键词:复杂网络
面向非平衡文本情感分类的TSF特征选择方法被引量:6
2016年
非平衡数据中样本数量的不平衡分布往往伴随着特征分布的不平衡,在多数类文本中经常出现的特征,在少数类中却很少出现。针对非平衡数据特征分布的特点,提出了一种新的双边fisher特征选择算法TSF。该方法通过显式地组合正相关和负相关特征,缓解了特征层面的非平衡性,较好地表示了文本的信息。TSF方法在图书评论和COAE2014微博非平衡数据上进行实验,结果验证了该方法是可行的。
王杰李德玉王素格
关键词:文本情感分类
基于增强字向量的微博观点句情感极性分类方法被引量:5
2017年
针对微博观点句识别及情感极性分类任务,提出了基于增强字向量的微博观点句情感极性分类方法.使用单字作为句子表示的基本单元,同时在单字中嵌入了该字所在的词信息以及该词的词性信息,以此训练得到字向量替代传统的词向量融合的句子表示方法.使用基于K-means的方法对向量化的句子进行情感判别,仅需要对文本进行分词和词性标注,无需额外的语言学资源.在COAE2015任务2的微博句子数据集上进行测试,取得了较好的结果.
廖健王素格李德玉王杰
融合一致性正则与流形正则的半监督深度学习算法被引量:3
2022年
半监督学习已被广泛应用于大数据分析。目前,基于一致性正则的方法是半监督深度学习的研究热点之一。然而这类方法没有考虑数据的流形结构,可能会导致部分相近的样本得到差异很大的输出,进而导致分类器性能下降。针对这个问题,提出了一种融合一致性正则与流形正则的半监督深度学习算法。该算法在对模型施加一致性约束的同时,对样本构图并加入平滑性损失,实现了每个样本点局部邻域的平滑以及邻近(相连)样本点之间的平滑,从而提高半监督深度学习算法的泛化性能。在多个图像和文本数据集上的实验结果表明,与其他的半监督深度学习算法相比,所提算法更有效。
王杰王杰梁吉业
基于模块性的检测簇结构的图聚类算法研究被引量:2
2016年
从大规模的复杂网络中挖掘重要的簇结构已经成为当今研究的热点之一.对复杂网络中基于密度和模块性的图聚类算法中的边权重定义、种子选择与扩展等问题进行了研究,提出一种检测复杂网络中稠密簇结构的局部模块性图聚类算法LM C.算法首先对网络中的边权重和子图的模块性进行定义,然后选择权重最大的边作为聚类"种子边",最后对种子边进行扩展进而得到新簇.采用计算机构造数据和蛋白质作用网络数据对基于局部模块性的图聚类算法LMC进行实验.结果表明,算法LMC相较于其它聚类算法在检测复杂网络中相对稠密的簇结构的性能较好.
郑文萍王丹王杰
关键词:复杂网络模块性
共2页<12>
聚类工具0