辽宁省高等学校杰出青年学者成长计划(LJQ2012027)
- 作品数:31 被引量:181H指数:9
- 相关作者:邵良杉邱云飞温廷新林明明刘世兴更多>>
- 相关机构:辽宁工程技术大学更多>>
- 发文基金:辽宁省高等学校杰出青年学者成长计划国家自然科学基金辽宁省高校创新团队支持计划更多>>
- 相关领域:自动化与计算机技术环境科学与工程交通运输工程建筑科学更多>>
- 基于簇间距离自适应的软子空间聚类算法被引量:6
- 2016年
- 针对软子空间聚类过程中簇间距离(簇间的分离程度)对聚类的影响程度不确定的问题,提出了一种基于簇内紧密度和簇间距离自适应软子空间聚类算法。算法以经典的k均值聚类算法框架为基础,在最小化各个子空间簇类的簇内紧密度的同时最大化各个子空间簇类的簇间距离。并且通过推导得到新的子空间聚类中心和特征加权的计算方式,克服了软子空间聚类对输入参数敏感的缺点,实现了算法的自适应学习,并且取得了较好的聚类效果。
- 邱云飞狄龙娟
- 关键词:自适应性高维数据
- 基于二维坐标映射法的消费情感分类方法
- 2014年
- 针对中文消费评论的情感分类问题,构建了一种基于语料库的二维坐标映射法的情感分类方法。根据中文语言特点,首先提出了基于语料库的搜索方法,使搜索更有针对性;其次,定义了提取表达情感的中文短语的规则;第三,构造了某领域的最佳种子词选取算法;最后,构造了二维坐标映射算法,通过计算评论句子的坐标值,将其映射到二维直角坐标系中,判断句子的语义倾向性。选取亚马逊网站某商家1200条与牛奶相关的评论(好、差评各600条)进行实验,首先根据最佳种子词选取算法选取"很好-漏"作为最佳种子词,再根据二维坐标映射算法判断评论的情感极性,实验的平均F值达到了85%以上。实验结果表明该算法可以对消费评论进行情感分类。
- 林明明邱云飞邵良杉
- 关键词:中文情感分类语料库
- 遗传算法优化的GM(1,1)模型研究被引量:8
- 2015年
- 为提高GM(1,1)模型预测精度,文章分析了模型中背景值构造与预测结果误差的关系,并总结了背景值改进研究的相关成果。采用权值序列替换原模型背景值构造公式中的单一权值,建立了GA-GM(1,1)预测模型,利用遗传算法迭代寻优获得的一组最优权值序列来构造背景值,以提高模型精度。用两组数据进行GA-GM(1,1)模型与GM(1,1)模型的对比实验,结果表明GA-GM(1,1)具有更小的预测误差,验证了该模型的有效性。
- 邵良杉马寒温廷新张银玲
- 关键词:GM(1,1)模型背景值遗传算法权值
- 基于因子分析与Fisher判别分析法的隧洞围岩分类研究被引量:12
- 2015年
- 为快速有效地预测隧洞围岩的类别,提高地下工程的稳定性和安全性,应用因子分析与Fisher判别分析理论,选取岩石质量指标、完整性指标、饱和单轴抗压强度、纵波波速、弹性抗力系数和结构面摩擦因数等6个指标作为Fisher判别分析的判别因子。建立基于因子分析的隧洞围岩分类的Fisher预测模型。将现场勘测的30组隧洞围岩数据作为学习样本进行训练。利用回代估计法对模型效果进行检验,正确率为96.7%。将建立的判别模型应用于工程实例,以6组工程数据作为预测样本,进行隧洞围岩的分类预测,并与神经网络方法和Bayes方法进行对比。结果表明:因子分析可以有效提取围岩分类指标,去除冗余影响因素,基于因子分析的Fisher判别模型可有效地预测隧洞围岩的类别,所得预测结果的正确率为100%。
- 邵良杉徐波
- 关键词:隧道工程围岩分类
- 基于三维坐标的模糊量化情感分类方法
- 2016年
- 针对微博情感分类问题,构造了基于三维坐标的模糊量化情感分类算法,通过将情感模糊量化,对微博进行多情感分类。首先对情感模糊处理,将情感分为六大类,根据六大类,定义并计算句子的模糊情感;其次将情感量化处理,根据情感类别构造三维坐标模型,将模糊情感值作为句子的坐标,通过坐标将句子映射到三维坐标模型中,使其量化;最后通过模糊量化处理后,根据与坐标轴的夹角判断句子最终的情感分类。通过实验,对三个作者的微博进行模糊量化处理,对其情感分类,实验结果的F值达到85%以上,同时与三种经典算法进行对比实验,准确率有了明显的提高。
- 林明明邱云飞邵良杉
- 关键词:情感分类
- 煤层底板突水危险性的PNN预测模型研究及应用被引量:16
- 2015年
- 为准确有效地预测煤层底板突水的危险性,在分析大量观测实例数据的基础上,选取底板含水层水压、煤层采高、隔水层厚度、断层落差、煤层倾角和断层距工作面距离等6项指标作为影响煤层底板突水的初始特征指标。针对指标之间具有相关性的问题,利用主成分分析(PCA)法提取6项特征指标的主成分,将其作为概率神经网络(PNN)的输入向量,建立基于PCA的煤层底板突水危险性的PNN预测模型。选取21组煤矿实测数据作为学习样本,用于训练模型。采用回代估计法对模型回检。利用学习好的模型,预测另外4组矿井突水数据样本。结果表明,该方法有效降低了指标数据相关性,实现了降维,使PNN模型工作复杂度减弱。将该模型应用于工程实例中,所得预测结果准确率为100%。
- 邵良杉徐波
- 关键词:底板突水危险性
- 结合语义改进的K-means短文本聚类算法被引量:14
- 2016年
- 针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集的最大频繁词集获取初始聚类中心,有效克服了K-means聚类算法对初始聚类中心敏感的缺点,解决了簇的理解性问题;通过结合TF-IDF值的语义相似度计算文档之间的相似度,避免了高维空间的运算。实验结果表明,从语义角度出发实现的短文本聚类算法优于传统的短文本聚类算法。
- 邱云飞赵彬林明明王伟
- 关键词:K-MEANS算法知网语义相似度
- 基于RF-ELM模型的边坡稳定性预测研究被引量:6
- 2015年
- 为实现对边坡稳定性的有效预测,将极限学习机算法与旋转森林算法相结合,并依据影响边坡稳定性的六项重要因素,建立了边坡稳定性预测的RF-ELM预测模型。该模型是以极限学习机算法为基分类器,以旋转森林算法为框架的集成学习模型,利用UCI数据库中三组数据集验证了该集成模型确实提高了ELM的预测性能。将RF-ELM模型应用于边坡稳定性的预测问题中,结合39组工程实例数据进行预测实验,结果表明该模型具有较高的预测精度,可有效的对边坡稳定性进行预测。
- 邵良杉马寒温廷新
- 关键词:边坡稳定性极限学习机分类器集成
- 极限学习机的分类器集成模型研究被引量:3
- 2016年
- 将极限学习机算法与旋转森林算法相结合,提出了以ELM算法为基分类器并以旋转森林算法为框架的RF-ELM集成学习模型。在8个数据集上进行了3组预测实验,根据实验结果讨论了ELM算法中隐含层神经元个数对预测结果的影响以及单个ELM模型预测结果不稳定的缺陷;将RF-ELM模型与单ELM模型和基于Bagging算法集成的ELM模型相比较,由稳定性和预测精度的两组对比实验的实验结果表明,对ELM的集成学习可以有效地提高ELM模型的性能,且RF-ELM模型较其他两个模型具有更好的稳定性和更高的准确率,验证了RF-ELM是一种有效的ELM集成学习模型。
- 邵良杉马寒温廷新
- 关键词:极限学习机分类器集成BAGGING算法
- 基于主题树的微博突发话题检测被引量:6
- 2014年
- 针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于潜在狄利克雷分配(LDA)模型的主题树检测方法。首先,运用自然语言处理(NLP)中增大信息熵的方法将相关微博整理成一棵主题树,配合狄利克雷先验α与经验值β随主题数目动态变化的设计思想,结合该模型独特的双重概率统计模式,实现了对文本中每个词"贡献度"的统计,提前处理掉干扰信息,排除垃圾数据对话题检测的影响;然后,利用该"贡献度"作为空间向量模型(VSM)改进后的参数值计算文档间相似度来提取突发话题,达到提高突发话题检测精准度的目的。提出的基于LDA模型的主题树检测方法从F值比对与人工检测两个角度进行了相关实验,实验数据显示该算法不仅可以检测到突发话题,而且获得的结果与知网模型和TF-IDF算法相比分别高出3%、7%,且更符合人的判断逻辑。
- 邱云飞郭弥纶邵良杉
- 关键词:主题树语义相似度空间向量模型