师智斌 作品数:37 被引量:100 H指数:4 供职机构: 中北大学电子与计算机科学技术学院 更多>> 发文基金: 山西省自然科学基金 国家自然科学基金 铁道部科技研究开发计划 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 电子电信 更多>>
基于分类超平面的非线性集成学习机 被引量:2 2013年 针对支持向量机面临的大规模数据分类问题,提出基于分类超平面的非线性集成学习机NALM。该方法借鉴管理学中协同管理的思想,将大规模数据分成规模较小的子集,然后分别在子集上运行分类超平面算法,最后将各子集上的分类结果进行非线性集成得到最终的分类结果。该方法不仅继承了分类超平面的优点,而且还将分类超平面的适用范围从小规模数据扩展到中大规模数据,从线性空间推广到Hilbert核空间。若干数据集上的实验表明:NALM能以较少的支持向量来解决大规模样本分类问题。 刘忠宝 赵文娟 师智斌关键词:支持向量机 分类超平面 大规模数据 基于数据仓库的股票交易数据分析与预测研究 本文分析了目前我国股票市场分析预测方法状况及国内外数据仓库和数据挖掘技术在各个领域的广泛应用,以提供股票投资决策为目的,研究了将数据仓库技术应用到股票分析系统中,建立了面向分听、面向决策的数据平台,采用数据挖掘技术中的前... 师智斌关键词:数据仓库 文献传递 基于时序特征的网络流量分类方法 被引量:2 2022年 网络流量数据具有明显的时序特征.针对基于机器学习的网络流量分类方法中,传统机器学习依赖人工设计特征以及深度学习无法兼顾特征自主生成与特征可解释性等问题,采用时序分析方法,提出了一种基于时序特征的网络流量分类方法.首先,将网络流量数据预处理为时序数据;然后,应用Shapelet-Transform算法来自主学习网络流量的时序特征,并改写Shapelet-Transform算法的计算逻辑,且将其部署在GPU上,使其可以快速处理大规模网络流量数据集;最后,结合支持向量机分类算法构造了最优分类模型来实现网络流量分类.公开数据集实验测试结果表明,所提方法可以实现网络流量时序特征的自主学习,并达到与深度学习接近的分类精度,同时给出深度学习方法无法提供的可解释性分类依据. 赵力强 师智斌 石琼 雷海卫关键词:网络流量分类 可解释性 GPU 大规模不完整信息特征提取仿真研究 被引量:2 2018年 随着信息规模的不断扩大不完整信息随之出现,使信息无法完成正常传输。对其进行特征提取,能够有效提升数据分析的准确性。对不完整信息特征的提取,需要得到特征属性类别中心矢量,计算出特征挖掘适应度值,完成对不完整信息特征的提取。传统方法估计出基函数和滤波器,对不完整信息进行滤波,但忽略了计算出特征挖掘适应度值,导致提取精度偏低。提出基于神经网络的大规模不完整信息特征提取方法。描述不完整信息属性与分类结果之间的关系,组建分类决策树对不完整信息进行聚类处理,结合自适应搜索方法进行大规模不完整信息特征进行提取,得到特征属性类别中心矢量,得到动态训练下的信息特征提取的模糊控制律,计算出特征挖掘适应度值,由此实现大规模不完整信息的特征提取。实验结果表明,所提方法具有较高的特征提取精度。 高佳锋 师智斌关键词:特征提取 融合用户兴趣和评分差异的协同过滤推荐算法 被引量:25 2020年 针对传统的协同过滤算法中单一评分相似性计算不准确的问题,提出融合用户兴趣和评分差异的协同过滤推荐算法。将TF-IDF思想运用到用户对标签的权重计算中,并使用指数衰减函数和时间窗口捕捉用户兴趣的变化;根据历史评分矩阵,充分考虑用户评分值差异、评判准则差异、影响力差异和项目影响差异等影响因子,定义了一种评分差异相似性度量算法;最后将用户兴趣相似性和评分差异相似性进行加权融合,获取更加准确的用户邻居,从而预测项目评分并进行推荐。在数据集Movielens的实验表明,提出的算法能有效提高推荐精度。 陆航 师智斌 刘忠宝关键词:协同过滤 TF-IDF 炸药GAS重结晶细化过程中膨胀度测试技术研究 被引量:2 2003年 介绍了GAS重结晶细化方法中膨胀度测试原理、方法、装置,并对丙酮-CO2、环己酮-CO2体系膨胀度进行了测试。研究表明,膨胀度主要受压力、温度及实验过程搅拌作用的影响。 王保民 师智斌关键词:炸药 膨胀度 测试技术 温度 二氧化碳 数据立方体聚集范围查询分块方法研究 2007年 范围查询是数据立方体数据分析的有效工具,预计算技术通过预先计算并存储范围查询的结果,可以实现快速的用户响应。近年来研究人员对基于MOLAP的预计算技术的研究主要以prefixsum及分块技术为基础。本文对预计算技术的分块方法进行研究,分析了现有分块技术的方法和性能,并提出了两种新的分块方法:嵌套分块和基于前缀区域边界的分块。本文对这两种分块的方法和特点做了阐述,研究表明这两种方法为分块技术提出了新的思路,是对现有分块方案的有力补充。 师智斌 黄厚宽关键词:数据立方体 范围查询 大数据分析下终端用户信息快速获取仿真研究 被引量:2 2018年 对终端用户信息的快速获取,能够有效提高大数据下用户信息处理效率。对大数据分析下终端用户信息获取,需要建立用户信息的数据预处理模型,去除终端用户信息中存在的噪声,完成用户信息的快速获取。传统方法对下近似的计算方法进行了重新定义,并对快速获取模型进行探讨,但忽略了对用户信息中噪声的滤除,导致信息获取效率偏低。提出终端用户信息快速获取方法。根据科尔莫戈罗夫多项式建立用户信息的数据预处理模型,去除终端用户信息中存在的噪声,提高快速获取结果的准确性,采用贝叶斯定理计算终端用户信息的特征,根据信息特征快速的完成获取,提高了方法的获取效率。仿真证明,上述方法可以在较短的时间内准确的完成终端用户信息的快速获取。 杨捷 师智斌 刘忠宝关键词:大数据 终端用户 基于Mahout的新用户推荐算法的设计与实现 被引量:3 2015年 为了解决大数据背景下新用户因没有历史数据而导致推荐难和推荐效率低等问题,提出将基于Mahout的协同过滤算法与基于MapReduce的Top N算法相结合的技术方法,来实现新用户推荐算法,从而构建新用户推荐系统的架构,并对Hadoop Top N算法以及Mahout中协同过滤算法进行设计与实现。理论分析和实验验证表明,该新用户推荐算法在推荐效率、对大规模数据处理的伸缩性以及推荐质量上都明显优于单独使用协同过滤算法的新用户推荐。 高献卫 师智斌关键词:推荐系统 HADOOP 大数据 一种基于改进PBFT算法的雾节点信任评估方法 本发明属于安全评估技术领域,具体涉及一种基于改进PBFT算法的雾节点信任评估方法。为解决雾计算网络中恶意节点作恶,并为底层节点选择最优雾节点处理任务请求等问题,本方法首先提出一种基于改进PBFT算法的雾节点信任评估模型,... 石琼 师智斌 薛彪