胡峰 作品数:206 被引量:355 H指数:10 供职机构: 重庆邮电大学 更多>> 发文基金: 国家自然科学基金 重庆市教育委员会科学技术研究项目 重庆市自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 矿业工程 更多>>
一种基于时间序列分解的商家客流量大数据预测方法 本发明请求保护一种基于时间序列分解的商家客流量大数据预测方法,属于智能信息处理领域。主要包括步骤:101对历史消费数据进行预处理;102对经过预处理的数据构建特征工程并选取特征;103基于时间序列分解构建客流量预测模型;... 王进 范磊 陈知良 周瑞港 胡峰 邓欣 李智星 雷大江 陈乔松文献传递 一种基于Spark下并行超网络的分类方法 本发明涉及一种基于Spark下并行超网络的分类算法,具体包括以下步骤:步骤S1.把文本数据部署到Spark平台上;步骤S2.在Spark平台上对文本数据进行并行化预处理;步骤S3.在Spark平台上,对超网络算法的演化学... 王进 赵蕊 卜亚楠 孙开伟 孟小敏 李智星 陈乔松 邓欣 胡峰 雷大江 高选人 余薇 欧阳卫华文献传递 一种基于粗糙集理论的快速并行属性约简算法 被引量:17 2009年 将并行计算的思想融入基于粗糙集理论的快速属性约简中,提出了一种基于粗糙集理论的快速并行属性约简算法。该算法在保证约简结果是Pawlak约简的情况下,将属性约简任务划分到多个处理器中同时处理,从而大大提高了属性约简的效率。仿真实验结果说明了该算法的高效性。 肖大伟 王国胤 胡峰关键词:粗糙集 并行计算 属性约简 一种基于知识图谱的关系链接方法 本发明请求保护一种基于知识图谱的关系链接方法,首先,从知识图谱中利用SparQL查询语句找到包含某关系的三元组<主语、关系、宾语>列表集,并从非结构化的文本中匹配关系文本;使用LSWMD算法得到关系文本的相似... 李智星 杨茜 任诗雅 沈柯 李苑 王国胤 胡峰 王进 雷大江一种基于三支决策理论的主动学习方法 本发明请求保护一种基于三支决策的主动学习算法,通过使用三支决策的思想来解决目前无标记样本的问题。涉及到粗糙集,数据挖掘等领域。首先通过margin策略来确定无标记数据的不确定性。然后通过不确定性将无标记数据划分为三个不同... 胡峰 张苗 张清华 于洪 程麟焰 余春霖 靳义林 李智星 王进 雷大江文献传递 动态数据下的三支区间离散模型 被引量:1 2021年 在数据挖掘领域中,数据离散化是将一组连续的数值属性转换为离散的标称属性值,并广泛在音频或视频等连续时间信号的预处理中得到应用.据文献考证,离散区间中的不确定性的空白区间被现有研究所忽略.此外,动态的增量数据将使离散区间更加复杂.针对增量数据下离散问题,本文提出了一种基于三支决策的自适应动态区间离散化方法.本文提出的三支离散化方法可以使离散区间的范围随数据的变化而自适应地变化,并提高了对新增量数据进行离散化的效果.利用本文定义的空白区间的概念,可有效提高新数据和原始数据之间融合的效果.实验结果表明,本文的方法对于处理增量式数据离散化问题具有较好的效果,且运行速度更快. 章耀坤 于洪 胡峰关键词:离散化 增量数据 数据挖掘 粗糙集 一种基于三支集成预测模型的工业加热炉钢温预测方法 本发明涉及轧钢温度控制技术领域,具体涉及一种基于三支集成预测模型的工业加热炉钢温预测方法,包括:实时采集加热炉数据,并将实时采集的加热炉数据输入至三支集成预测模型中,三支集成预测模型判断实时采集的加热炉数据是否处于不确定... 于洪 魏居明 胡峰 王国胤文献传递 一种spark下的机器学习快速大规模样本签名方法 本发明请求保护一种spark下的机器学习快速大规模样本签名方法,涉及数据挖掘技术和计算机信息处理技术。本方法为:1)读入样本数据,将样本数据转换成独有的样本格式;2)对样本数据中的高频特征进行划分,得到FeatureMa... 胡峰 刘鑫 周耀 王文斌 邓维斌文献传递 一种基于Spark的高维稀疏文本数据聚类方法 本发明请求保护一种基于Spark的高维稀疏文本数据聚类方法,包括步骤:用RDD读入数据集;并用RDD接口设计出分布式稀疏向量集;分布式稀疏向量集与其所在结点的完整数据集计算相似度,按编号抽象为相似矩阵。将存放的相似矩阵对... 王进 黄超 莫倩雯 陈乔松 邓欣 欧阳卫华 胡峰 李智星 雷大江文献传递 FMNN:融合多神经网络的文本分类模型 被引量:11 2022年 文本分类是自然语言处理中一项基本且重要的任务。基于深度学习的文本分类方法大多只针对单一的模型结构进行深入研究,这种单一的结构缺乏同时捕获并利用全局语义特征与局部语义特征的能力,且网络的加深会损失更多的语义信息。对此,提出了一种融合多神经网络的文本分类模型FMNN(A Text Classification Model Fused with Multiple Neural Network),FMNN在最大限度减小网络深度的同时,融合了BERT,RNN,CNN和Attention等神经网络模型的特性。用BERT作为嵌入层获得文本的矩阵表示,用BiLSTM和Attention联合提取文本的全局语义特征,用CNN提取文本多个粒度下的局部语义特征,将全局语义特征和局部语义特征分别作用于softmax分类器,最后采用算术平均的方式对结果进行融合。在3个公开数据集和1个司法数据集上的实验结果表明,FMNN模型实现了更高的文本分类准确率,其中在司法数据集上的准确率达到了90.31%,证明了该模型具有较好的实用价值。 邓维斌 朱坤 李云波 胡峰关键词:文本分类