上海市自然科学基金(13ZR1417500)
- 作品数:6 被引量:61H指数:3
- 相关作者:雷景生毕忠勤徐菲菲朱林杨杰更多>>
- 相关机构:上海电力学院上海交通大学同济大学更多>>
- 发文基金:上海市自然科学基金国家自然科学基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 模糊加权流数据软子空间的聚类算法被引量:1
- 2013年
- 现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.
- 朱林雷景生毕忠勤徐菲菲
- 关键词:子空间聚类数据流聚类模糊聚类
- 基于联合属性重要度的决策风险最小化属性约简被引量:3
- 2016年
- 经典粗糙集属性约简基本都是保持正域、负域和边界域不变,而决策粗糙集对属性的增减过程不具备单调性,因此不可能同时保持3个区域均不变。在决策粗糙集模型中,作出决策更应该考虑风险最小化原则,因此提出一种改进的风险最小化属性约简方法,在属性的选取过程中同时考虑所选取的属性子集对决策的划分能力,即联合属性重要度以及风险最小化。实验证明所提方法是有效的。
- 徐菲菲毕忠勤雷景生
- 关键词:属性约简风险最小化
- 区间值决策表的决策风险最小化属性约简被引量:2
- 2017年
- 针对目前海量数据分析较多情况下从传统的单条记录转变为一个区间对象,将决策粗糙集中风险的概念引入至区间值决策表中,给出了区间值决策表决策风险的定义,并提出了决策风险最小化的属性约简方法.该方法可以保证所得到的约简集合相对于决策属性具有较强的分类能力,同时保证约简集合的决策风险最小.区间值决策表的决策风险最小化约简使得定义的约简具有更强的理论性和可解释性.
- 徐菲菲
- 关键词:风险最小化属性约简
- 基于注意力机制的Siamese-BiLSTM短文本相似度算法被引量:2
- 2022年
- 提出将注意力机制引入至孪生网络(Siamese Network)结构,通过注意力机制对句子中单词进行重要性评分,以双向长短时记忆网络(BiLSTM)作为基准系统,获得文本语义的深层次特征表示,从而有效地提升短文本相似度的准确率。实验采用通用公开标注数据集Quora语句对集和蚂蚁金服句对集,结果表明,与传统神经网络以及Siamese-Net网络相比,所提出的算法在短文本相似度总体效果上有明显提升,验证了所提算法的有效性。
- 徐菲菲冯东升
- 关键词:相似度
- 大数据环境下多决策表的区间值全局近似约简被引量:22
- 2014年
- 在电力大数据中,很多具体的应用如负荷预测、故障诊断都需要依据一段时间内的数据变化来判断所属类别,对某一条数据进行类别判定是毫无意义的.基于此,将区间值粗糙集引入到大数据分类问题中,分别从代数观和信息观提出了基于属性依赖度和基于互信息的区间值启发式约简相关定义和性质证明,并给出相应算法,丰富和发展了区间值粗糙集理论,同时为大数据的分析研究提供了思路.针对大数据的分布式存储架构,又提出了多决策表的区间值全局约简概念和性质证明,进一步给出多决策表的区间值全局约简算法.为了使得算法在实际应用中取得更好的效果,将近似约简概念引入所提的3种算法中,通过对2012上半年某电厂一台600MW的机组运行数据进行稳态判定,验证所提算法的有效性.实验结果表明,所提的3种算法均能在保持较高分类准确率的条件下从对象和属性个数两方面对数据集进行大幅度缩减,从而为大数据的进一步分析处理提供支撑.
- 徐菲菲雷景生毕忠勤苗夺谦杜海舟
- 关键词:大数据区间值近似约简
- 一种基于数据流的软子空间聚类算法被引量:32
- 2013年
- 针对高维数据的聚类研究表明,样本在不同数据簇往往与某些特定的数据特征子集相对应.因此,子空间聚类技术越来越受到关注.然而,现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究中.为此,利用模糊可扩展聚类框架,与熵加权软子空间聚类算法相结合,提出了一种有效的熵加权流数据软子空间聚类算法——EWSSC(entropy-weighting streaming subspace clustering).该算法不仅保留了传统软子空间聚类算法的特性,而且利用了模糊可扩展聚类策略,将软子空间聚类算法应用于流数据的聚类分析中.实验结果表明,EWSSC算法对于高维数据流可以得到与批处理软子空间聚类方法近似一致的实验结果.
- 朱林雷景生毕忠勤杨杰
- 关键词:子空间聚类数据流聚类模糊聚类文本聚类