海沫
- 作品数:20 被引量:121H指数:7
- 供职机构:中央财经大学信息学院更多>>
- 发文基金:国家自然科学基金中央财经大学学科建设基金中财121人才工程青年博士发展基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学更多>>
- 在线社交网络信息传播模型研究被引量:7
- 2016年
- 通过对在线社交网络信息的传播过程和传播路径图的介绍,根据研究对象的不同,将学者们近几年提出的信息传播模型分为基于传播路径图节点和基于传播路径图规模两类模型.根据传播路径图节点模型所研究的影响因素的不同将其划分为线性阈值模型及其改进模型、独立级联模型及其改进模型、多因素模型、博弈论模型共四类模型.根据传播路径图规模模型中采用的理论方法的不同将其划分为SIR模型及其改进模型、马尔科夫模型、场强模型、神经网络模型、回归模型共五类模型.文中对九类模型的建立思路、关键点、改进方向等方面进行了详细分析,并根据提出的模型评价指标,对九类模型进行了定量比较.
- 海沫郭庆
- 关键词:信息传播
- 软件体系结构模型的形式化研究被引量:10
- 2003年
- 用软件体系结构描述语言WRIGHT对三层C/S模型进行形式化描述,指出这种描述的优点以及软件体系结构模型形式化研究的重要性。
- 徐正权海沫
- 关键词:软件体系结构三层C/S模型软件系统软件工程
- 人机物三元计算中的通用计算账户与个人信息资产代数被引量:4
- 2013年
- 计算机科学技术的发展涌现出一些基础性的不变量,推动了学科的知识积累和信息产业的资本深化,近20年的一个不变量例子是万维网(WWW)中的资源概念.未来信息技术发展的一个重要方向是融合人机物三元世界的普惠计算,当前互联网服务、云计算、大数据领域的"以资源为中心"的模式将逐渐向"以用户为中心"的模式发展.个性化的普惠计算需要另一个不变量,即用户的通用计算账户.刻画了通用计算账户的基本性质与技术组成,并从个人用户数据角度,提出了个人信息资产及其资产代数的学术抽象和原型实现.分析和实验表明,通用计算账户和资产代数系统有利于克服现有系统存在的用户数据被锁定在各个服务与设备中,难以统一管理和共享的问题.
- 徐志伟谢毅海沫李晓林袁子牧
- 关键词:数据集成数据模型信息资产
- Cache共享架构下的多属性范围查询被引量:1
- 2010年
- 结构化对等网络的多属性范围查询研究有两类:一类通过空间填充曲线或在每个属性维上复制信息以降维;另一类通过构建分布式索引树以实现多属性查询.这两类解析每个查询的跳数和消息数依赖于范围大小和节点个数.前者属性值改变时产生大量的消息;后者导致高的维护开销.提出cache共享架构下的多属性范围查询.仿真实验显示和SWORD相比,跳数和消息数均减少;属性值改变时,所需消息数减少;查询准确率下降不到5%.维护开销低.
- 海沫王秀利
- 关键词:结构化对等网络维护开销
- UML在网络安全监控系统建模中的应用被引量:3
- 2004年
- 本文首先介绍了UML的特性,然后运用UML对网络安全监控系统中的数据采集系统进行了可视化的建模,建立了系统的需求模型和设计模型的各种视图,最后总结了用UML进行系统需求分析和设计的优越性。
- 海沫徐正权
- 关键词:网络安全监控系统UML数据采集系统局域网INTERNET
- Spark平台下聚类算法的性能比较被引量:9
- 2017年
- 通过实验,从运行时间、加速比、可扩展性和规模增长性4个方面比较了Spark平台中3种典型的聚类算法即K-means聚类算法、二分K-means聚类算法和高斯混合聚类算法的性能。实验结果表明:1)随着节点个数的增加,3种算法对百兆以上规模数据集聚类的运行时间明显减少;2)当数据集规模大于500MB时,3种算法的加速比均有明显提高,且随着节点个数的增加,加速比近似于线性增长;3)3种算法的可扩展性随着节点个数的增加而降低,当数据集规模大于500MB时,相对于K-means和高斯混合算法,二分K-means算法的可扩展性最差;4)当数据集规模大于100MB时,高斯混合算法的规模增长性远高于K-means和二分K-means算法。
- 海沫张游
- 关键词:SPARKK-MEANS聚类运行时间加速比
- 大数据聚类算法综述被引量:38
- 2016年
- 随着数据量的迅速增加,如何对大规模数据进行有效的聚类成为挑战性的研究课题。面向大数据的聚类算法对传统金融行业的股票投资分析、互联网金融行业中的客户细分等金融应用领域具有重要价值。对已有的大数据聚类算法进行了详细划分,并比较了每种聚类算法的优缺点,进一步总结了已有研究存在的问题,最后对未来的研究方向进行了展望。
- 海沫
- 关键词:大数据聚类算法股票投资分析客户细分
- 软件体系结构模型的形式化研究.
- 2003年
- 本文用软件体系结构描述语言WRIGHT对三层C/S模型进行形式化描述,指出这种描述的优点以及软件体系结构模型形式化研究的重要性.
- 徐正权海沫
- 关键词:软件体系结构软件系统三层C/S模型形式化
- 分布式系统中的资源发现机制综述被引量:3
- 2010年
- 资源发现问题亦即由给定的资源描述找到满足该描述的资源地址。如何快速并且准确地从分布存储的资源中找到所需的资源,是一个挑战性的问题。传统的网格资源发现系统采用注册中心和索引的方式,但这些方式不能满足网格系统规模不断扩大的需求。而对等网络是一种扩展性好的分布式系统,采用已有的P2P技术解决网格环境下的资源发现问题是一种有效的途径。介绍了网格系统中的资源发现、P2P系统的资源发现以及基于P2P的网格资源发现系统,并对它们进行了比较。
- 海沫
- 关键词:资源发现注册中心索引对等网络
- 分布式环境中聚类问题算法研究综述被引量:13
- 2013年
- 传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储的数据集中提取分类模式,因此能满足此需求。针对分布式聚类算法进行综述和分析。首先对现有的分布式聚类算法进行了分类,然后对每类算法的基本思想和优缺点进行了比较,最后采用Iris和Wine两个数据集对几种分布式聚类算法从聚类精度和聚类时间两方面进行了比较。
- 海沫张书云马燕林
- 关键词:分布式聚类