公共文化服务平台

一种面向大规模社会信息网络的多层社区发现算法被引量：8: 2016年; 社区发现旨在挖掘社会信息网络的社区结构,是社会计算及其相关研究的基础.随着交互式社会信息网络规模的快速增长,传统的社区发现算法难以满足大规模网络的可扩展分析需求.多层社区发现算法如PMetis、Graclus等虽然可以分析包含数百万节点规模的网络,但是小于2的粗化缩减比率以及社会信息网络的幂律分布特性极大地制约着该类算法的性能优势.该文提出了一种基于三角形内点同一社区性粗化策略的多层社区发现算法TMLCD.TMLCD不仅以大于2的粗化缩减比率加快了大规模社会信息网络的粗化过程,而且从基本拓扑结构上保持了初始网络的社区效应,提高了社区发现精度.基于YouTube、Orkut等真实网络的实验结果表明:TMLCD在计算精度、内存占用以及运行时间方面的性能均优于目前典型的多层社区发现算法,适用于富含三角形的社会信息网络分析.; 康颖古晓艳于博林政王伟平孟丹; 关键词：粗化大数据

云计算计费模型研究: 2014年; 分析并提出了一种基于用户业务相关的灵活定价策略和用户资源使用行为及对资源评价反馈的计费模型:首先,基于设定的业务类别资源定价策略关联模块,获取针对特定业务类别的资源单价策略,同时通过对云计算系统中用户的资源使用行为的分析,获得用户的资源使用行为影响因子;并依据SLA(服务等级协议)对资源提供者进行评价得到服务满意度,基于用户行为影响因子和服务满意度对计费结果进行调整。模型的实际应用表明,其具有良好的应用效果。; 于辉刘正伟刘俊朋郭锋; 关键词：资源定价服务等级协议

云存储安全模型研究被引量：2: 2015年; 针对云存储服务对传统存储技术在数据安全性、可靠性、易管理性等方面提出的新挑战,在分析云存储的基本概念、结构和特点的基础上,研究了云存储的安全性;同时,针对云存储系统各个结构层次的特点,讨论了云存储的安全技术,并构建了云存储安全模型,保证了云存储系统的安全性和可靠性。; 于辉李新虎刘俊朋郭锋; 关键词：数据存储访问控制

基于统计方法的Hive数据仓库查询优化实现被引量：16: 2015年; Map/Reduce是海量离线数据分析中广泛应用的并行编程模型。Hive数据仓库基于Map/Reduce实现了查询处理引擎,然而Map/Reduce框架在处理偏斜数据时会出现工作负载分布不均的问题。均衡计算模型（computation balanced model,CBM）,其核心思想是通过数据分布特征指导查询计划优化。相应研究贡献包括2部分,首先针对应用极广的GroupBy查询和Join查询建立了运行估价模型,确定了不同场景下查询计划的优化选择分支;其次基于Hive ETL机制设计了一种统计信息收集方法,解决了统计海量数据分布特征的问题。实验数据表明,通过CBM优化的GroupBy查询耗时节省了8%～45%,Join查询耗时节省了12%～46%;集群CPU负载均衡指标优化了60%～80%,I/O负载均衡指标优化了60%～90%。实验结果证实了基于CBM模型优化的查询计划生成器能显著均衡化Hive查询运行时的集群负载,并优化了查询处理效率。; 王有为王伟平孟丹; 关键词：分布式数据仓库负载均衡查询优化

面向网络大数据的知识融合方法综述被引量：87: 2017年; 网络大数据是指"人、机、物"三元世界在网络空间中交互、融合所产生并在互联网上可获得的大数据.网络大数据中蕴含丰富的知识资源,包括描述特定事物的实体、刻画实体逻辑联系的关系、用于语义标注实体的分类等.知识自身呈现出异质性、多元性和碎片化等特点.如何在网络大数据环境下海量碎片化的数据中提取出能够用于解决问题的知识,并对知识进行有效的融合计算,将从网络大数据中获得的知识有效组织起来是知识库构建亟待解决的技术难点和当前研究的热点.该文从知识融合的定义出发,介绍近年来的可用于知识融合的技术和算法的最新进展,通过分类和总结现有技术,为进一步的研究工作提供可选方案.文中首先介绍了在知识融合中用于判断知识真伪的知识评估的若干研究和评估方法;然后基于知识评估的结果,从实体扩充、关系扩充和分类扩充3个方面详细总结了知识融合中各种可用的知识扩充方法和研究进展;探讨了应用于网络大数据的知识融合的总体框架;基于这些讨论,总结面向网络大数据的知识融合面临的主要挑战和可能解决方案,并展望了该技术未来的发展方向与前景.; 林海伦王元卓贾岩涛张鹏王伟平; 关键词：知识库知识融合

基于云计算的信息安全模型: 2014年; 在对云平台进行安全分析的基础上,提出一种云环境下保护数据安全的模型,并对该安全模型进行了实验验证。该模型使用SSL协议对数据加密传输,保证数据的机密性;使用消息摘要机制,保证数据的完整性与可用性,使用双重认证机制,保证访问用户的合法性。; 胡玉鹏; 关键词：云计算数据安全加密传输

基于卷积神经网络和用户信息的微博话题追踪模型被引量：6: 2017年; 为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-User TTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-User TTM分别获得较高的微博话题追踪准确率.; 付鹏林政袁凤程林海伦王伟平孟丹; 关键词：卷积神经网络

基于Cookie的网盘资源在线溯源方法: 2016年; 网盘作为一种基于互联网的信息传播载体,其所分享的敏感资源已经在网络流量中占有越来越多的比例,因此,获取网盘资源的分享链接对于网络安全有着重要的意义。提出了一种高效可扩展的基于Cookie的网盘资源溯源方法—Cookie Tracing。该方法通过在海量的HTTP会话中建立Cookie与HTTP会话的索引表来实现网盘资源和下载网盘资源的跳转链的关联,同时通过累计散列算法加快溯源结果的验证。实验结果表明,所提方法具有较好的性能和可扩展性。; 林海伦李焱王伟平岳银亮林政; 关键词：COOKIE

基于卷积神经网络的中文微博情感分类被引量：10: 2017年; 微博是互联网舆论演化的重要平台,对微博进行情感分析,有助于及时掌握社会热点和舆论动态。由于微博数据内容简短、特征稀疏、富含新词等特征,微博情感分类依然是一个较难的任务。传统的文本情感分类方法主要基于情感词典或者机器学习等,但这些方法存在数据稀疏的问题,而且忽略了词的语义、语序等信息。为了解决上述问题,提出一种基于卷积神经网络的中文微博情感分类模型CNNSC,实验表明相比目前的主流方法,CNNSC的准确率提高了3.4%。; 冯多林政付鹏王伟平; 关键词：情感分类卷积神经网络

一种数据流上基于滑动窗口的点连接查询处理算法被引量：3: 2014年; 连接是数据库研究中至关重要的一环,在没有边界、连续的数据流模型中,由于存储有限和实时性需求,连接算法主要基于滑动窗口作近似处理.主要研究数据流上一种特殊的连接,命名为点连接.点连接是指对于任意r∈R(称为主流),有唯一的s∈S(称为副流)与之对应,其中s.a=r.a且s.time最接近r.time(time称为时间特征).因此,流R与流S上的数据属于n∶1的关系.而在真实的分布式环境下,因为网络等原因,流数据到达的时间和顺序往往不一致,导致连接成功率下降.提出一种新的连接查询处理算法,能够在复杂的网络环境下获取更多的连接输出.实验模拟了2种网络环境,分别在数据有序到达和数据乱序到达2种情况下对算法验证,证明此算法比已有算法更优.; 杨仁凯王坤朋木伟民王伟平; 关键词：数据流数据库研究点连接

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家科技重大专项(2013ZX01039-002-001-001)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家科技重大专项(2013ZX01039-002-001-001)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈