周小平 作品数:20 被引量:203 H指数:8 供职机构: 中国人民大学信息学院 更多>> 发文基金: 北京市自然科学基金 国家自然科学基金 中国人民大学科学研究基金 更多>> 相关领域: 自动化与计算机技术 建筑科学 环境科学与工程 经济管理 更多>>
跨平台的建筑信息模型展示技术研究 被引量:8 2017年 建筑信息模型是建筑物的数字化表达,可为建筑全生命周期提供精确的信息。而数据共享不畅、设备硬件要求高、应用服务不灵活等问题严重阻碍了BIM技术的推广,导致设计阶段产生的建筑信息模型难以发挥其应有的价值,造成数字资产的浪费。故提出一种数据规范、成本低、扩展性好、跨平台的建筑信息模型展示技术应用方法,以实现数字资产价值的最大化。 高喆 王佳 周小平 张立权 于辉关键词:BIM IFC WEBGL 面向社会网络融合的关联用户挖掘方法综述 被引量:13 2017年 现阶段大多数社会网络的研究都集中于单一的社会网络内部.社会网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社会网络理解和挖掘人类社会,具有重要的理论价值和实践意义.准确、全面、快速地关联用户挖掘,是大型社会网络融合的根本问题.社会网络中的关联用户挖掘旨在通过挖掘不同社会网络中同属于同一自然人的不同账号,从而实现社会网络的深度融合,近年来已引起人们的广泛关注.然而,社会网络的自身数据量大、用户属性相似、稀疏且存在虚假和不一致等特点,给关联用户挖掘带来了极大的挑战.分析了面向社会网络融合的关联用户挖掘所存在的困难,从用户属性、用户关系及其综合这3个方面梳理了当前关联用户挖掘的研究现状.最后,总结并展望了关联用户挖掘的研究方向. 周小平 梁循 赵吉超 李志宇 马跃峰关键词:社会网络 用户属性 用户关系 基于支持向量机的公共建筑火灾风险评估 被引量:6 2015年 由于公共建筑火灾具有动态性、非线性的特点,目前的火灾风险评估方法在对公共建筑进行火灾风险评估时,很难建立精确的评估模型。支持向量机(Support Vector Machine,简称SVM)能有效解决小样本、非线性的问题,本文提出运用SVM进行公共建筑火灾风险评估,构建公共建筑火灾风险评估指标体系,建立了基于SVM理论的火灾风险评估模型,并以某商场为例,对所建立的模型进行验证。实例验证表明,基于SVM的火灾风险评估方法具有更高的精确度,能够更好地解决公共建筑火灾的动态性和非线性问题,在公共建筑火灾风险评估中具有较好的应用价值。 赵云涛 王佳 周小平关键词:公共建筑 火灾风险评估 支持向量机 面向光伏建筑的发电量预测方法 被引量:1 2014年 发电量是光伏项目重要的性能指标。准确预测发电量对于光伏建筑项目的规划、运营以及经济核算极为重要。面向光伏电站设计开发的发电量预测方法及其软件,难以适应光伏建筑发电量预测的复杂性和特殊性,其预测结果与实际值差距较大。文章提出了一种光伏建筑模型预测法,使用该方法预测光伏建筑发电量的结果较为准确,优于现有方法。 任远 王佳 周小平关键词:光伏建筑一体化 发电量预测 基于内容的社交网络用户身份识别方法 被引量:15 2019年 社交网络中识别用户身份具有重要价值,它对社交网络的分析与监管、用户行为的预测以及用户之间交互过程的研究具有重要意义.该文针对社交网络中的用户身份进行研究,将用户身份分为组织用户和个人用户,并对这两种用户身份进行具体定义和识别.该文研究问题属于社交网络用户分析研究中的子研究问题,主要通过用户在社交网络中发表的文本内容、多媒体内容以及用户时间序列内容识别出该用户的组织-个人身份,为社交网络用户身份的识别及进一步研究提供借鉴和帮助.在识别过程中,通过对文本内容中用户的口语化水平、内容(主题)复杂化水平、内容规范化水平的度量以及多媒体内容中用户图片特性和用户时间序列内容的分析,从不同角度提出5种机器可操作的用户组织-个人身份识别方法,进而识别出社交网络中用户是组织用户还是个人用户.最后,为了验证该文所提识别方法的可行性和有效性,该文选择新浪微博数据进行实验,并通过概率模型识别方法进行了对比分析.同时,在验证过程中,使用多种指标对实验结果进行评价.实验结果表明,该文识别方法能够有效识别出用户的组织-个人身份,其中内容复杂特性识别方法、内容规范化识别方法以及时间序列内容识别方法的用户身份识别准确率超过80%. 张树森 梁循 弭宝瞳 赵吉超 周小平关键词:社交网络 身份识别 时间序列 海量铁路机车GIS定位数据分布式处理技术 被引量:3 2015年 针对铁路机车海量GIS信息数据及其对铁路调度几种控制系统带来的数据存取问题,采用Hadoop HDFS进行海量GIS数据存取,提出HBase的数据表结构设计及查询方法以及采用MapReduce进行数据分析的分布式处理方法,明确了基于MapReduce对铁路机车GIS信息进行地图匹配以及安全距离计算的方法。试验结果表明:采用Hadoop HDFS进行数据存取具有较高的效率,在需要大量数据存取的情况下,采用MapReduce进行分布式数据分析效率更高,扩展性更好。 周小平 刘祥磊关键词:分布式计算 MAPREDUCE 铁路机车 海量数据 基于R-C模型的微博用户社区发现 被引量:25 2014年 在微博市场营销、个性化推荐等应用中,发现兴趣和网络结构双内聚的用户社区起着至关重要的作用.现阶段,绝大多数的用户社区发现算法往往将用户联系与用户内容相隔离,从而导致其社区发现结果不够合理,而少数综合用户联系和内容的用户社区发现算法较为复杂;LCA算法是重叠社区发现算法中算法效率较高且社区质量较好的算法,然而,其在聚类时未考虑边的真实兴趣体现.针对这些问题,构建了以关注关系为网络节点、以关注关系之间是否有共同用户为关注关系潜在的边、以关注关系所关联用户的兴趣集的交集为关注关系的兴趣特征,构建微博网络R-C模型,并探讨了其进行微博用户社区发现的方法,分析了该方法的复杂度.最后,以新浪微博数据集为实验,对照节点CNM算法和LCA算法,从兴趣内聚和网络结构内聚两方面进行分析,发现该方法能够发现更好的微博用户社区. 周小平 梁循 张海燕基于属性主题分割的评论短文本词向量构建优化算法 被引量:6 2016年 从词向量的训练模式入手,研究了基于语料语句分割(BWP)算法,分隔符分割(BSP)算法以及属性主题分割(BTP)算法三种分割情况下的词向量训练结果的优劣。研究发现,由于评论短文本的自身特征,传统的无分割(NP)训练方法,在词向量训练结果的准确率和相似度等方面与BWP算法、BSP算法以及BTP算法具有明显的差异。通过对0.7亿条评论短文本进行词向量构建实验对比后发现,该文所提出的BTP算法在同义词(属性词)测试任务上获得的结果是最佳的,因此BTP算法对于优化评论短文本词向量的训练,评论短文本属性词的抽取以及情感倾向分析等在内的,以词向量为基础的应用研究工作具有较为重要的实践意义。同时,该文在超大规模评论语料集上构建的词向量(开源)对于其他商品评论文本分析的应用任务具有较好可用性。 李志宇 梁循 周小平关键词:相似度计算 基于组合定位海量数据处理的铁路机车安全距离预警 被引量:1 2015年 针对我国铁路机车定位数据丢失时有发生的现象,阐述了以现有较成熟的GNSS/INS/DR(Global Navigation Satellite System/Inertial Navigation System/Dead Reckoning)组合定位装置构建铁路机车定位的系统架构。在此基础上,针对海量位置数据,引入Hadoop技术,给出了采用HBase存储海量位置信息数据的方法,采用MapReduce校正位置信息数据及安全距离计算的方法。经实验验证,该方案在需要大量数据存取的情况下,采用MapReduce进行分布式数据分析效率更高,扩展性更好。 周小平 刘祥磊关键词:海量数据 铁路机车 HADOOP 针对有向图的局部扩展的重叠社区发现算法 被引量:7 2015年 当前社区发现算法主要是针对无向图研究社区结构,但在实际复杂网络中,链接关系时常表现出非对称性或方向性,比如Twitter的用户关注关系,文献网络的引用关系,网页之间的超链接关系等应用网络。因此,本文依据信息在复杂网络中的传播规律和流动方向性,提出了k-Path共社区邻近相似性概念及计算方法,用于衡量结点在同一社区的相似性程度,并给出了把有向图转换为带方向权值的无向图的方法。基于带权无向图提出了一种从局部扩展来探测社区的重叠社区发现算法(Local and wave-like extension algorithm of detecting overlapping community,LWS-OCD)。在真实数据集上的实验表明,共社区邻近相似性概念实现了有向到无向的合理转换,而且提高了社区结点的聚集效果,LWSOCD算法能够有效地发现带权无向图中的重叠社区。 张海燕 梁循 周小平关键词:有向图