中国科学院大学大数据挖掘与知识管理重点实验室 作品数:10 被引量:32 H指数:3 相关作者: 朱琳琳 张毅 更多>> 相关机构: 中国科学院计算技术研究所 哈尔滨工业大学计算机科学与技术学院 北京信息科技大学经济管理学院 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 经济管理 政治法律 更多>>
基于社交内容的潜在影响力传播模型 被引量:13 2016年 随着社交网络服务的快速发展及增长,理解网络用户之间潜在的影响力的传播过程,能够帮助用户更好地理解网络结构的动态演化,以及不同的信息对于人与人之间社会关系的影响作用.现有的影响力传播相关的研究工作主要集中在给定静态社交网络结构,分析用户之间的影响力传播,找出最具有影响力的用户子集.然而大部分已有工作都忽略了社交网络中的内容信息,即用户之间的影响力作用是与用户产生内容紧密相关的.该文提出了一种融合内容信息和社交网络动态时间特性的潜在影响力传播模型InfoIBP(Influence propagation on Indian Buffet Process).网络中有影响力的用户被看作是一种潜在的特征,可通过不同采样算法和数值逼近求解出来.而对于网络动态时间特性,借助于隐马尔可夫模型来建模不同时间步上的影响力传播过程.在数据集DBLP和Digg上的一系列链接预测、偏好预测和运行时间评测等实验,证明了所提InfoIBP模型能够更准确地建模潜在的影响力传播过程,更有效地挖掘出社交网络中的有影响力用户及更全面地描述网络的动态时间特性,并能对未来的观测数据做出相对精准的预测. 王祯骏 王树徽 张维刚 黄庆明关键词:链接预测 社交媒体 社交网络 基于卷积神经网络的时空融合的无参考视频质量评价方法 被引量:3 2018年 无参考视频质量评价是指在不借助原始无损参考视频信息的条件下,对于给定的任意一段视频,直接评测出其质量程度。传统的无参考视频质量评价方法大都基于统计分析,绝大多数都针对特定的视频失真类型,对视频的时域信息考虑较少,导致现有的基于统计分析的方法应用范围局限,实时性较差。提出一种融合视频时空信息的基于卷积神经网络的无参考视频质量评价方法。该方法不针对特定失真类型。将方法分为空域和时域两部分进行处理,空域上提出一种基于卷积神经网络的方法学习空域失真特征,时域上设计一组基于邻帧块结构相似度的特征用以表征视频的时域失真信息。最后将视频的时空特征进行融合,送至线性回归模型进行视频质量的预测。实验表明,所提方法的多项指标均达到主流视频质量评价方法的性能,且方法运行速度大大提高,显示出较好的实时应用前景。 王春峰 苏荔 苏荔关键词:视频质量评价 卷积神经网络 无参考 时空信息 基于微观调查数据的我国粮食需求影响因素研究 2018年 随着我国人口数量增长和结构改变,以及城市化和工业化的进一步推进,迫切需要对我国的粮食需求规模、结构和布局进行重新评估,以从"需求侧"倒逼"供给侧"改革。基于国科大学生网络开展全国范围的粮食消费抽样调查,收集粮食需求微观数据,据此对我国粮食需求特征及其影响因素进行分析挖掘。研究得出,我国居民粮食摄入量呈下降趋势,地区、年龄、收入是影响粮食需求的关键因素,粮食摄入量在地区、年龄、收入等方面存在显著差异性。我国居民粮食摄入量与居民年龄之间存在显著的倒"U"型关系。最后,从科学估计粮食需求、优化粮食时空布局层面提出政策建议。 牟新娣 李秀婷 董志 董纪昌 苗晋瑜关键词:方差分析 面向社交内容的动态影响力传播模型 随着社交网络服务的快速发展,理解网络用户之间潜在影响力的传播过程成为热点研究问题.现有关于影响力传播的研究工作主要集中在给定的静态社交网络中找出最有影响力的用户子集,而忽略了社交网络中的内容信息.本文提出一种融合了内容信... 王祯骏 王树徽 张维刚 黄庆明关键词:社交网络 内容信息 文献传递 迭代式的深度PU学习与类别先验估计框架 被引量:1 2022年 近年来,深度学习在诸多任务上展现了优异的性能,其一般基于海量数据并采用有监督的学习方式,依赖于完整的数据标签信息.然而在现实应用场景中,收集大量标签往往成本高昂.因此,如何利用未经充分标注的数据进行学习成为了当下的主要挑战.二分类问题中的从正例和无标签(Positive-Unlabeled,PU)样本数据进行学习,简称PU学习,即为其一.当前主流的PU学习算法需要准确无误的类别先验知识,但实际上类别先验通常难以获得,需要估计.已有的类别先验估计算法则主要面向传统的机器学习分类器进行设计,无法直接运用在大规模数据集上,因而不利于发挥深度学习在大规模数据集上的优势.为克服以上问题,本文提出了一个基于无监督混合模型的迭代式深度PU学习与类别先验估计框架.它利用了深度神经网络对正例和负例给出的预测分数具有不同的分布这一特性,使用双高斯成分的混合模型近似拟合预测分数的混合分布.其中,各个高斯分量分别代表了正类和负类的条件概率分布,混合权重系数代表了类别先验.结合半监督学习中的平均教师和温度锐化技术,所提框架在类别先验未知以及数据缺失负例监督的条件下,估计类别先验的同时进行PU数据上的深度学习,二者相互促进.在基准数据集MNIST、Fashion-MNIST、CIFAR-10和实际应用数据集Alzheimer上的实验结果验证了所提框架的有效性,准确率分别为94.66%、95.16%、89.98%和73.20%,该结果不仅超越了现有基于类别先验估计的PU学习算法,更可与基于真实类别先验的最前沿算法相媲美. 赵昀睿 许倩倩 姜阳邦彦 黄庆明关键词:半监督学习 中国政府竞赛众包的发展现状与对策研究 被引量:1 2019年 政府竞赛众包以竞赛形式集众智,为制良策,解民忧,施善治提供新的思路。本文在厘清政府竞赛众包概念及特征的基础上,运用案例分析法对100个政府竞赛众包案例进行剖析,阐述了当前政府竞赛众包的基本概况和问题,从竞赛设置、技术保障和制度设计3个方面提出发展和推广政府竞赛众包的对策与建议。 李蕊 刘红关键词:政府 公众 基于系统动力学的我国住房需求仿真研究 被引量:10 2020年 近年来我国住房需求波动加剧,对房地产市场产生了巨大影响。本文综合分析了影响我国住房需求的因素,并基于系统动力学方法,构建了我国住房需求的系统模型,拟探究未来我国住房需求的发展趋势,同时设定不同情景进行仿真模拟,拟为我国住房市场平稳发展提供建议。研究结果发现,我国住房需求呈现倒U型的发展趋势,未来住房需求将出现下降趋势。通过情景仿真模拟发现,征收房地产税、取消预售权均会对我国住房需求起到有效控制作用,而全面放开计划生育政策能够在增加我国人口总量的基础上,抑制未来我国住房需求的下降趋势。 牟新娣 李秀婷 董纪昌 董志关键词:住房需求 系统动力学 仿真模拟 中国省级政府数据开放政策量化研究 被引量:2 2019年 本文应用政策文本量化分析方法,从政策形式和政策内容两方面对当前省级政府数据开放政策进行了研究。研究发现,我国各省数据开放工作整体进展较为缓慢,在政策制定上依然处于摸索阶段,同时各部门合作较少,对开发数据价值重视不足,建议政府成立专门机构负责数据开放工作,完善考核机制,创新与社会主体的合作形式,最大程度发挥出政府开放数据的价值。 苏飞 刘红关键词:省级政府 政策工具视角下中国重大科技基础设施政策量化研究 被引量:1 2023年 伴随着新一轮科技革命和产业变革深入发展,科学研究正不断向更深层次发展,对精度更高、功能更强的重大科技基础设施建设提出了更高的要求。设施建设的高投入、高风险和回报周期长等特征使其更为依赖政策扶持和政府参与。因此本研究基于LDA模型和政策工具视角,构建了一个包含基本政策工具、设施双重属性特征在内的政策二维分析框架,对我国颁布的设施相关政策文件进行量化,以此分析我国现有政策实施情况。研究发现,现有政策文本中,环境型政策工具的使用频率在设施相关政策工具中最高,政府仍需加强政策执行精准度及力度,提高落地效能;此外,需求型政策工具的运用有待加强,可以通过激励机制和完善海外机构政策,促进用户推广和国际合作。最后,建议政府在完善设施政策顶层部署的同时应建立评估机制推动设施政策持续优化。 邢颍 赵天驰 张玲玲关键词:重大科技基础设施 文本分析 经济转型期我国房地产业的关联效应分析 被引量:1 2017年 厘清房地产业与其他关联产业之间的关系不仅有利于房地产业的长期规划,还有利于经济转型期下我国房地产业的针对性调控。本文以我国1997年—2012年的7张投入产出表为数据来源,采用投入产出分析法,测算房地产业与宏观经济中其他产业的关联效应,分析房地产业与其他产业之间的关系变化,以期对未来房地产业的规划调控提供参考。 张毅 朱琳琳 何静 李秀婷 董纪昌关键词:房地产业 投入产出表