李毅
- 作品数:11 被引量:63H指数:4
- 供职机构:山西财经大学统计学院更多>>
- 发文基金:中国博士后科学基金山西省高等学校哲学社会科学研究项目山西省自然科学基金更多>>
- 相关领域:经济管理社会学理学文化科学更多>>
- 适应性网络空间抽样的设计及估计研究被引量:1
- 2019年
- 随着大数据背景下抽样环境日趋复杂化,特别是3S技术(遥感技术、地理信息系统和全球定位系统)日趋成熟,越来越多的社会经济问题涉及空间抽样,其样本呈现出规模相对稀少、分布不均匀、局部聚集的特征,使得传统抽样调查面临着严重挑战。本文介绍了适应性抽样技术应用于空间网络环境的基本原理、主要操作步骤和马尔可夫链蒙特卡罗估计推断,并以广州市天河区的商户抽样为例讨论实际操作中应注意的问题,以期为流动人口、环境污染、区域经济研究等方面的调查提供理论支撑和实证方法参考。
- 李毅成海美米子川
- 基于复杂网络视角下省际人口迁移空间格局及趋势研究被引量:11
- 2017年
- 本文提出一套省际人口迁移空间格局及演变趋势研究系统,以省级行政区和迁移人口构建复杂网络模型,应用群集发现和互信息节点重要性评估的算法对人口迁移空间格局进行分析,同时引入人口迁移选择指数改进链路预测算法来预测迁移人口的潜在趋势。在此基础上,以第六次全国人口普查数据为例进行实证分析,其结果与已有的研究及我国省际人口迁移空间格局的现实状况相符,验证了这套方法的实践性和应用价值。
- 李毅刘雅楠金勇进
- 关键词:省际人口迁移复杂网络链路预测
- 基于不平衡样本的互联网个人信用评估研究被引量:22
- 2017年
- 国内互联网金融和消费信贷的迅猛发展,催生了互联网个人征信的巨大需求。针对不平衡的互联网征信数据,采用随机过抽样、随机欠抽样和SMOTE方法进行数据平衡化,并建立决策树、支持向量机和随机森林等分类模型对互联网个人信用评估进行研究,结果表明:互联网大数据背景下的个人信用评估研究具有可行性;过抽样方法可以较好地提高互联网个人信用评估模型的分类性能;构建信用等级较好用户的一般特质,即年龄在18~30岁之间、工资水平在2 000元以上、用户页面浏览量多集中在10~20次之间和申请贷款时间相对较早等。在对互联网个人信用评估中变量有效性进行探索的基础上,反驳了"采用的变量越多结果就越准确"的说法。
- 李毅姜天英刘亚茹
- 多元主体协同促进全民阅读活动的策略研究——基于2013年中韩两国全民阅读调查数据的比较与思考被引量:3
- 2015年
- 基于2013年中国与韩国两国国民阅读相关数据,依据阅读率、阅读量、阅读时间、阅读评价、城乡阅读差异等指标对两国阅读现状进行比较分析,指出全民阅读所涉及的多元主体并比较两国全民阅读推进过程中多元主体对其产生的影响因素,在此基础上提出多元主体协同促进全民阅读的策略。
- 严贝妮李宇佳李毅
- 关键词:中韩调查数据
- 基于DEA分析的中部六省高等教育与经济发展的关系研究被引量:10
- 2017年
- 国家的"十二五"和"十三五"发展规划均将高等教育的发展提升到重要高度,同时结合高等教育供给侧改革,研究中部六省的高等教育与经济增长的效率关系。得出河南省的高等教育规模一直处于最优水平,湖南省经过"十二五"规划同样达到最优规模;而山西省的高等教育与经济增长的发展并不相适应,高等教育规模仍有上升空间。
- 李毅姜天英刘振国
- 关键词:中部六省DEA方法高等教育经济增长
- 大数据挖掘的均匀抽样设计及数值分析被引量:9
- 2015年
- 就大数据生成过程的多维性、稀疏性和动态性等特征而言,大数据集并不等于统计总体,即便对于静态大数据集,随机抽样同样有着不可或缺的参数估计和总体推断的方法论价值。在大型数据分析中,常常遇到需要降低维度和减少计算量但又不知如何抽样处理的问题。因此,提出均匀抽样在大数据挖掘中应用的基本策略,并使用模拟数据和医学胎心宫缩监护数据集进行数值分析。结果表明:均匀抽样在降低决策树、adaboost、bagging和随机森林的误差率上优于现有文献的常用方法,这一策略能为面向大数据的数据挖掘方法提供参考,也为针对大数据分析的抽样有效性提供佐证。
- 李毅米子川
- 关键词:均匀设计数据挖掘
- 过程性学习投入对大学生学习成绩的影响——基于NSSE测量的比较被引量:4
- 2018年
- 通过改进NSSE调查问卷,对地方院校大学生的过程性学习投入进行了问卷调查,并在主要过程性指标上与清华大学等高校进行了对比分析。研究表明,地方高校学生在学业挑战度、生师互动水平、校园环境支持度等方面与国内外一流大学均存在较大差距,这些差距直接导致了学生培养质量的差异。只有改进培养过程,提高主动性作业的学业挑战度,增加生师互动的渠道和频率,改善校园环境的人性化程度,才能培养学生良好的习惯与优秀的个人素养。
- 米子川李毅郭亚楠
- 慕课学术论文特征与趋势分析
- 2017年
- 运用多种文献计量分析方法,以中文期刊全文数据库(CNKI)2008-2015年发表的2 689篇与慕课相关的期刊文献为研究对象,从学科、机构、期刊、作者等维度系统梳理了国内慕课领域的研究成果,在绘制高频关键词知识图谱的基础上对慕课的应用前景和趋势进行了分析和展望,以期为该领域的理论研究和教学实践提供参考。
- 李毅杜磊米子川
- 关键词:知识图谱
- 面向SNS大数据的捕获移出模型抽样估计被引量:4
- 2016年
- 捕获移出模型起源于生物种群调查和特殊社会网络的研究,是一种复杂抽样方法,一般用于对不确定群体的总量规模和方差进行估计。本文将改进的捕获移出模型应用到社交网络传播规模的抽样估计中,对网络信息的传播范围和波及人群进行了初步估计,并以近期北京频繁出现的"雾霾"事件的自由传播为例进行了实证分析。研究表明,捕获移出模型可以对社交网络中的热点事件的传播规模和再传播的概率进行有效估计,从而说明社交网络已逐渐成为公共话语空间的重要传播路径和传播方式。面对社交网络的迅速蔓延,本文对大数据环境下的抽样估计方法也进行了初步的探索和实践。
- 米子川李毅
- 关键词:社交网络抽样估计
- 住户调查中初级抽样单元的选择——基于人口网格数据
- 2019年
- 传统住户调查中通常将人口普查数据作为选择初级抽样单元的样本框架,然而普查数据过时往往造成抽样框老化、不能覆盖目标总体。因此,本文以空间人口网格数据作为样本框架,来选择住户调查的初级抽样单元,同时给出住户调查中初级抽样单元中样本权重,从而为设计出更加科学、及时、准确的住户调查方案提供借鉴。
- 李毅段欢芳
- 关键词:住户调查