陈挺
- 作品数:11 被引量:59H指数:5
- 供职机构:中国科学院文献情报中心更多>>
- 发文基金:国家自然科学基金国家科技支撑计划北京市社会科学基金更多>>
- 相关领域:文化科学天文地球生物学更多>>
- 利用OSGi的科技情报分析集成服务架构研究与应用被引量:6
- 2014年
- 【目的】实现各种情报分析工具和流程的有效整合。【应用背景】复杂、复合的情报分析工作往往需要利用分布、异构的多种分析工具和数据资源,需要建立可靠和灵活的机制实现这些工具的无缝集成。【方法】研究基于OSGi的情报分析服务整体架构,设计插件服务的模型与插件服务的配置方案,制定插件服务的集成机制。【结果】实现模块化、动态化管理多个情报工具的世界科技态势监测分析服务平台。【结论】基于OSGi的科技情报分析集成服务框架,可灵活支持科技情报分析服务需求,同时对第三方情报分析工具以及情报分析算法的封装与集成提供了技术支持。
- 钱力张晓林李春旺王小梅杨立英陈挺张智雄
- 关键词:OSGIFLEX信息可视化
- 基于Altmetrics指标识别的研究热点对比分析——以生物学领域为例被引量:3
- 2019年
- 研究热点通常采用高被引论文的聚类来识别,但被引次数需要时间积累。Altmetrics指标具有良好的即时性,采用相关指标识别研究热点有可能提高时效性。本文重点分析基于Altmetrics指标与高被引论文识别的研究热点之间的异同以及背后的原因,以探究基于Altmetrics指标识别的研究热点是否适合作为前沿趋势探测和科技政策制定的辅助依据。本文选取生物学领域2013年7月1日—2014年6月30日发表的论文,分析基于Altmetrics分数、Twitter指标、Mendeley指标、被引次数4个指标识别的研究热点之间的关系。分析发现:基于Altmetrics分数和Twitter指标识别的研究热点较为接近,主要反映公众热门话题;基于高被引论文识别的研究热点更加反映科研人员的关注点,更大程度上代表了学术界的研究前沿;基于Mendeley指标识别的研究热点综合了上述两类热点,既有公众较为关心的科普主题,也有学术界关注的研究前沿。
- 迟培娟陈挺陈挺冷伏海
- 关键词:TWITTER被引次数
- 基于可视化的基金资助热点及其演化发现方法研究被引量:6
- 2020年
- 【目的】设计基于可视化的基金资助热点发现方法,用于分析科研立项重点以及发现其演化过程。【方法】基于NASA小企业研发计划基金申请书的文本特征,绘制连续时间窗口下基金资助图谱,通过识别图谱中项目密度分布较高的区域定位资助热点,并根据两期图谱中热点位置、内容变化分析研判资助热点演变趋势。【结果】在两个时间窗口内,可明确区分出消亡的、持续的和新兴的资助热点及其演化过程。【局限】分析方法中涉及文本特征提取、可视化与概率密度计算等多个步骤需要多次调优,热点与演化判断分析尚未形成计算指标,无法脱离领域专家的判读。【结论】本文提出的基于可视化图谱的基金资助热点及其演化的发现方法,可直观地反映资助机构的资助布局热点变化情况,经领域专家判读与其认知相符,或可在科研管理与决策者审视宏观科研布局中起到辅助作用。
- 陈挺王海名王小梅
- 关键词:可视化
- 基于t-SNE降维的科学基金资助项目可视化方法研究被引量:17
- 2018年
- 【目的】设计主题模型结合流形学习文本特征降维可视化方案,更有效地发现与更直观地展示科研基金资助布局。【方法】基于美国NSF信息与智能系统(IIS)10年(2008–2017)的基金资助项目数据,利用聚类算法结合人工判读构建项目主题标签;利用TF-IDF向量空间模型与LSA潜在语义分析主题模型分别构建项目申请书高维特征,采用流形学习中t-SNE非线性降维算法将高维特征映射到二维或三维空间中可视化展示;基于构建的项目主题标签结合人工判读检验可视化效果。【结果】实验结果表明,t-SNE算法结合潜在语义分析模型在实验数据降维效果明显,可视化图谱不论在二维还是三维空间中,相同主题项目有较好的聚集性,主题间同样显示了清晰的轮廓和分界。【局限】算法参数的预设与调整需人工参与,未对不同资助机构的基金文本数据的适用性进行验证。【结论】该方法是可行的且可视化图谱能够直观地反映资助机构的资助布局,对科研管理与决策者审视宏观科研布局能够起到辅助作用。
- 陈挺李国鹏王小梅
- 关键词:科学基金项目LSA可视化图谱
- 神经科学领域前沿发展态势研究:基于ESI研究前沿的深度挖掘分析被引量:2
- 2023年
- 本文构建了基于ESI研究前沿的深度挖掘方案,通过研究前沿之间的共被引网络聚焦领域研究热点、主题词共现识别神经科学领域研究重点主题;利用KeyBERT模型对研究前沿核心文献和施引文献的标题与摘要进行关键词识别,分析关键词热度年际变化,深入揭示神经科学领域研究前沿热点发展趋势;通过对研究前沿核心文献及其施引文献和参考文献进行国别分析,反映世界各国在神经科学领域研究前沿发展的学科影响力,并进一步分析中国在神经科学领域研究前沿的覆盖度和活跃度。分析表明:阿尔茨海默病、帕金森病、多发性硬化症等神经系统疾病是全球神经科学领域研究最广泛深入的重点主题,脑机接口、血清神经丝轻链蛋白、非侵入性脑刺激技术等是近年来的新兴研究热点,感染新冠病毒对神经系统的影响、新冠肺炎病人的神经系统表现以及一线医务人员的心理健康等疫情相关主题也成为近两年神经科学领域的研究热点。近年来我国在神经科学领域研究前沿的覆盖度和活跃度升高,研究前沿引领度、贡献度和参与度均有较大提升,在新冠疫情相关主题、肠道微生物菌群、靶向治疗、人工感觉神经等研究方向具有一定发展优势,在阿尔茨海默病、脑功能网络、卒中、神经性疼痛、胶质瘤等方向具有一定的发展潜力。
- 谢秀芳王茜陈挺陈挺
- 关键词:神经科学阿尔茨海默病
- 基于人工智能专利图谱的技术热点发现以及演化分析被引量:6
- 2021年
- 人工智能在近几年快速发展并成为最热门的技术之一,如能快速了解人工智能技术热点与发展态势,对抢抓人工智能发展的重大战略机遇与构筑先发优势具有重要意义。本文提出了一种基于专利可视化图谱发现技术热点的方法,即在连续时间窗口上绘制图谱,在此基础上运用密度分布变化来识别该领域技术热点。为了提升专利图谱的准确性,本文使用海量专利文本训练了基于深度学习的doc2vec模型,形成了专利文本特征抽取模型。经过实验对比发现该模型在测试数据集中表现远超经典的词袋模型与主题模型。在实例分析中使用了2012—2019年10457件三方人工智能专利进行热点发现,共发现研究热点7个,并对7个热点中关键概念词、专利申请人所属国家进行深入分析。
- 陈挺邓启平邓启平王小梅
- 关键词:可视化人工智能
- Altmetrics与引文指标相关性研究被引量:12
- 2018年
- 【目的】研究高质量期刊中论文的Altmetrics指标的相关特性,包括与被引次数相关性、学科差异性、分项指标的贡献度等,对比分析与已有基于全论文数据集分析结果的差异性,为正确理解和使用Altmetrics指标提供借鉴。【方法】选取Nature Index的68种高质量期刊为数据源,利用机器学习方法对论文进行学科分类,采用Spearman相关性分析方法,分析Altmetrics与被引次数之间的相关性及在各个学科中的差别,以及Altmetrics各分项指标的贡献度,并利用ROC曲线评估Altmetrics识别高被引论文的有效性。【结果】Altmetrics与被引次数的相关性存在学科差异;高质量期刊中,论文的Altmetrics分值与被引次数间的相关性增强;News、Blog、Twitter对Altmetrics得分的贡献度增大;Altmetrics有助于识别高被引论文。【局限】所选数据集覆盖年限较短,未进一步根据学科特点扩展数据集。【结论】对比以往全数据集的研究结果,Altmetrics在高质量期刊中的表现具有独特性,Altmetrics与被引次数之间具有强相关性。
- 吴朋民陈挺王小梅
- 关键词:被引次数ROC曲线分析
- 优化科学知识图谱方法绘制全领域科学结构图谱被引量:4
- 2022年
- [目的/意义]针对目前全领域科学知识图谱构建方法中存在的技术难点,结合网络嵌入模型、机器学习聚类、流形学习可视化算法等人工智能领域的方法与模型,提出一套全新发现科学结构的知识图谱构建方案,以完善科学结构发现与可视化布局,并拓展科学知识图谱的分析应用场景。[方法/过程]引入基于深度学习的网络嵌入模型和聚类方法改进原有的网络社团划分聚类方法,利用流形学习降维可视化算法扩大数据处理能力,并设计由下至上分层可视化布局方法,提升可视化图谱的稳定性与细节揭示能力。[结果/结论]以科睿唯安公司的基本科学指标数据库(ESI)研究前沿中高被引论文作为分析数据集,使用新聚类算法得到1169个研究领域,通过改进的可视化布局算法形成全领域科学结构图谱。与前几期科学结构图谱相比,本文提出的方法支持更大规模的数据分析,对可视化细节揭示与稳定性也有大幅优化,可以更好地展示全领域科学研究宏观结构及内在关系,为全领域科学知识图谱的绘制与构建提供更可靠的方法和技术支持。
- 陈挺陈挺王小梅
- 关键词:引文网络网络嵌入聚类可视化
- 科研项目布局差异对比方法研究——以NSF和EU FP项目为例被引量:3
- 2015年
- 【目的】弥补目前科研项目布局分析往往局限在单一资助机构简单数量统计上的不足,从内容上提高资助机构布局差异的揭示能力。【方法】针对多源项目数据,提出一种基于文本K-means++聚类算法的分析方法,尝试从科研项目内容揭示不同资助机构的资助方向和布局重点,分析比较各资助机构在研究方向上的资助差异。【结果】使用美国NSF与欧盟FP资助的项目信息进行方法验证与案例分析,发现相对于多个关键词,基于单个关键词构建的文本特征空间有更好的聚类效果。进一步去除项目申请书摘要中项目背景、未来影响等干扰信息,只保留研究内容、研究方法等实质性研究描述文本,K-means++算法的聚类效果有进一步提升。【局限】数据清洗尚不能完全自动实现,聚类参数的预设与调整也需人工参与。【结论】实验与案例证明该方法是可行的,分析结果能够比较直观地反映资助机构的布局差异,对科研管理与决策者审视宏观科研布局、前瞻科技发展方向起到一定的辅助作用。
- 陈挺韩涛李泽霞李国鹏王小梅
- ng-info-chart:基于自定义HTML标签的交互式可视化组件被引量:1
- 2016年
- 【目的】设计并实现基于模型–视图–控制器(MVC)前端Angular JS框架的可视化组件ng-info-chart。【应用背景】优秀的情报分析平台往往需要使用多个复杂的可视化图谱组合展示分析结果,需要更有效地构建复杂的、支持大量交互操作的网页端情报分析可视化图谱。【方法】ng-info-chart集成多种可视化图谱,使用Angular JS自定义扩展标签统一封装,通过自定义HTML标签直接在页面中调用绘图方法。【结果】ng-info-chart可视化组件随着研究团队情报分析项目不断深入与完善,现已集成5个第三方可视化类库中11种可视化图谱,支持IE9+、Firefox等主流桌面浏览器。【结论】利用可视化组件实现数据异步获取、自动检测数据变化与实时图谱绘制等功能,极大简化了情报分析系统中复杂可视化图谱的开发工作。
- 陈挺王小梅吕伟民
- 关键词:可视化