您的位置: 专家智库 > >

陈长松

作品数:3 被引量:22H指数:2
供职机构:公安部第三研究所更多>>
发文基金:上海市科学技术委员会资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇用户
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇索引
  • 1篇网络
  • 1篇文本处理
  • 1篇向量
  • 1篇向量机
  • 1篇协处理
  • 1篇协处理器
  • 1篇决策树
  • 1篇贝叶斯
  • 1篇编程
  • 1篇编程语言
  • 1篇HBASE
  • 1篇处理器

机构

  • 3篇公安部第三研...

作者

  • 3篇丁飞
  • 3篇陈长松
  • 2篇杨涛
  • 2篇张岩峰
  • 1篇张涛

传媒

  • 2篇计算机应用
  • 1篇计算机工程与...

年份

  • 2篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
TXL编程语言及其应用被引量:1
2015年
针对常用文本处理工具、方法中无法有效地对上下文无关语法描述的源代码进行结构查询、匹配这一问题,提出基于TXL语言语法编程功能的解决方法。TXL是一种语言转换和快速原型构建系统,其核心是TXL编程语言。利用其强大的语法编程功能,可以轻松实现对任意可以用上下文无关语法描述的语言进行解析变换,实现特定结构的匹配、检索与转换功能。介绍TXL语言基本概念及使用方法,结合日常工作经验介绍其在文本处理、编程语言处理与转换等方面的应用。实践证明,TXL编程能有效解决传统文本处理工具在词法标记、语法解析及代码转换上的实现代价,实现高效率的源码文本处理功能。
丁飞陈长松
关键词:文本处理
基于协处理器的HBase区域级第二索引研究与实现被引量:16
2014年
针对HBase全表扫描查询效率问题,对HBase第二索引功能进行研究,实现一种基于HBase协处理器的服务端区域级第二索引扩展功能。通过将索引维护与查询放到服务端完成,极大地减少了网络通信开销。索引文件使用HFile格式组织。利用HFile成熟的编程接口以及高效的读写性能,使得索引维护变得简单易行,也保证了索引读写的效率,提供了高效的查询性能。实践表明,该索引扩展机制能有效地满足集群应用中对大数据集的第二索引查询功能需求。
丁飞陈长松张涛杨涛张岩峰
关键词:协处理器
微博用户的个性分类分析被引量:5
2015年
社交网络给每个社会中的人提供了自由表达个人情感、观点、兴趣、建议等言论的平台。用户在这些平台上发表的言论、所做的行为以及用户在平台上建立的社交圈子也给数据挖掘带来了新的数据和机会。提出了一种利用用户在微博上的公开数据信息实现对该用户的MBTI个性维度进行分类分析的方法。在该方法中,基于对用户微博数据的分析,提出了能够表征用户心理和行为的文本和非文本特征,然后采用三种机器学习的分类方法—提升决策树、支持向量机和贝叶斯逻辑递归来对微博用户的个性进行分类分析。实验结果表明,通过对微博数据的挖掘可以在不同MBTI个性维度上达到75%-90%的准确率。
张岩峰陈长松杨涛左俐俐丁飞
关键词:社交网络支持向量机
共1页<1>
聚类工具0