李娜
- 作品数:2 被引量:5H指数:1
- 供职机构:沈阳化工学院计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于计算机自动分词的研究被引量:5
- 2008年
- 时代发展对中文分词的要求越来越高,在原有机械分词方法中双向匹配理论的基础上,对其进行改进,以提高分词的速度和准确率.在原方法上分别为正向匹配和逆向匹配增加了一个词头表,利用Java语言中Map和Set具有Hash结构的特性,进行程序设计.设计以《红楼梦》为例,对改进的方法进行测试,结果证明改进的方法可行,与原有方法比较,在速度上和准确率上都有较大的提高.
- 李瑞芳孙健李娜
- 关键词:中文分词JAVA
- 基于数据挖掘的文本人物结构以及事件专题研究
- 2008年
- 利用数据挖掘技术对文本人物结构以及事件专题进行信息挖掘.提出一种基于树结构的人物结构挖掘算法,构建一种按照自顶向下的层次等级分布的人物结构图,给出一种查找核心成员的算法.针对文本中事件专题挖掘,提出事件模型学习算法.以《红楼梦》为实例验证人物结构以及事件专题的文本挖掘,结果证明该方法可行.
- 李娜李瑞芳孙健
- 关键词:数据挖掘树结构