杨志宏
- 作品数:1 被引量:3H指数:1
- 供职机构:中国人民解放军海军装备部更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于条件随机场的中文分词算法改进被引量:3
- 2012年
- 在中文分词领域,基于字标注的方法得到广泛应用,通过字标注分词问题可转换为序列标注问题,现在分词效果最好的是基于条件随机场(CRFs)的标注模型。作战命令的分词是进行作战指令自动生成的基础,在将CRFs模型应用到作战命令分词时,时间和空间复杂度非常高。为提高效率,对模型进行分析,根据特征选择算法选取特征子集,有效降低分词的时间与空间开销。利用CRFs置信度对分词结果进行后处理,进一步提高分词精确度。实验结果表明,特征选择算法及分词后处理方法可提高中文分词识别性能。
- 顾佼佼杨志宏姜文志胡文萱
- 关键词:中文分词条件随机场置信度