博士后科研启动基金(XJNUBS1111)
- 作品数:2 被引量:13H指数:2
- 相关作者:栾静张海军李勇齐向伟潘伟民更多>>
- 相关机构:新疆师范大学中国科学技术大学更多>>
- 发文基金:博士后科研启动基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种自定义顺序的字符串排序算法被引量:4
- 2012年
- 现有的排序算法很难实现自定义顺序的字符串排序,提出一种自定义顺序的字符串快速排序方法.在应用连续编号定义字符排序顺序的基础上,使用哈希表结构将字符串转换成对应的整型数组,以字符的最大编号作为基数排序算法的新基数,实现字符串的基数排序.分析和实验表明,本文方法可有效实现自定义顺序的字符串排序,是一个时间和空间复杂度都是线性的排序算法,比快速排序(Quick Sort)具有更好的时间性能,且可以方便地推广到其它语言的字串排序中.
- 张海军潘伟民木妮娜栾静
- 关键词:哈希表
- 基于统计学习框架的中文新词检测方法被引量:10
- 2012年
- 新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难。提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系。在此基础上提出应用统计学习模型作为框架来整合不同类型的可用特征,以充分发挥特征之间的组合作用,进一步改善新词检测效果。实验表明,统计框架方法的性能明显地优于特征的简单叠加,能有效提高新词检测效果,开放实验和封闭实验的F值分别为49.72%和69.83%,达到了目前的较好水平。
- 张海军栾静李勇齐向伟
- 关键词:统计框架统计特征