努尔艾力·喀迪尔
- 作品数:3 被引量:6H指数:1
- 供职机构:清华大学电子工程系更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于SRILM的阿拉伯和维吾尔文语言模型建立方法
- 本文主要讨论在Cygwin的环境下利用SRILM工具包建立基于词的阿拉伯文和维吾尔文语言模型并在语料库上进行测试。为了解决数据稀疏问题,我们主要研究几种平滑算法。我们采用"困惑度"作为评价语言模型性能的指标。最后,本文给...
- 努尔艾力·喀迪尔彭良瑞
- 关键词:阿拉伯语维吾尔语N-GRAM语言模型
- 文献传递
- 一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法被引量:6
- 2015年
- 维吾尔文和阿拉伯文是采用阿拉伯文字母的从右向左书写的连写文字。它们识别方法的研究对于多文种文本图像内容的利用具有重要意义。利用HTK工具包,分别建立基于隐马尔科夫模型HMM(Hidden Markov Model)的印刷体维吾尔文和阿拉伯文识别系统,其中特征提取部分采用分布密度特征和局部方向特征。研究利用HTK工具建立维吾尔文和阿拉伯文统计语言模型,并将语言模型用于改进识别系统性能。实验结果表明采用统计语言模型可有效提高文字识别系统性能。其中,在包含24 000个单词的印刷体维吾尔文测试集上,通过利用语言模型识别率从78.28%提高到97.45%;在包含759个单词的印刷体阿拉伯文测试集上,通过利用语言模型识别率从79.07%提高到85.80%。
- 努尔艾力·喀迪尔彭良瑞哈力木拉提
- 关键词:隐马尔科夫模型统计语言模型维吾尔文阿拉伯文
- 基于SRILM的阿拉伯和维吾尔文语言模型建立方法
- 本文主要讨论在Cygwin的环境下利用SRILM工具包建立基于词的阿拉伯文和维吾尔文语言模型并在语料库上进行测试。为了解决数据稀疏问题,我们主要研究几种平滑算法。我们采用“困惑度”作为评价语言模型性能的指标。最后,本文给...
- 努尔艾力·喀迪尔彭良瑞
- 关键词:阿拉伯语维吾尔语N-GRAM语言模型
- 文献传递