您的位置: 专家智库
>
资助详情>
新疆维吾尔自治区高校科研计划(XJEDU2006113)
新疆维吾尔自治区高校科研计划(XJEDU2006113)
- 作品数:9 被引量:17H指数:3
- 相关作者:艾斯卡尔艾木都拉维尼拉·木沙江薛中奇赵丽红海丽且木·艾沙更多>>
- 相关机构:新疆大学更多>>
- 发文基金:新疆维吾尔自治区高校科研计划国家自然科学基金新疆维吾尔自治区高技术研究发展计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 维、哈、柯文搜索引擎中自动分类技术的应用研究
- 本文在传统搜索引擎基础上,结合网页自动分类技术,对基于分类的维、哈、柯多语种信息检索进行了研究。文中提出了一种改进的特征选择算法,并建立了一个维吾尔文网页分类系统,搜集了大量的维文语料进行分类实验。结果表明,使用改进的特...
- 王珍维尼拉·木沙江赵丽红
- 关键词:信息检索搜索引擎
- 文献传递
- 维、哈、柯多文种全文搜索引擎的设计与实现被引量:5
- 2009年
- 在现有基于Web的全文信息检索技术的基础上,深入研究维、哈、柯文网络信息检索现状和维、哈、柯文语言文字计算机处理方面的关键问题,介绍基于Web的维、哈、柯全文搜索引擎的设计和实现。通过一个少数民族语种的搜索引擎的设计和实现,详细描述维、哈、柯多文种全文搜索引擎系统结构,每个模块的功能、关键问题及解决方法,为维、哈、柯少数民族网络用户提供了全新的信息检索技术和手段。
- 吐尔地.托合提维尼拉.木沙江艾斯卡尔艾木都拉
- 维、哈、柯全文搜索引擎中查询处理研究与实现
- 本文研究了基于web的维、哈、柯多文种全文搜索引擎中一系列查询处理难题:用户查询请求的快速响应、对查询短语必要的预处理、基于词根的索引及查询、查询结果的有效组织、网页摘要的动态生成,以及以本民族风格显示搜索结果等。在设计...
- 吐尔地·托合提维尼拉·木沙江艾斯卡尔·艾木都拉
- 关键词:倒排索引
- 文献传递
- 维、哈、柯多语种搜索引擎中改进索引创建的新方法的构思
- 2011年
- 通过对目前处于研究发展阶段的后缀数组技术与倒排索引技术的简单介绍,并对两者的优缺点进行了对比,对维、哈、柯文搜索引擎的索引创建进行改进的新方法提出了构思,以实现查询效率和查准率的提高。
- 赵丽红维尼拉·木沙江
- 关键词:索引技术倒排索引后缀数组
- 维吾尔文搜索引擎中的压缩技术
- 2011年
- 在对常用压缩技术进行介绍的基础上,结合维吾尔语代码特点来选择合适的压缩技术对文本进行压缩,以实现压缩率的提高,从而减少搜索引擎对数据空间要求。通过初步实验验证所选方法具有一定的正确性,取得了一定的效果。
- 薛中奇维尼拉.木沙江赵丽红
- 关键词:数据压缩维吾尔语搜索引擎
- 维、哈、柯多文种搜索引擎中web文本分类的研究被引量:3
- 2011年
- 研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN的Web文本分类方法,并结合具体实验在对数据进行预处理的基础上实现了改进的KNN分类算法.实验表明,改进的KNN方法在维吾尔文Web文本分类中能够获得较好的分类效果.
- 海丽且木.艾沙维尼拉.木沙江
- 关键词:WEB文本分类KNN算法特征提取维吾尔文
- 网页分类及其维文信息检索中的应用研究被引量:2
- 2011年
- 研究维文信息检索中网页分类问题。在维文信息预处理,文档特征词组抽取和信息检索模型的建立等方面做了一些探讨。提出一种引入网页分类和词组抽取技术的信息检索方法。采用了基于KNN的网页分类方法,此方法符合雏文语言特点,能够提高信息检索系统的查询准确率,使得返回结果更符合用户检索需求。
- 海丽且木·艾沙维尼拉·木沙江
- 关键词:网页分类
- 维、哈、柯全文搜索引擎检索器的关键技术被引量:4
- 2008年
- 研究维、哈、柯全文搜索引擎检索器的关键问题,提出有效的解决方法,包括在用户计算机没有安装本地输入法和字库的情况下输入维、哈、柯文检索词并正常显示搜索结果,针对具有高拼写错误率的维、哈、柯文检索词进行检错、纠错处理,返回给用户正确而全面的搜索结果等。实验结果表明,该方法为用户提供方便的同时明显提高了维、哈、柯文搜索引擎的查全率和查准率。
- 吐尔地.托合提维尼拉.木沙江艾斯卡尔艾木都拉
- 关键词:检错纠错
- 维吾尔文文本的压缩技术研究
- 2012年
- 对维吾尔语特点分析的基础上,结合数据压缩技术选择LZW算法对维吾尔文文本进行压缩,提高压缩率、减少数据存储空间.实验结果表明,改进后的算法对维吾尔文文本具有较高的压缩率.
- 薛中奇维尼拉.木沙江
- 关键词:维吾尔文数据压缩LZW
- 电子词典软件系统中对维、哈、柯文进行自动判别技术的研究被引量:4
- 2011年
- 本文以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,针对语种相关的词语书写方向识别,词语的文种识别,提出了相应的解决方案:通过XML的标注属性和字母的Unicode区域从属关系来判断词语的书写方向;通过计算组成词语的各个字母来自不同语言的概率来判断词语的文种,应用结果表明该技术方案具有可行性和有效性.
- 买日旦.吾守尔维尼拉.木沙江
- 关键词:电子词典多语种自动判别XML