教育部科学技术研究重点项目(03144)
- 作品数:4 被引量:11H指数:2
- 相关作者:康耀红赵正文温小斌李太君张春元更多>>
- 相关机构:海南大学更多>>
- 发文基金:教育部科学技术研究重点项目海南省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Web信息检索结构化排序函数与标引词加权技术被引量:1
- 2007年
- 分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息检索排序函数和标引词加权技术。分析了Web文档的特点,指出其主要形式HTML文档是一种结构化文档,结构由标签显式地定义,不同文档结构对检索性能的贡献不同。对本领域国内外学者的成果作了对比研究。最后探讨了Web信息检索排序函数及标引词加权技术的发展方向。
- 赵正文康耀红
- 关键词:排序函数文档结构搜索引擎
- 统计语言模型在信息检索中的应用被引量:4
- 2006年
- 首先介绍了统计语言模型(SLM)的发展及常用的N元(n-gram)模型,对信息检索过程中的主要模型作了公式化描述并比较了不同模型,指出了它们之间及与传统概率检索方法的异同,分析了统计语言模型的弱点,最后介绍了对其可能的改进方法及最新研究进展,讨论了在中文信息检索中的应用和面对的挑战。
- 赵正文康耀红
- 关键词:统计语言模型信息检索
- 基于投影法的图像检索被引量:5
- 2005年
- 全局颜色直方图无法体现图像颜色的空间分布情况,为了克服这一缺陷,提出了利用投影法进行图像检索的算法。利用HS I颜色模型,把图像的色调、饱和度和亮度分量分别在水平和垂直两个方向上投影,得到6个投影直方图。色调和饱和度的投影直方图反映了颜色的空间分布,而亮度的投影直方图则体现了图像的形状。然后,使用这6个投影直方图的前三阶中心矩作为特征,计算图像间的距离。实验结果表明,该算法检索速度快,具有较高的查全率和查准率。
- 温小斌康耀红李太君
- 关键词:图像投影图像检索投影直方图颜色直方图
- 基于示例的Web信息自动获取系统的设计与实现被引量:1
- 2005年
- 介绍了一个基于多层体系结构的个性化W eb信息自动获取系统的设计与实现,提出了一种新的基于少量中文示例W eb页面的兴趣特征抽取算法,并给出了系统的检全率和检准率测试结果。实验结果表明,较基于关键词的搜索引擎而言,该系统能充分考虑用户的兴趣偏好(示例),长期、主动地向用户提供更加准确的W eb信息获取服务。
- 张春元康耀红
- 关键词:特征抽取个性化