杨娜
- 作品数:4 被引量:4H指数:2
- 供职机构:南开大学信息技术科学学院计算机科学与信息安全系更多>>
- 发文基金:天津市科技发展战略研究计划项目天津市应用基础与前沿技术研究计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 元素路径模型:高效的XML Schema提取方法被引量:2
- 2008年
- 提出基于元素路径模型(EPM)的XML Schema提取方法,旨在提高Hegewald等提出的XStruct系统的运行效率。基于EPM的方法使用SAX解析XML文档,提取XML元素路径模型并根据规则进行合并,得到XML元素序列表达式进而生成XMLSchema。实验结果表明,基于元素路径模型方法的时间空间代价均优于XStruct系统。
- 张海威袁晓洁杨娜王鑫
- 一种Web问答系统中基于XML片段的语义项模型被引量:2
- 2007年
- 问答网络论坛是一种重要的互联网服务形式. Yahoo Answers,Live QnA和百度知道均属此项服务.基于问答论坛所持有的大规模主题数据,可以建立诸多有价值的应用.自动问答系统就是其中之一,它在最近几年十分流行,尤其当TREC的问答方向出现之后.然而,仅采用信息检索方法会造成大量语义信息未能充分利用,问答系统的性能不够令人满意.为利用更多信息,定义一种语义项模型,作为信息检索中文档标引项的改进.语义项以XML片段形式存储,利用语法结构,将自然语言处理中的语义信息引入信息检索.基于语义项而代替标引项构建的问答系统,上层信息检索模型不做任何改动即可得到改善,显示出更好的性能.
- 于士涛袁晓洁师建兴杨娜
- 关键词:问答系统向量空间模型
- 阈值区间:一种基于XCLS和XCLSE的改进方案
- 分析了XML文档聚类的应用趋势与前景,提出了XML聚类算法所面临的一些问题.详细介绍了由Richi Nayak提出的快速而高效的增量式XML文档聚类算法XCLS和XCLSE.算法提出一种新的XML数据表示结构Level ...
- 刘众奇袁晓洁张海威杨娜王敏辉
- 文献传递
- 阈值区间:一种基于XCLS和XCLSE的改进方案
- 分析了XML文档聚类的应用趋势与前景,提出了XML聚类算法所面临的一些问题。详细介绍了由Richi Nayak提出的快速而高效的增量式XML文档聚类算法XCLS和XCLSE.算法提出一种新的XML数据表示结构Level ...
- 刘众奇袁晓洁张海威杨娜王敏辉
- 关键词:语义信息
- 文献传递