张耀允
- 作品数:6 被引量:17H指数:2
- 供职机构:哈尔滨工业大学深圳研究生院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文问答系统中时间敏感问句的识别和检索被引量:4
- 2013年
- 当前问答系统如"百度知道"、"SoSo问问"等在问句检索时没有考虑时效性要求,对时间敏感问句不能返回满足时效要求的结果.针对该问题,设计了时间敏感问句的识别和检索方法:首先依据时效要求对问句进行分类,识别出时间敏感问句,然后解析时间敏感问句的时效区间,最后根据解析结果对问句检索结果进行过滤,得到满足时效要求的结果.问句分类采用词法、句法和语义等特征,使用决策树、朴素贝叶斯、SVM等机器学习方法进行测试.问句的时效区间使用构造的时间域表达式计算获得.实验表明,使用C5.0决策树进行时间敏感问句的识别准确率达到0.901;与未考虑时间敏感问题的系统相比,时间敏感问句检索结果平均精度得到较大改善.
- 侯永帅张耀允王晓龙陈清财王宇亮户保田
- 关键词:问句分类问答系统
- 基于用户意图分析的交互式问答技术研究
- 随着海量网络信息的积累和规模的高速增长,准确快捷地找到自己所需要的信息已成为人们迫切的需求。自动问答系统,通过理解用户自然语言形式的问句,返回答案或包含答案的文本片段,在一定程度上提高了用户信息检索的效率和准确性。自动问...
- 张耀允
- 关键词:言语行为信息检索上下文相关
- 文献传递
- 面向开放的限定领域的交互式问答语料分析
- 交互式问答是国际问答技术领域新兴的热门研究方向。它结合自动问答与对话系统技术,可以处理系列相关问题,并能与用户进行对话式交互,但是目前在中文问答领域开展的相关研究还比较少,尤其缺乏对真实环境中大规模交互式问答语料的收集和...
- 张耀允王晓龙王轩徐睿峰侯永帅范士喜
- 关键词:上下文信息语料统计
- 文献传递
- 面向真实环境的问句分析方法被引量:11
- 2010年
- 面向真实环境的问答系统是近年来研究的热点,针对系统中问句的复杂性,提出问句信息块标注的分析方法——QICA.该方法将问句信息分为五类,通过标注这五类信息,将问句从表层的文字空间映射到结构化的语义空间.结合大间隔马尔可夫模型实现了自动标注系统.将QICA结果应用于问句复述识别问题,验证了该方法的有效性.
- 范士喜王晓龙王轩张耀允
- 关键词:问答系统
- 基于常问问题集的金融自动问答系统的研究
- 随着金融业在中国的快速发展,社会对金融领域的信息需求日益扩大。国民迫切需要一个能够针对金融领域答疑解惑的工具。然而问答系统研究长期以来主要关注的事实类问题只占现实生活中人们所提出的问题的一小部分,远远不能满足社会对问答系...
- 张耀允
- 关键词:金融体系自动问答系统自动识别特征提取
- 文献传递
- 基于改进的模糊C均值算法的多文档自动文摘
- 中文语句隶属于类的模糊性,本文提出了一种改进的模糊C均值聚类算法确定多文档集合的潜在子主题.为了减小初值选取不当对模糊C均值算法产生的影响,该方法结合训练阈值的层次聚类算法以及样本密度算法投票生成初始聚类中心,初始化模糊...
- 郝志新王轩姚霖张耀允
- 关键词:MULTI-DOCUMENTSUMMARIZATIONC-MEANSHIERARCHICALSAMPLE