宋丹
- 作品数:11 被引量:47H指数:3
- 供职机构:大连理工大学电子科学与技术学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金“十一五”国家科技支撑计划教育部留学回国人员科研启动基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理语言文字更多>>
- 基于改进向量空间模型的话题识别与跟踪被引量:32
- 2006年
- 话题识别与跟踪旨在发展一系列基于事件的信息组织技术,通过监测以实现对新闻媒体信息流中新话题的自动识别和已知话题的动态跟踪。文中提供一种利用改进的向量空间模型进行识别和跟踪的方法。没有使用传统向量空间模型中单个向量,而是按照语义将特征词划分为4个组(人物、时间、地点、内容)并形成4个向量空间。每个空间进行独立的权重计算和相似度计算。实验证明这些方法是有效的。
- 宋丹王卫东陈英
- 关键词:话题识别与跟踪向量空间模型
- 基于语义框架的话题跟踪方法
- 话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术。话题跟踪任务就是根据话题相关的训练新闻报道,在后续报道中发现与这个话题相关的所有报道。针对传统的向量空间模型的不足,文章提出了一种利用语义框...
- 林鸿飞宋丹杨志豪
- 关键词:语义框架向量空间模型
- 文献传递
- 以XML扩充的MVC设计模式被引量:7
- 2005年
- MVC设计模式最大限度地解除了应用程序各层次间的耦合,使开发维护变得简洁、高效,已经成为基于Web的J2EE应用中广泛采用的设计模式。然而随着应用的不断扩展,传统的MVC模式显得力不从心,无论是前端的View还是后端的Model都需要一定程度的扩充才能适应复杂应用的要求。给出了使用XML技术改进的MVC设计模式,用来解决传统MVC设计模式中存在的多客户端问题、Java代码嵌入问题、异构数据库交互问题。
- 牛纪桢陆坤宋丹
- 关键词:J2EEMVCXML技术设计模式异构数据库
- 术语同义词的自动抽取
- 术语同义词对的自动发现和识别在文献检索领域有若重要的研究意义和应用价值。本文提出一种在文献中自动抽取同义词的方法,它将问题分为(1)抽取同义词对;(2)确认同义词对足否真正匹配,两步的完成都借助了机器学习的方法。实验证明...
- 宋丹师庆辉薛德军林鸿飞
- 关键词:指代消解
- 文献传递
- 基于分解的向量空间模型的Web新闻信息检索被引量:1
- 2006年
- 在分析了传统向量空间检索模型的不足的基础上,给出了一种利用分解的向量空间模型进行Web新闻信息检索的方法.该方法没有使用传统向量空间模型中的单个向量,而是按照语义将特征词划分为4个组(人物,时间,地点,内容)并形成4个向量空间,每个空间进行独立的权重计算和相似度计算.而且将报道中的时间信息标准化,利用地理知识将报道中的地点特征词扩充,并利用这些信息进行检索.实验证明这些方法是有效的.
- 王卫东宋丹宋人杰
- 关键词:信息检索向量空间模型
- 基于引文和内容分析的学科研究热点预测
- 本文提出了一种依据图的“添加有选择性”来预测后续论文最有可能引用哪些现有的文章(热文) 的方法,依据论文与参考文献间的内容相关性,利用主成分分析的方法对热文进行内容分析,进而达到对后续论文中的研究热点进行预测。实验证明这...
- 宋丹师庆辉薛德军林鸿飞
- 关键词:引文分析主成分分析
- 基于分解的向量空间模型的Web新闻信息检索
- 在分析了传统向量空间检索模型的不足的基础上,给出了一种利用分解的向量空间模型进行Web新闻信息检索的方法.该方法没有使用传统向量空间模型中的单个向量,而是按照语义将特征词划分为4个组(人物,时间,地点,内容)并形成4个向...
- 王卫东宋丹宋人杰
- 关键词:信息检索向量空间模型
- 文献传递
- 文本挖掘中的知识模式表示、评价及检索机制被引量:2
- 2008年
- 在当前的文本挖掘中,缺乏检索机制,即使对于挖掘到的简单事实也很难被其他用户检索到,对于知识模式更难达到共享。因此应该建立知识模式库,对文本挖掘得到的知识模式采用统一的表示方式、统一的评价标准、统一的检索机制,让任何一种模式都能被对它感兴趣的用户检索到,进而加以利用。本文提出了一种知识模式的框架表示方法,对文本挖掘出的模式进行统一表示、存储,构建知识库,并对知识库中的模式进行内部和外部评价,利用语义相似及领域知识对知识库中的模式进行检索。
- 宋丹许侃林鸿飞
- 关键词:文本挖掘知识模式
- 基于内容计算和链接分析的Web话题跟踪方法被引量:5
- 2007年
- 话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术.话题跟踪任务就是根据某一话题的训练报道,在后续报道中找出讨论该话题的所有报道.虽然传统的基于内容计算的话题跟踪方法也可以应用于Web话题跟踪,但它并没有利用Web的页面特征.文章针对Web页面的特点,提出了一种利用链接分析和内容计算相结合来进行Web话题跟踪的方法.实验证明这种方法是有效的.
- 宋丹林鸿飞杨志豪
- 关键词:链接分析
- 一种利用链接分析的Web话题跟踪方法
- 话题跟踪是一种基于事件的信息组织技术,实现对新闻信息中已有话题的动态跟踪.虽然传统的基于内容计算的话题跟踪方法也可以应用于Web话题跟踪,但它并没有利用Web的页面特征.文章提出了一种利用内容计算和链接分析相结合来进行W...
- 宋丹林鸿飞杨志豪
- 关键词:链接分析信息组织
- 文献传递