您的位置: 专家智库 > >

夏云庆

作品数:33 被引量:164H指数:6
供职机构:清华大学更多>>
发文基金:国家自然科学基金国际科技合作与交流专项项目国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学语言文字电子电信更多>>

文献类型

  • 13篇期刊文章
  • 10篇会议论文
  • 7篇专利
  • 2篇学位论文

领域

  • 23篇自动化与计算...
  • 2篇文化科学
  • 1篇电子电信
  • 1篇语言文字

主题

  • 6篇相似度
  • 6篇机器翻译
  • 6篇计算机
  • 6篇翻译
  • 5篇搜索
  • 5篇聚类
  • 4篇信息处理
  • 4篇搜索时间
  • 4篇歌词
  • 3篇信息检索
  • 3篇语言
  • 3篇语言处理
  • 3篇中文
  • 3篇中文信息
  • 3篇中文信息处理
  • 3篇自然语言
  • 3篇自然语言处理
  • 3篇文本
  • 3篇文档
  • 3篇文档聚类

机构

  • 24篇清华大学
  • 6篇中国科学院
  • 2篇沈阳工业学院
  • 2篇中国传媒大学
  • 2篇中国科学技术...
  • 2篇香港中文大学
  • 2篇佳能株式会社
  • 1篇北京语言大学
  • 1篇深圳大学
  • 1篇苏州大学
  • 1篇香港城市大学
  • 1篇中国科学院研...

作者

  • 32篇夏云庆
  • 10篇郑方
  • 4篇唐国瑜
  • 4篇邬晓钧
  • 3篇晋薇
  • 3篇郝博一
  • 3篇王静帆
  • 3篇王建德
  • 2篇张民
  • 2篇黄河燕
  • 2篇黄锦辉
  • 2篇张秉权
  • 2篇刘轶
  • 2篇杨莹
  • 1篇姚建民
  • 1篇张开旭
  • 1篇张鹏洲
  • 1篇陈肇雄
  • 1篇张普
  • 1篇张剑峰

传媒

  • 6篇中文信息学报
  • 2篇电脑开发与应...
  • 1篇计算机研究与...
  • 1篇清华大学学报...
  • 1篇计算机工程
  • 1篇微型电脑应用
  • 1篇计算机科学
  • 1篇第九届全国人...
  • 1篇第十届全国人...
  • 1篇第九届全国人...

年份

  • 1篇2017
  • 1篇2014
  • 1篇2013
  • 5篇2012
  • 3篇2011
  • 1篇2010
  • 6篇2009
  • 1篇2008
  • 4篇2007
  • 1篇2006
  • 4篇2002
  • 2篇2001
  • 1篇1998
  • 1篇1997
33 条 记 录,以下是 1-10
排序方式:
基于词义类簇的文本表示模型
词和多义词现象是文档表示任务面临的重要挑战。因此本文提出了词义类簇模型fSense ClusterMocIel,SCM),在词义类簇空问上表示文档。SCM首先构造词义类簇空问,然后将文档表示在词义类簇空问,获得每篇文档在...
唐国瑜夏云庆张民郑方
歌曲情绪压力分析方法及系统
本发明公开了一种歌曲情绪压力分析方法,其包括步骤:S1,对歌词进行切分;S2,通过分析歌词的重复、排比和歌词片段序列,判定歌词的结构;S3,根据歌词的字数和演唱时间,确定歌曲的平均唱速;S4,从歌词中抽取情绪单元,并判定...
夏云庆
文献传递
基于跨语言广义向量空间模型的跨语言文档聚类方法被引量:6
2012年
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。
唐国瑜夏云庆张民郑方
关键词:文档聚类跨语言信息检索
用MCIWnd实现视频的灵活播放
1997年
视频剪辑播放可以通过MCI接口很容易的实现,但界面呆板,灵活性差,为使视频剪辑播放灵活,使用MCIWnd接口,效果很好。文中介绍了其功能、控制、实例与实现。
夏云庆张秉权
关键词:视频剪辑视频播放多媒体
微博话题检测方法及系统
本发明涉及话题检测技术领域,公开了一种微博话题检测方法及系统,该方法包括步骤:S1,将微博文本切分为词汇;S2,构造微博文本线索和微博文本森林;S3,针对特定的微博文本线索,进行微博话题分析,以找出微博文本线索中的主话题...
夏云庆
文献传递
微博文本处理研究综述被引量:58
2012年
微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。
张剑峰夏云庆姚建民
关键词:语言分析文本处理
IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现
该文针对类比翻译处理问题提出了启发式类比翻译处理机制,实现了IHSMTS系统对翻译记忆的有效重用.该机制充分发挥TM技术在知识表示和获取上的优势,以基于实例模式的类比分析与类比推理为基础,借助基于规则的语言分析能力,实现...
夏云庆
关键词:机器翻译语句相似度
文献传递
基于语义相似度并运用语言学知识进行双语语句词对齐被引量:8
2002年
This paper claries the definition of alignment from the viewpoint of linguistic similarity. Many alignment algorithms have been proposed with very high precision. But the languages belong to occidental family. We propose a new method for alignment between languages that do not belong to the same language family. On the contrary to most of the previously proposed methods that rely heavily on statistics, our method attempts to use linguistic knowledge to overcome the problems of statistical model. Experimental results confirm that the algorithm can align over 85 % of word pairs while maintaining a comparably high precision rate, even when a small corpus is used in training.
晋薇黄河燕夏云庆
关键词:机器翻译语言学知识语义相似度计算机
二阶段招聘信息检索方法
招聘信息检索与传统信息检索存在较大差异,传统检索方法不能实现良好的招聘信息检索效果。为解决该问题,本文提出二阶段招聘信息检索方法,针对招聘信息的标题文本和职位描述文本分两阶段分别进行不同的处理。第一阶段本文采用VSM模型...
王静帆夏云庆郑方邬晓钧
关键词:招聘信息计算机检索文本相似度
文献传递
基于泛化和繁殖的自举式意见目标抽取方法
意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为"种子"进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过...
郝博一夏云庆邬晓钧郑方刘轶
关键词:自然语言处理文本挖掘
文献传递
共4页<1234>
聚类工具0