公共文化服务平台

夏云庆: 作品数：33 被引量：164H指数：6; 供职机构：清华大学更多>>; 发文基金：国家自然科学基金国际科技合作与交流专项项目国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术文化科学语言文字电子电信更多>>

合作作者

基于词义类簇的文本表示模型: 词和多义词现象是文档表示任务面临的重要挑战。因此本文提出了词义类簇模型fSense ClusterMocIel，SCM)，在词义类簇空问上表示文档。SCM首先构造词义类簇空问，然后将文档表示在词义类簇空问，获得每篇文档在...; 唐国瑜夏云庆张民郑方

歌曲情绪压力分析方法及系统: 本发明公开了一种歌曲情绪压力分析方法，其包括步骤：S1，对歌词进行切分；S2，通过分析歌词的重复、排比和歌词片段序列，判定歌词的结构；S3，根据歌词的字数和演唱时间，确定歌曲的平均唱速；S4，从歌词中抽取情绪单元，并判定...; 夏云庆; 文献传递

基于跨语言广义向量空间模型的跨语言文档聚类方法被引量：6: 2012年; 跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。; 唐国瑜夏云庆张民郑方; 关键词：文档聚类跨语言信息检索

用MCIWnd实现视频的灵活播放: 1997年; 视频剪辑播放可以通过ＭＣＩ接口很容易的实现，但界面呆板，灵活性差，为使视频剪辑播放灵活，使用ＭＣＩＷｎｄ接口，效果很好。文中介绍了其功能、控制、实例与实现。; 夏云庆张秉权; 关键词：视频剪辑视频播放多媒体

微博话题检测方法及系统: 本发明涉及话题检测技术领域，公开了一种微博话题检测方法及系统，该方法包括步骤：S1，将微博文本切分为词汇；S2，构造微博文本线索和微博文本森林；S3，针对特定的微博文本线索，进行微博话题分析，以找出微博文本线索中的主话题...; 夏云庆; 文献传递

微博文本处理研究综述被引量：58: 2012年; 微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。; 张剑峰夏云庆姚建民; 关键词：语言分析文本处理

IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现: 该文针对类比翻译处理问题提出了启发式类比翻译处理机制,实现了IHSMTS系统对翻译记忆的有效重用.该机制充分发挥TM技术在知识表示和获取上的优势,以基于实例模式的类比分析与类比推理为基础,借助基于规则的语言分析能力,实现...; 夏云庆; 关键词：机器翻译语句相似度; 文献传递

基于语义相似度并运用语言学知识进行双语语句词对齐被引量：8: 2002年; This paper claries the definition of alignment from the viewpoint of linguistic similarity. Many alignment algorithms have been proposed with very high precision. But the languages belong to occidental family. We propose a new method for alignment between languages that do not belong to the same language family. On the contrary to most of the previously proposed methods that rely heavily on statistics, our method attempts to use linguistic knowledge to overcome the problems of statistical model. Experimental results confirm that the algorithm can align over 85 % of word pairs while maintaining a comparably high precision rate, even when a small corpus is used in training.; 晋薇黄河燕夏云庆; 关键词：机器翻译语言学知识语义相似度计算机

二阶段招聘信息检索方法: 招聘信息检索与传统信息检索存在较大差异，传统检索方法不能实现良好的招聘信息检索效果。为解决该问题，本文提出二阶段招聘信息检索方法，针对招聘信息的标题文本和职位描述文本分两阶段分别进行不同的处理。第一阶段本文采用VSM模型...; 王静帆夏云庆郑方邬晓钧; 关键词：招聘信息计算机检索文本相似度; 文献传递

基于泛化和繁殖的自举式意见目标抽取方法: 意见目标抽取是意见挖掘研究中的重要环节。现有方法的主要问题是将人工标注的意见目标直接视为"种子"进行意见目标扩展。本文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过...; 郝博一夏云庆邬晓钧郑方刘轶; 关键词：自然语言处理文本挖掘; 文献传递