胡明涵 作品数:6 被引量:58 H指数:4 供职机构: 教育部 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 辽宁省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于随机关键词产生技术的政府公文分类系统 被引量:1 2008年 设计并实现了带有主题词结构的政府公文分类系统,在公文分类预处理过程中充分利用主题词所携带的类别信息,运用随机关键词产生技术和Bootstrapping学习方法对公文文本特征空间进行转换并降维,实现了一个不同于传统的文本分类预处理过程,使公文分类系统的性能得到了提高。基于随机关键词产生技术和Bootstrapping学习方法的公文分类系统分类效果优于普通分类器。 刘颖 胡明涵关键词:BOOTSTRAPPING 贝叶斯方法 模糊形式概念分析与模糊概念格 被引量:19 2007年 针对在许多应用领域中,大多数信息都是复杂的、不确定的,而传统的形式概念分析不能表达这些模糊的、不确定的信息问题,介绍了将Zadeh的模糊数学理论与形式概念分析理论相结合所形成的模糊形式概念分析理论.给出并证明了在模糊形式背景下对象集合及属性集合的一些结论.建立了在模糊形式背景下的模糊概念格并证明了该模糊概念格仍然是一个完备格.最后用实例说明了这种模糊概念格的构造方法. 胡明涵 张俐 任飞亮关键词:形式概念分析 模糊概念格 完备格 支持Internet上个性化信息重组与发布的Web挖掘关键技术的研究 被引量:2 2005年 Internet上个性化信息的重组与发布是Web个性化技术的一个重要组成部分,这一领域目前存在的主要问题是:并非没有信息重组和发布的工具,而是缺乏能够使这类工具高效工作的支持技术。本文提出一种将流数据处理技术引入Web点击流、IP地址流及页面文本流挖掘和分析过程,研究基于Web数据流挖掘的用户行为和需求分析方法;将本体和领域知识引入Web内容挖掘过程,研究领域知识指导下的Web内容挖掘方法;将基于Web数据流挖掘的用户行为和需求分析与领域知识指导下的Web内容挖掘相结合,研究Internet上Web信息模式和Web用户模型及其相互关系的建立;将上述研究成果应用于实际,以期达到高效地支持Internet上满足用户个性化要求的信息重组与发布的目的。 王大玲 胡明涵 于戈 鲍玉斌关键词:WEB内容挖掘 面向人名消歧任务的人名识别系统 被引量:4 2011年 CLP2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)的人名消歧评测的任务是个聚类问题:对给定的一组文档,按照文档中出现的指定查询词所指向的人进行聚类。由于是用"字"串匹配的方法从新华社的语料库中抽出所有含有该查询词的文档。所以对于这个任务,首要问题是判定查询词是否是人名,是完整人名还是人名的一部分。为此该文实现了一个基于多实体识别系统整合和启发式规则的后处理方法的人名识别系统,从而实现对文档中的人名,特别是查询词所涉及的人名的识别。在CLP2010的评测方给的训练集上的实验表明,查询词涉及的人名的识别正确率达到98.89%。 时迎超 王会珍 肖桐 胡明涵关键词:人名识别 人名消歧 系统整合 启发式规则 面向领域的文本分类与挖掘关键技术研究 大量文本以电子形式存在,人们需要对大量的文本信息资源进行有效的组织和管理,因此文本分类引起人们的高度重视。近年来,关于文本分类技术的研究取得了很大进展,并被应用于众多领域。本文深入研究了文本分类与挖掘中的一些关键技术,同... 胡明涵关键词:文本分类 BOOTSTRAPPING 文献传递 中文WordNet的研究及实现 被引量:28 2003年 提出了一种从英文WordNet转换生成中文WordNet的方法 ,并设计实现了中文WordNet的转换生成系统·论述了在构造中文WordNet的语义网络时 ,概念结点的转换原则 ,中文词形与词义映射关系的重新聚合 ,以及转换生成中文WordNet的可行性及转换中的相关问题 。 张俐 李晶皎 胡明涵 姚天顺关键词:WORDNET 概念映射