胡锡衡
- 作品数:7 被引量:28H指数:2
- 供职机构:鞍山师范学院数学系更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 正向最大匹配法在中文分词技术中的应用被引量:23
- 2008年
- 分词是中文信息处理的一部分,分词本身并不是目的,而是后续处理过程的必要阶段,是中文信息处理的基础技术.正向最大匹配法是一种基于词典的分词方法,它能够有效地实现对中文文档的扫描,将文档分解成为词的集合.从而实现中文文本结构化的表示.
- 胡锡衡
- 关键词:信息处理分词文档
- 中间件技术及其应用被引量:1
- 2007年
- 随着软件应用越来越复杂,软件开发"一切从零"开始的开发模式也越来越不能满足应用的要求.因此一些诸如通信中间件、数据库中间件等为软件开发提供有力支持的中间件技术应运而生.
- 胡锡衡
- 关键词:中间件技术
- 径向基函数在文本分类中的应用
- 2011年
- 利用RBF网络进行文本自动分类,对训练集进行聚类,使得每个簇内部的相似性尽可能高,而簇之间的相似性尽可能低.为每一个簇的中心定义相应的径向基函数,再对由这些径向基函数构成的两层神经网络进行训练.因考虑到了不同簇之间的差异性,因此很好解决"兼类"问题.
- 胡锡衡
- 关键词:径向基函数文本聚类神经网络
- 基于KNN-最近邻算法的邮件过滤技术研究被引量:1
- 2008年
- 邮件过滤器一般都是基于朴素贝叶斯概率模型,但是汉语拥有极为复杂的语义环境以即贝叶斯算法的易欺骗性,使得贝叶斯概率模型不能很好地过滤中文垃圾邮件。针对贝叶斯算法中存在的不足,尝试使用改进的KNN-最近邻算法过滤中文垃圾邮件。
- 胡锡衡迟呈英
- 关键词:邮件过滤贝叶斯模型文本垃圾邮件
- 抽样调查中变量选择(英文)被引量:2
- 2002年
- 在抽样调查中 ,问卷的设计者常常尽可能多地设计变量 ,以保证不丢失有用的信息 .但是 ,问卷中含有太多变量会减少问卷的回收率 ,进而导致分析结果 .本文通过对应分析的方法介绍了幼儿主体性发展的变量选择 。
- 陶凤梅杨启昌胡锡衡
- 关键词:抽样调查幼儿主体性发展信息丢失
- 垃圾邮件的分析与过滤
- 随着网络的广泛应用,电子邮件已成为人们广泛应用的最经济的一种通信手段之一。然而,电子邮件在给人们提供便捷通信的同时,其副产品-垃圾邮件,却给广大用户带来了大量的麻烦。今天,垃圾邮件问题已经愈演愈烈,对互联网造成了很大危害...
- 胡锡衡
- 关键词:垃圾邮件中文邮件
- 文献传递
- 垃圾邮件过滤系统模型的研究与设计
- 2009年
- 邮件过滤是反垃圾邮件的一种重要方法,其中基于邮件内容的过滤又是一种重要的、有效的过滤手段.基于电子邮件是一种半结构化的数据,并且,电子邮件中主要包括的是文本信息,因此,本文将文本挖掘的分类技术和方法引入到邮件过滤系统模型中,以实现对垃圾邮件的过滤.
- 胡锡衡
- 关键词:垃圾邮件数据处理文本信息提取