蔡巍
- 作品数:26 被引量:88H指数:6
- 供职机构:上海第二工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学政治法律经济管理更多>>
- 自动分类中的过学习问题与支持向量机
- 由于网上信息的迅速增长,文本分类已经成为网上信息管理中的热点研究课题.现今流行方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时容易出现过学习的问题,导致分类效果不理想.本文首先从理论上分析了这种出现过...
- 尹中航王永成蔡巍
- 关键词:支持向量机
- 文献传递
- 三种分类算法的实验比较被引量:6
- 2004年
- 对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.
- 蔡巍王永成李伟尹中航
- 关键词:K最近邻算法混合算法
- SVMs-支持向量机A
- 随着信息的迅速增加,文本分类已经成为信息管理的一项关键技术.现有方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时难以取得理想的效果。该文介绍了一种可广泛应用在网上进行文本信息分类的SVMs方法,是由V...
- 尹中航王永成蔡巍
- 关键词:支持向量机
- 文献传递
- 自动分类中的过学习问题与支持向量机被引量:6
- 2000年
- 由于网上信息的迅速增长,文本分类已经成为网上信息管理中的热点研究课题.现今流行方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时容易出现过学习的问题,导致分类效果不理想。本文首先从理论上分析了这种出现过学习的原因,然后介绍了出现过学习现象的条件和解决办法,最后介绍了一种研究小样本情况下机器学习规律、可以较好地克服过学习问题的分类方法--支持向量机方法。
- 尹中航王永成蔡巍
- 关键词:支持向量机
- 网络故障自动诊断专家系统的分析与研究
- 蔡巍
- SVMs-支持向量机A
- 随着信息的迅速增加,文本分类已经成为信息管理的一项关键技术.现有方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时难以取得理想的效果。该文介绍了一种可广泛应用在网上进行文本信息分类的SVMs方法,是由V...
- 尹中航王永成蔡巍
- 关键词:支持向量机
- 文献传递网络资源链接
- 利用串匹配技术实现网上新闻的主题提取(英文)被引量:17
- 2002年
- 从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据“词典加匹配”的模式.由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度,而且词典的内容也无法完全涵盖网上新闻的范围, 因此这种方法不适用于网上新闻的主题提取.提出并实现了一种不用词典即可提取新闻主题的新方法.该方法利用网上新闻的特殊结构,在标题和正文间寻找重复的字串.经过简单地处理,这些字串能够较好地反映新闻的主题.实验结果显示该方法能够准确、有效地提取出绝大部分网上新闻的主题,满足新闻自动处理的需要.该方法同样适用于其它亚洲语言和西方语言.
- 尹中航王永成蔡巍韩客松
- 关键词:网页信息处理网上新闻主题提取自然语言处理
- ATM交换机的硬件体系结构探讨
- 1994年
- 本文首先对ATM(AsynchronousTransferMode)的背景作了一个简单的介绍,接着阐述了ATM和ATM交换机的主要原理和技术,然后从硬件体系结构的角度具体地分析了一种实验ATM交换机是怎样支持ATM技术的详细方法。
- 石继明蔡巍顾水林
- 关键词:ATM交换机硬件体系结构
- 一种无词典的从Web新闻页面抽取主题的算法被引量:2
- 2008年
- 主题抽取是自然语言处理研究的重要问题之一。目前流行的方法是“词典+匹配”,但该方法用于处理动态变化的网页信息时,词典难于及时更新等弊病就表现出来。本文作者在研究中文新闻网页内容、结构特点的基础上,提出了一种利用Web页面结构无需词典的主题抽取算法。我们使用该方法对新华网财经新闻语料1000篇进行主题抽取实验,并与手工抽取的主题进行比较,结果表明,重合率高达93%以上。
- 蔡巍王永成尹中航
- 关键词:主题提取WEB页面超链接
- “推送”(PUSH)技术简介被引量:14
- 1999年
- 一、实现网络主动信息服务已摆上日程因特网内容提供商ICP(InternetContentProvrder)不同于ISP(InternetServrceProvrder),不是专做Internet接入服务,而是围绕“Content”内容进行信息服务,主...
- 蔡巍
- 关键词:推送技术PUSH技术因特网ICP