陈炯
- 作品数:7 被引量:41H指数:4
- 供职机构:山西职业技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向中文客户评论的产品属性抽取方法研究被引量:4
- 2012年
- 针对现有的中文客户评论产品属性识别方法存在的不足,通过采用词法分析、句法分析、同义词词林等多项技术和资源,挖掘真实语料中蕴藏的语言知识,提出了一种基于模板的产品属性识别方法。该方法对评论语料进行词法、句法分析和人工标注,从标注结果中综合分析和归纳评论句的全局语言规则,提取属性词和评价词之间的词性和依存关系序列,借助同义词词林构建产品属性模板,使用属性模板识别产品属性。对比实验结果表明了提出方法的有效性。
- 陈炯张虎曹付元张永奎
- 关键词:依存句法分析同义词词林
- 面向中文客户评论的评价搭配识别研究被引量:3
- 2013年
- 评价搭配识别是评论挖掘的研究热点之一。针对现有方法存在的不足,通过对真实语料的观察和分析,提出了一种基于语法模板的评价搭配识别方法。该方法借助HowNet和语法分析等资源和工具,从大规模的真实评论语料中自动获取反映评价搭配规律的候选语法模板,对候选模板进行泛化和遴选,通过生成的模板识别待分析的评论句的搭配关系。在手机和数码相机两种电子产品领域上的对比实验验证了该方法是有效的。
- 陈炯张虎曹付元
- 关键词:知网依存句法分析
- 一种基于词聚类的中文文本主题抽取方法被引量:24
- 2005年
- 提出了一种基于词聚类的中文文本主题抽取方法,该方法利用相关度对词的共现进行分 析,建立词之间的语义关联,并生成代表某一主题概念的用种子词表示的词类。对于给定文档,先进 行特征词抽取,再借助词类生成该文档的主题因子,最后按权重输出主题因子,作为文本的主题。实 验结果表明,该方法具有较高的抽准率。
- 陈炯张永奎
- 关键词:主题抽取词聚类
- 基于内容过滤的防火墙设计与实现被引量:1
- 2011年
- 计算机网络的发展和应用改变了人类的生活方式,网络安全成为不容忽视的重要问题。本文首先分析了当前计算机网络面临的安全问题和防火墙技术,在此基础上,将内容过滤技术引入防火墙的设计中,最后探讨了防火墙的设计方案和实现方法。
- 陈炯张雅琴
- 关键词:计算机技术网络安全防火墙
- 汉语文本聚类及其算法设计被引量:4
- 2005年
- 主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。
- 陈炯范卓华张虎
- 关键词:代表点聚类中心
- 基于内容过滤的邮件系统设计被引量:1
- 2011年
- 电子邮件(E-mail)是Internet应用最广的服务之一。针对邮件的安全问题,在分析电子邮件工作原理的基础上,提出了内容相关过滤方法并设计了一个具有过滤功能的电子邮件客户端系统。
- 陈炯
- 关键词:垃圾邮件POP3协议SMTP协议
- 一种基于词聚类的文本特征描述方法被引量:4
- 2011年
- 针对文本挖掘中存在的特征空间高维性问题,提出了一种基于词聚类的文本特征描述方法,旨在通过机器学习的方法挖掘词汇之间的语义关联,动态构造特定领域的概念词典,借助构造的概念来描述文本的特征,该方法不借助主题词典,先从训练语料中对词的共现情况进行分析,用词聚类(word clustering)生成由种子词(seed words)表示的代表某一主题概念的词类,然后用种子词作为文本的特征项。实验表明,该方法不仅压缩了特征空间的维数,也克服了HowNet中概念信息的局限性,提高了文本分类的精确度。
- 陈炯张永奎
- 关键词:词共现词聚类