温春 作品数:9 被引量:54 H指数:5 供职机构: 解放军电子工程学院网络工程系 更多>> 发文基金: 博士研究生创新基金 更多>> 相关领域: 自动化与计算机技术 更多>>
中文领域本体学习中术语的自动抽取 被引量:15 2009年 提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。 温春 王晓斌 石昭祥基于独立分量分析的隐蔽Web领域聚类 被引量:1 2009年 针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过ICA分解获得类别信息。利用LSI的词共现分析和文本降噪能力提高聚类准确率。实验表明聚类平均准确率达到90%以上。 王晓斌 温春 石昭祥关键词:潜在语义 独立分量分析 文本聚类 基于贝叶斯信息准则的文本主题数估计 被引量:5 2009年 特定领域的主题识别和关键词提取有着广泛的应用,但通过人工指定识别或文本聚类自动生成的主题类别缺乏客观的度量方法。该文结合基于BIC准则的模型选择理论和独立分量分析技术对主题的数量进行概率估计,给出主题数量在BIC意义下的统计分布。在此基础上实现了文档矩阵的ICA分解,并根据分离的独立分量获得主题的关键词及其权重。实验表明,该方法在没有领域知识支持的情况下能估计出反映文本集合的主题数并提取相应的关键词。 王晓斌 温春 石昭祥关键词:主题识别 关键词提取 独立分量分析 贝叶斯信息准则 一种利用度属性获取本体概念层次的方法 被引量:5 2010年 通过分析已有的中文本体概念层次获取方法的特点和不足,提出一种利用度属性获取概念层次的方法.首先将概念关系以图的形式表示出来,然后利用反向剪枝算法得出概念所在层次,最后补充并修剪层次关系生成完整的概念层次.从各种参数的对比结果来看,基于VSM(Vector Space Model)且不进行LSI(Latent Semantic Indexing)降维时效果最好,同时也优于目前已有的几种方法. 温春 石昭祥 杨国正关键词:本体学习 本体概念层次获取方法综述 被引量:7 2010年 概念层次是本体的基本骨架,而概念层次的获取又是本体学习中非常重要的一步。参考大量的文献资料,分析了当前国内外本体概念层次获取研究中采用的多种方法和技术,指出了研究中的关键问题,阐述了其研究进展,探讨了研究中存在的问题和未来的发展方向。 温春 石昭祥 张霄关键词:本体学习 中文领域本体概念层次获取方法对比研究 被引量:9 2009年 概念层次是本体的基本骨架,而概念层次的获取又是本体学习中非常重要的一步。国际上对于概念层次获取的研究绝大部分都集中于英语,国内在该方面的研究还处于起步阶段,而目前已有的处理英文的方法用于处理中文效果如何,在国内还没有这方面的报道。重点比较了能用于获取中文概念层次的方法,并详细分析了各种参数的不同取值对结果的影响。结果表明在相同实验语料背景下,层次聚类法中基于VSM的方法效果最好。 温春 石昭祥 张亮关键词:本体学习 层次聚类 形式概念分析 算法可视化的分析与应用 被引量:3 2006年 算法可视化由静态和动态算法可视化组成。其中Huffman算法可视化为二叉树构造算法,流程含单步执行、显示节点图形及再次构造。按程序设置单步构造功能,每一步构造一个结点。即当用户选择单步构造时,先运行到上一单步构造结点的下一个结点位置,构造一个结点,保存当前环境变量后返回并阻止执行下一步结点构造。程序对于每一结点均设置显示标志,每次显示结点时需要对相关联结点的显示标志加以判断,分别对待处理。 温春 石昭祥关键词:算法可视化 HUFFMAN算法 利用缓冲区溢出技术强行推送信使 2006年 随着信息时代的来临,利用信使服务在网络上进行广告宣传已经非常普遍,它改变了过去传统的宣传方式,但是随着技术的发展以及人们安全意识的提升,普通的发送技术已经收效甚微,但是利用系统漏洞通过缓冲区溢出技术完全可以突破这种限制,达到强行推送信使的目的。 温春 石昭祥关键词:信使服务 SHELLCODE 基于扩展关联规则的中文非分类关系抽取 被引量:15 2009年 提出一种扩展的关联规则法用于抽取中文非分类关系,在利用普通关联规则抽取出非分类关系概念对后,通过语言学规则抽取相应的非分类关系名称。该方法克服了普通关联规则法无法得出具体非分类关系名称的缺点,能够确定非分类关系的定义域和值域。实验结果表明仅使用扩展的关联规则法进行非分类关系抽取即可完成任务,无须对概念对与"谓语"动词之间的紧密程度进行验证。 温春 石昭祥 辛元关键词:本体学习 非分类关系 关联规则