您的位置: 专家智库 > >

国家教育部博士点基金(20070151009)

作品数:12 被引量:65H指数:5
相关作者:鲁明羽唐焕玲林正奎邬俊魏善岭更多>>
相关机构:大连海事大学烟台职业学院大连交通大学更多>>
发文基金:国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 12篇中文期刊文章

领域

  • 12篇自动化与计算...
  • 1篇理学

主题

  • 5篇贝叶斯
  • 3篇心病
  • 3篇朴素贝叶斯
  • 3篇文本分类
  • 3篇冠心病
  • 2篇向量
  • 2篇加权
  • 2篇加权朴素贝叶...
  • 2篇关联规则
  • 2篇ADABOO...
  • 2篇CO-TRA...
  • 1篇独立性
  • 1篇多视图
  • 1篇信息过滤
  • 1篇循证
  • 1篇循证医学
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇视图
  • 1篇图像

机构

  • 11篇大连海事大学
  • 3篇烟台职业学院
  • 1篇大连交通大学
  • 1篇中日友好医院
  • 1篇中国工商银行...

作者

  • 11篇鲁明羽
  • 5篇唐焕玲
  • 4篇林正奎
  • 3篇邬俊
  • 2篇魏善岭
  • 2篇刘智
  • 1篇徐浩
  • 1篇李丹
  • 1篇时丽莎
  • 1篇伊卫国
  • 1篇黄会
  • 1篇姚晓娜
  • 1篇甘新玲
  • 1篇桑国明
  • 1篇傅英亮
  • 1篇李永
  • 1篇王敬东

传媒

  • 4篇广西师范大学...
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇南京大学学报...
  • 1篇计算机工程
  • 1篇控制与决策
  • 1篇大连海事大学...
  • 1篇北京交通大学...
  • 1篇Intern...

年份

  • 1篇2011
  • 2篇2010
  • 3篇2009
  • 6篇2008
12 条 记 录,以下是 1-10
排序方式:
基于不对称贝叶斯学习的图像检索相关反馈算法研究被引量:5
2009年
基于贝叶斯(Bayesian)理论的相关反馈技术是可有效提高图像检索性能的重要手段之一.然而,当前大多数的Bayesian反馈算法普遍受到小样本问题和训练样本不对称问题的制约.本文提出一种新的相关反馈算法,该算法将查询点移动(query point movement,QPM)技术嵌入Bayesian框架中,并采用不对称的学习策略处理正、负反馈信息,故而称之为不对称Bayesian学习(asymmetry Bayesianlearning,ABL).对于正例样本,该算法同时考虑用户提供的正、负反馈信息,并借助QPM技术估计相关语义类图像的概率分布.对于负例样本,采用一种半监督学习机制以应对负例样本稀缺问题.首先,通过随机采样从数据库中选取一组无标记图像,然后,利用QPM技术对其进行数据审计.最后,将审计后的无标记图像作为额外的负例样本,并与用户标记的负反馈信息一起用于估计不相关语义类图像的概率分布.仿真实验及对比结果表明,不对称Bayesian学习策略可显著提高相关反馈的效率,且本文算法的检索性能明显优于当前其它的相关反馈算法.
邬俊林正奎鲁明羽黄会
关键词:图像检索贝叶斯
基于差异性评估对Co-training文本分类算法的改进被引量:4
2008年
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法.
唐焕玲林正奎鲁明羽
关键词:CO-TRAINING
基于投票信息熵的AdaBoost改进算法被引量:5
2010年
针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能.
唐焕玲鲁明羽邬俊
关键词:ADABOOST朴素贝叶斯文本分类
基于属性加权朴素贝叶斯的冠心病辨证模型被引量:5
2008年
在原有中医药冠心病临床治疗数据采集系统的基础上,使用中医证型的辨证相关因素,提出属性加权朴素贝叶斯算法,并应用到冠心病中医证型的分类模型之中。实验结果显示,对于冠心病4种证型的分类,运用属性加权朴素贝叶斯分类算法都略高于朴素贝叶斯分类算法。实验结果表明属性加权朴素贝叶斯分类算法在中医冠心病临床诊断中具有良好的分类性能。
刘智桑国明鲁明羽
关键词:冠心病
基于模糊聚类的网络论坛热点话题挖掘被引量:23
2008年
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.
鲁明羽姚晓娜魏善岭
关键词:模糊聚类
基于特征多视图提升Naive Bayesian的Boosting改进算法被引量:1
2009年
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差异的加权朴素贝叶斯(WNB)基分类器;尝试使用几种不同的方式将样本权重嵌入WNB基分类器的参数中,对WNB产生扰动,进一步增加基分类器的不稳定性.实验结果表明,对比AdaBoost所提算法,Boost MV-WNB能够明显提升WNB文本分类器的性能.
林正奎唐焕玲鲁明羽王敬东
关键词:ADABOOST加权朴素贝叶斯文本分类
一种用于互动型不良信息过滤的贝叶斯改进方案被引量:1
2009年
信息过滤是文本挖掘领域的重要研究内容之一。针对互动型网络媒体信息(如BBS),提出一种新的信息过滤算法,该算法主要从特征提取和分类器构造两方面对B ayesian方法进行改进。在对不良信息的特征提取过程中,根据网络论坛的特征,在计算中文不良信息特征项的权重时,根据关键词出现的位置、次数以及词长等建立一个特征评估函数,并用它来替换TF-IDF公式中的TF项;同时,考虑到网络论坛中的良性信息与不良信息之间的不平衡分布,采用一种不对称的学习策略来设计B ayesian分类器。实验结果及对比分析表明,该算法具有较高的过滤准确率。
魏善岭傅英亮鲁明羽
关键词:不良信息信息过滤
Regression Analysis of the Number of Association Rules被引量:1
2011年
The typical model, which involves the measures: support, confidence, and interest, is often adapted to mining association rules. In the model, the related parameters are usually chosen by experience; consequently, the number of useful rules is hard to estimate. If the number is too large, we cannot effectively extract the meaningful rules. This paper analyzes the meanings of the parameters and designs a variety of equations between the number of rules and the parameters by using regression method. Finally, we experimentally obtain a preferable regression equation. This paper uses multiple correlation coeficients to test the fitting efiects of the equations and uses significance test to verify whether the coeficients of parameters are significantly zero or not. The regression equation that has a larger multiple correlation coeficient will be chosen as the optimally fitted equation. With the selected optimal equation, we can predict the number of rules under the given parameters and further optimize the choice of the three parameters and determine their ranges of values.
Wei-Guo YiMing-Yu LuZhi Liu
关键词:INTERESTSUPPORT
一种结合独立性模型与差异评估的Co-Training改进方案被引量:7
2008年
Co-Training算法要求两个特征视图满足一致性和独立性,但是,许多应用中不存在自然划分且满足这种假设的两个视图.为此,提出利用互信息(MI)或者CHI统计量评估特征之间的相互独立性,建立特征相互独立性模型(MID-Model).基于该模型,提出了新的特征子集划分方法PMID-MI与PMID-CHI算法,能有效地将一个特征集合划分成两个独立性较强的子集.并且利用多种差异评估法,进一步验证两个子集的独立性.基分类器之间的差异性能够减少两个基分类器给同一个未标注文本都标注错误的可能性.最后,提出了对Co-Training的改进算法SC-PMID.实验结果表明SC-PMID算法能够明显提高半监督分类精度.
唐焕玲林正奎鲁明羽邬俊
关键词:半监督分类
关联规则在冠心病中医临床证型诊断中的应用被引量:5
2008年
利用冠心病个体化诊疗系统,采集患者信息,运用关联规则方法对患者的信息进行挖掘分析,挖掘出的信息对医师的临床诊疗有重要参考价值。在此采用基于最小提升率的关联规则挖掘方法,实验表明基于最小提升率的关联规则在中医证型诊断模型中有良好的分类性能。
时丽莎鲁明羽李丹
关键词:关联规则冠心病
共2页<12>
聚类工具0