国家自然科学基金(60703010)
- 作品数:17 被引量:235H指数:8
- 相关作者:樊兴华王鹏甘玲李欲晓吴渝更多>>
- 相关机构:重庆邮电大学北京邮电大学更多>>
- 发文基金:国家自然科学基金重庆市自然科学基金教育部留学回国人员科研启动基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 面向短文本的命名实体识别被引量:18
- 2009年
- 针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。
- 王丹樊兴华
- 关键词:隐马尔可夫模型命名实体识别词性
- 一种新的词语相似度计算方法被引量:10
- 2009年
- 提出了一种新的词语相似度计算方法。该方法利用词语关联分布规范化因子,对互信息中目标词和基词的关联度度量方法进行了修正,通过计算目标词和基词的关联度,构造目标词的属性向量,由目标词的属性向量,利用夹角余弦法计算出目标词语相似度。实验结果验证了该方法的有效性。
- 赵军胡栓柱樊兴华
- 关键词:互信息词语相似度
- 嵌入式系统下交叉汇编器的移植被引量:2
- 2009年
- 在芯片设计时,汇编器GAS应用越来越广泛。在分析GAS的数据类型和工作机制的基础上,根据目标处理器的特点和要求,对GAS进行了移植,为ZSP芯片开发出符合自由软件基金标准的汇编器,且ZSP芯片的体系结构体现了芯片的普遍结构,具有可推广性,促进其在嵌入式系统下的应用。
- 甘玲贾怀礼
- 关键词:嵌入式系统
- 基于领域词语本体的短文本分类被引量:43
- 2009年
- 短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元的信息量来衡量词的相似度,从而进行分类。对比实验表明,该方法在一定程度上弥补了短文本特征不足的缺点,且提高了准确率和召回率。
- 宁亚辉樊兴华吴渝
- 关键词:本体知网文本分类语义
- 一种面向VLIW芯片的线性指令调度算法
- 2009年
- VLIW是DSP芯片上使用最多的一种技术,要发挥DSP芯片的性能优势,需要编译器的支持。目前关于VLIW技术的研究主要集中在如何形成更长的基本块,以及基本块之间的代码优化算法上,对于如何选择指令从而形成一个超长指令字的算法,却没有仔细地描述和实现,但这是在编译器的指令调度模块中需要具体考虑的问题,具有工程实践意义。本文通过改进编译器的list算法实现了支持VLIW技术的指令调度优化算法,改进的算法可以充分利用芯片的VLIW结构的优势,加速程序运行,具有较好性能。
- 甘玲汤睿
- 关键词:VLIW流水线
- 基于两步策略的中文短文本分类研究被引量:8
- 2008年
- 为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二维空间,根据该空间内错误文本的分布将测试文本集分为3部分:能被KNN可靠分类的文本集A,不能被KNN可靠分类但能被NB可靠分类的文本集B,其他文本集C.(2)用KNN、NB分别对文本集A和B进行分类,根据训练语料的类别分布,直接给属于文本集C的文本分配标签.与NB、KNN和支持向量机(SVM)的对比实验表明,该方法可获得较高的分类性能.
- 樊兴华王鹏
- 关键词:文本分类
- 非常规突发事件网络舆情中的意见领袖分析被引量:46
- 2010年
- 近10年,不断出现的非常规突发事件日益成为人们关注的话题。非常规突发事件具有罕见性和复杂性的特点,网络的发达更加剧了非常规突发事件的复杂性。本文对非常规突发事件网络舆情意见领袖进行分析研究,将非常规突发事件发展过程分为前期和后期,前期包括潜伏期和突发期,后期包括持续期和消失期,分别对前后期网络舆情意见领袖的群体构成及其变化进行了分析,最后指出网络舆情意见领袖的重要作用。
- 姜珊珊李欲晓徐敬宏
- 关键词:网络舆情突发事件意见领袖政府
- 意见领袖识别中的文本倾向性研究被引量:6
- 2013年
- 由于网络用户讨论的主题变化频繁,因此在进行倾向性判定时,难以预先构造出满足各种情况的训练语料。针对上述问题,提出了一种意见领袖识别中的文本倾向性判定方法,进而建立考虑回复帖子倾向性的意见领袖发现模型。该模型建立在影响力扩散概率模型(IDPM)上,模型中引入了考虑帖子倾向性的有效系数。实验表明,该方法是有效的,其前50个的平均精确率相对分别提高了10.97%和5.45%。
- 樊兴华吴昊
- 基于两步策略的文本分类方法实验研究
- 2011年
- 已知朴素贝叶斯分类器使用两步策略的分类方法提高了两类中文文本分类的效率,本文在此基础上,研究3个问题:1可以使用两步策略分类方法的分类器须满足的条件;23种理论上可用两步策略进行文本分类的分类器;3实验比较Rocchio、朴素贝叶斯、KNN 3种分类器两两组合后应用于多类英语文本分类的效果。实验结果表明:Rocchio、朴素贝叶斯、KNN 3种分类器满足两步策略分类的条件,且当KNN作第一步分类器,朴素贝叶斯作第二步分类器时分类效果最好。
- 何泉昊樊兴华周鹏
- 关键词:文本分类ROCCHIO朴素贝叶斯K近邻
- 基于优先级位图对RTAI实时性的改进被引量:1
- 2009年
- 通过对RTAI部分内核代码的分析,指出RTAI中原有的基于双向链表结构的就绪任务队列存在缺陷,在RTAI中引入优先级位图对RTAI的就绪任务队列进行了改进,实现了一个基于优先级位图的双向循环链表的就绪任务队列结构,从而在原有基础上进一步提高了RTAI的实时性,并通过实验加以验证。
- 甘玲刘柄宏
- 关键词:RTAI