李湘东
- 作品数:53 被引量:283H指数:9
- 供职机构:武汉大学信息管理学院更多>>
- 发文基金:国家社会科学基金国家科技重大专项湖北省高校图工委科研基金更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生生物学更多>>
- 针对训练集分布偏斜问题的数字资源文本分类方法被引量:2
- 2014年
- 【目的】调整训练集分布的不均衡性,以提高科学分类体系下数字资源文本的分类性能。【方法】提出基于粒划分和LDA相结合的新方法 B-LDA,首先根据划分准则对训练集进行分割,实现粒度空间的转换,然后采用概率主题模型(LDA)对文本建模,利用类全局语义信息生成新文本,从而使训练集达到分布均衡。【结果】仿真实验结果表明:随着特征项数的变化,在不同偏斜程度训练集上F1值有2.7%至9.9%不等的提升。【局限】由于语料库规模的限制,构造训练集进行实验时,只涉及部分偏斜情况;此外,实验随机选取的两个类别的可分性会对新方法的分类性能造成影响。【结论】该方法可有效提高以图书书目信息、期刊题录信息、网页等数字资源为文本内容的分布偏斜训练集的分类性能。
- 李湘东何海红曹环黄莉
- 关键词:文本分类数字资源
- 基于语料信息度量的文本分类性能影响研究被引量:5
- 2014年
- 基于不同的分类算法针对特性迥异的语料数据进行分类,其分类效果往往不同。通过研究分类算法针对专门语料库与自建语料库分类效果各不相同的根本原因,提出一种提高分类性能的新途径。从不同语料库的自动分类对比入手,定义类别聚类密度、类别复杂度、类别清晰度三个指标对语料库信息进行度量,通过多因素方差分析考察三个指标与分类性能的关系,得出语料的各项指标对不同分类算法分类性能的影响关系,并提出一种基于类别清晰度的交叠类文本分类方法以验证指标的有效性。实验表明:该三个指标都在不同程度上影响着分类算法的分类性能。语料类别的聚类密度越高,复杂度越低,类别清晰度越高,其表现出的分类效果越好。
- 李湘东巴志超黄莉
- 关键词:语料库类别信息
- 三级生物安全实验室管理体系的建立被引量:8
- 2007年
- 三级生物安全实验室是从事高致病性病原微生物研究、检测、检疫、诊断等必不可少的技术平台。生物安全实验室最早于20世纪50-60年代出现在美国。与欧美等发达国家相比,我国对这类实验室的建设起步较晚,1987年,为了研究流行性出血热的传播途径,我国才修建了第一个三级生物安全防护水平的实验室。2003年的SARS疫情及随后发生在新加坡、我国台湾及内地实验室的SAPS病毒实验室的感染事故,使实验室生物安全引起了广泛关注,人们认识到,
- 李湘东孙理华
- 关键词:生物安全实验室实验室生物安全流行性出血热SARS疫情病毒实验室高致病性
- 基于BERT-MLDFA的内容相近类目自动分类研究--以《中图法》E271和E712.51为例被引量:1
- 2022年
- 针对《中图法》中具有关联度大、区分度小等特点的内容相近类目,探讨利用深度学习来提升分类效果的方法。本文构建BERT-MLDFA模型,即通过多层级注意力机制对BERT不同层参数进行动态融合,并在任务数据集上预训练,进而以《中图法》中E271和E712.51作为典型内容相近类目进行自动分类实验。结果表明:本文方法的Macro_F1值达到0.987,相较于经典机器学习方法提升2.4%,而且该方法可以捕捉内容相近类目文本之间的细微语义差别,能够较好地应用于《中图法》以及其他内容相近类目分类,具有较强普适性。
- 李湘东石健孙倩茹贺超城
- 关键词:《中图法》
- Wiki条件下的协同创新与知识转化研究
- Wiki作为一种新的协作系统技术,为学术交流提供了一种全新的模式。
本文对Wiki条件下的协同创新这种新的科学研究模式作一个系统学分析,阐明了其协同创新的复杂学原理,进而给出了Wiki条件下知识转化的SECI模...
- 陆泉胡慧丽李湘东
- 关键词:协同创新知识转化
- 文献传递
- 非人灵长类动物感染性实验中的福利问题
- 2016年
- 良好的动物福利有利于实验动物的“身心健康”,使之处于更接近其生物学特性的“自然状态”[1].利用拥有良好动物福利的实验动物进行的科学实验,获得的实验数据更加可靠,重复性更好.非人灵长类动物(猴)是传染病研究中不可替代或最好的模型动物,其智力发达,聪明好动,不易驯化,这一特点使工作人员在实验中容易被其抓、咬伤,增加了工作人员在感染性动物实验中的生物安全风险.关注感染性动物实验中非人灵长类动物(猴)的福利问题,保证实验动物享有良好的动物福利,使之身心处于更舒适的状态,建立工作人员和动物之间的和谐关系,有助于减少动物的攻击性,更好地保障实验中工作人员的安全.本文将结合生物安全实验室的工作情况,从动物实验项目审核、动物采购和运输、动物饲养、动物使用等方面探讨非人灵长类动物(猴)在感染性动物实验中的福利问题.
- 鲜巧阳王勇黄智翔李湘东
- 关键词:非人灵长类动物实验动物福利问题感染性生物安全实验室动物福利
- LDA模型下文本自动分类算法比较研究——基于网页和图书期刊等数字文本资源的对比被引量:5
- 2015年
- 本文以信息资源管理中的网页、图书期刊的书目或题录信息等主要数字文本为对象,使用概率主题模型(LDA)建模,通过对比分析KNN、类中心向量法、SVM等三种常见的分类算法所产生的不同分类效果,研究数字文本资源管理中的自动分类特性。实验表明LDA模型下三种分类算法的分类正确率基本都能达到80%左右,SVM算法分类准确率相较另两种算法大约高0.7-22%左右。本文的结论可为数字文本分类系统使用LDA对文本建模时选择合适的分类算法提供一定的依据。
- 李湘东潘练
- 关键词:LDA书目信息
- ABSL-Ⅲ实验室生物安全管理体系建立的探索
- 目的建立起一个科学的系统的高级别病原微生物实验室生物安全管理体系.方法以武汉大学ABSL-Ⅲ实验室的生物安全管理体系为例,从生物安全管理体系的概念,方法与目标,组成及建立过程四个方面进行论述和探索.结果ABSL-Ⅲ实验室...
- 孙理华唐志佼李湘东王勇鲜巧阳
- 关键词:生物安全管理生物安全病原微生物实验室
- 文献传递
- 一种基于加权LDA模型和多粒度的文本特征选择方法被引量:18
- 2015年
- 【目的】为改善图书和期刊书目信息的分类性能,结合书目文本的体例结构特点,提出一种基于加权LDA模型和多粒度的文本特征选择方法。【方法】在点互信息(PMI)模型的基础上,结合词性、位置等要素修正特征词的权重并扩展至LDA的生成模型中,以抽取表意性较强的粗粒度特征;结合TF-IDF计算模型采用一定策略获取细粒度特征,基于多粒度特征作为核心特征词集表征书目文本;采用KNN、SVM等算法实现书目文本的分类。【结果】在自建图书、期刊材料上进行分类实验,与LDA方法以及传统特征选择方法相比,该方法分类准确率分别平均提高3.60%和4.79%。【局限】实验材料的数量以及丰富度有待进一步扩展;需探索更多的加权策略模型进行实验,以提高书目文本的分类效果。【结论】实验结果表明,该方法是有效的、可行的,能够提高特征选择后的特征词集对文本的表示能力,从而提高文本分类的准确率。
- 李湘东巴志超黄莉
- 关键词:书目信息文本分类
- 武汉大学动物实验技术平台建设的探讨与实践被引量:4
- 2010年
- 从动物实验技术平台的建立、动物实验的规范管理、动物实验专业人员队伍建设以及动物实验研究的国际交流与合作等方面,介绍了武汉大学动物实验中心/ABSL-3实验室在建设面向国内外的公共技术服务平台过程中的思路、举措和成效。
- 李湘东唐志佼孙理华
- 关键词:动物实验室实验教学