李敏 作品数:6 被引量:54 H指数:3 供职机构: 新疆大学信息科学与工程学院 更多>> 发文基金: 国家自然科学基金 自治区科技支疆项目计划 更多>> 相关领域: 自动化与计算机技术 医药卫生 更多>>
基于图卷积和注意力的方面级情感分类 2023年 为解决图注意力网络对边信息的忽视和固定卷积层数的方法不能自适应获取情感词信息的问题,提出一种基于图卷积和注意力的方面级情感分类模型。加入句法依存边信息提高对不同句法连接词的区分度;一个迭代注意力机制被设计用于建立方面词和句中所有词的关联关系,自适应选择全局词信息。模型在Twitter、Rest14和Rest16数据集上获得更好的性能。实验结果验证了该方法的有效性。 窦贤锐 李敏 李敏关键词:情感分类 图神经网络节点分类任务基准测试及分析 2024年 图神经网络(Graph Neural Network,GNN)模型由于采用端到端的模型架构,在训练过程中能够更好地将节点隐藏特征的学习和分类目标协同起来,相比图嵌入(Graph Embedding)的方法,其在节点分类等任务上得到了较大的性能提升。但是,已有图神经网络模型实验对比阶段普遍存在的数据集类型单一、样本量不足、数据集切分不规范、对比模型规模及范围有限、评价指标单一、缺乏模型训练耗时对比等问题。为此,文中选取了包括cora,citeseer,pubmed,deezer等在内的来自不同领域(引文网络、社交网络及协作网络等)的共计20种数据集,以准确率、精确率、召回率、F-score值及模型训练耗时为多维评价指标,在FastGCN,PPNP,ChebyNet,DAGNN等17种主流图神经网络模型上,进行了全面且公平的节点分类任务基准测评,进而为真实业务场景下的模型选择提供了决策参考。通过基准测试实验发现,一方面,影响模型训练速度的因素排名依次是节点属性维度、图节点规模及图边的规模;另一方面,并不存在赢者通吃的模型,即不存在在所有数据集下全都表现优异的模型,特别是在公平的基准测试配置环境下,结构简洁的模型反而比复杂的GNN模型有着更好的性能表现。 张陶 张陶 于炯 于炯 李敏融合LightGBM与SHAP的糖尿病预测及其特征分析方法 被引量:15 2022年 人工智能在辅助医疗诊断方面得到广泛关注,对糖尿病预测的相关研究是近年来关注的一个热点问题.以皮马印第安人糖尿病数据集为研究对象,首先,对原始数据进行缺失值填充、异常值分析、标准化处理等工作的基础上,将预处理后的数据作为LightGBM训练模型的输入;其次,与已有工作中基于SVM、随机森林、决策树以及Xgboost等多种机器学习模型进行实验对比,结果表明本文模型在准确率、精确率、召回率、F1值、AUC值5项性能指标上均明显优于对比模型;最后,引入SHAP模型增强模型的可解释性,同时综合比较了LightGBM和Xgboost的特征重要性排序结果,识别出了影响糖尿病的主要因素,为糖尿病的疾病诊断提供决策参考. 王鑫 廖彬 李敏 李敏基于XGBoost的在线短租市场价格预测及特征分析模型 被引量:16 2021年 【目的】解决不同特征的房源缺乏合理定价建议的问题。【方法】基于Airbnb平台真实的营业数据,提出一种基于XGBoost的在线短租市场价格预测及特征分析模型。利用Lasso对原始数据进行特征提取并降维,再将特征提取后的数据作为XGBoost的输入,迭代训练获得最佳的预测模型,最后利用SHAP值对模型特征进行解释。【结果】实验结果表明,基于XGBoost的在线短租市场价格预测模型在调优超参数后,RMSE、MAE和R-squared分别能够达到0.091、0.065和0.798,优于4种主要的对比模型。【局限】由于数据源限制,模型训练数据未能与实时在线的业务数据流特征结合,可能导致模型实时适应能力偏弱。【结论】引入SHAP模型增强模型的可解释性,综合XGBoost与RandomForest的特征重要性排序结果,识别出影响房价的关键因素,为房东改进服务质量并提高收益提供决策参考。 曹睿 廖彬 李敏 李敏特征选择方法与算法的研究 被引量:24 2013年 特征选择的主要思想是通过去除一些包含少量或不相关的信息的特征去选择特征子集。特征选择方法可分为三大类:一是过滤式,二是封装式,三是嵌入式。鉴于目前存在大量的特征选择算法,为了能够适当地决定在特定的情况下使用哪种算法,需要提出可以依赖或判定的标准。文中的主要工作就是综述一些基本特征选择算法,根据文献中已有的理论和实验结果对特征选择方法和算法进行比较分类,然后提出一种可以依赖或判定的标准。 李敏 卡米力.木依丁关键词:特征选择算法 过滤式 嵌入式 AttRes34模型在食管鳞状细胞癌诊断中的应用价值 2022年 目的探讨基于注意力机制的ResNet34模型(Attention based ResNet 34 model,AttRes34)在食管鳞状细胞癌诊断中的应用价值。方法对2016年1月-2020年1月新疆医科大学附属肿瘤医院病理科收治的40例食管鳞状细胞癌患者资料进行回顾性研究。采用AttRes34模型对食管鳞状细胞癌进行辅助诊断。首先,将改进后的滑动窗口算法应用于原切片图像以生成众多的补丁图像;其次,通过AttRes34模型的Softmax分类器输出补丁图像的预测结果;最后,通过汇总补丁图像的预测结果(正常、鳞癌)推断出原切片的诊断结果。计算AttRes34模型的精度、召回率、F1分数、准确率,以及绘制受试者工作特征曲线(Receiver operating characteristic curve,ROC)和混淆矩阵,对模型的泛化性能进行评估,并与ResNet18、ResNet50模型进行比较。结果AttRes34模型对食管鳞癌组织和正常对照组织的总体分类准确率达到89.58%,ROC曲线下的面积(Area under curve,AUC)值达到0.975,其中阳性分类的精度、召回率以及F1分数分别为0.979、0.839和0.903。结论AttRes34模型对食管鳞状细胞癌的辅助诊断具有一定的临床价值。 曹燕珍 邓鑫 周盼运 李敏关键词:食管鳞状细胞癌