孙界平 作品数:23 被引量:188 H指数:10 供职机构: 四川大学计算机学院 更多>> 发文基金: 国家自然科学基金 南方电网公司科技项目 新世纪高等教育教学改革工程 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于状态转移的奖励值音乐推荐研究 被引量:3 2018年 听音乐有助于纾解人们的压力,现已成为大众娱乐的一种重要方式.互联网的发展使人们听音乐变得方便,但同时也使得"信息过载"的问题变得日益严重.尽管各大公司平台纷纷推出了针对音乐的推荐系统来解决这个问题,但现有传统的推荐系统并不能保证用户体验,用户对精准推荐的需求仍很强烈.为解决"信息过载"问题的同时并保证用户体验,本文提出了基于状态转移的奖励值算法.该算法包括对用户自身喜好建模,并利用用户集数据提出的音乐流行度和用户从众度,根据用户喜好、音乐流行度以及状态转移概率定义奖励函数.所提出的算法能个性化地对音乐库数据进行筛选和聚类.在对数据进行处理时,采用Davies-Bouldin指数对声乐特征进行离散化.在模型训练时,采用基于列表距离最小化的计算方法对参数进行选择.通过在Million Song Dataset开源音乐数据集上的实验,表明在算法中加入音乐流行度对推荐效果有一定影响,本文所给出的推荐算法能够提高推荐的效果,说明了本文算法的有效性. 谭斌 孙界平 琚生根 李微关键词:用户偏好 离散化 关于软件工程专业教育方案的探讨 本文对软件工程专业教育方案进行了探讨。文章提出了一个适合国内软件工程专业的教育方案,并给出了软件工程专业教学应该涵盖的基本内容和计划。 洪玫 李旭伟 孙界平 张卫华 吴琼关键词:高等教育 软件工程专业 课程设置 教学模式 文献传递 基于Co-training的用户属性预测研究 2017年 针对当前基于第三方应用数据进行用户属性预测算法研究,其较少考虑应用前台实际使用时长问题,由此,本文在应用的使用频率及使用时长的基础上,构造了应用前台均使用时长特征,该特征能进一步刻画用户对应用的兴趣度;同时,为充分利用大量未标注数据,从多角度特征对用户属性进行预测,由此本文采用了Co-training框架,该框架包含两个均由栈式自编码器与神经网络相结合的网络结构。实验过程中,对于栈式自编码算法,先利用未标注的数据对网络进行参数初始化,使得网络参数处于一个较优的位置,再利用有标注的数据,采用基于准确率的梯度下降算法,对网络参数进行更新,最终达到收敛。实验结果表明,本文算法在准确率、召回率、F1值上均有所提高。 金玉 王霞 琚生根 孙界平 刘玉娇关键词:用户属性 CO-TRAINING 梯度下降算法 双创教育模式下计算机网络综合性实验教学探讨 被引量:13 2018年 以计算机网络实验课程为例,分析了目前实验课程教学注重基础实验教学而忽略设计综合性实验,学生缺乏对知识的融会贯通,以至于学生的实践能力较差的问题,探讨了计算机网络综合实验改革的方案,提出了在基础实验之上设计行之有效的综合性实验,并设计了综合性实验大纲。通过在实验课程中增加综合实验内容,能够更好地提高学生创新能力和创新意识,激发学生实验兴趣并帮助他们对理论课程知识点的融会贯通。 陈黎 饶坚 孙界平 琚生根关键词:计算机网络 模拟器 基于深度神经网络和概率矩阵分解的混合推荐算法 被引量:14 2019年 针对个性化推荐中用户和项目描述信息未充分利用,用户评分矩阵数据集极端稀疏的情况,提出了基于深度神经网络和概率矩阵分解(PMF)的混合推荐算法.首先,对用户和项目描述信息进行预处理,形成包含用户偏好特征的用户和项目特征集,再将各特征输入深度神经网络模型中进行训练.同时,利用概率矩阵分解模型,根据用户评分矩阵通过最大后验估计优化得到潜在特征向量;然后,通过对概率矩阵分解模型的用户和项目潜在特征向量以及深度神经网络模型的真实特征向量进行迭代更新,收敛得到融合用户和项目真实信息的潜在特征向量;最后,利用该特征向量对用户进行个性化推荐.实验证明,本文算法较经典推荐算法以及前人算法在均方误差与平均绝对误差指标上均有改善,说明本文算法的有效性. 胡思才 孙界平 琚生根 王霞关键词:矩阵分解 神经网络 特征向量 卷积 融合后验概率校准训练的文本分类算法 2022年 用于文本表示的预训练语言模型在各种文本分类任务上实现了较高的准确率,但仍然存在以下问题:一方面,预训练语言模型在计算出所有类别的后验概率后选择后验概率最大的类别作为其最终分类结果,然而在很多场景下,后验概率的质量能比分类结果提供更多的可靠信息;另一方面,预训练语言模型的分类器在为语义相似的文本分配不同标签时会出现性能下降的情况。针对上述两个问题,提出一种后验概率校准结合负例监督的模型PosCalnegative。该模型端到端地在训练过程中动态地对预测概率和经验后验概率之间的差异进行惩罚,并在训练过程中利用带有不同标签的文本来实现对编码器的负例监督,从而为每个类别生成不同的特征向量表示。实验结果表明:PosCal-negative模型在两个中文母婴护理文本分类数据集MATINF-C-AGE和MATINF-C-TOPIC的分类准确率分别达到了91.55%和69.19%,相比ERNIE模型分别提高了1.13个百分点和2.53个百分点。 江静 陈渝 孙界平 琚生根关键词:文本分类 融入多尺度特征注意力的胶囊神经网络及其在文本分类中的应用 被引量:3 2022年 近些年来,胶囊神经网络(Capsnets)由于拥有强大的文本特征学习能力而被应用到文本分类任务中。目前的研究工作大都将提取到的文本多元语法特征视为同等重要,而忽略了单词所对应的各个多元语法特征的重要程度由具体上下文决定的这一事实,这将直接影响到模型对整个文本的语义理解。针对上述问题,该文提出了多尺度特征部分连接胶囊网络(MulPart-Capsnets)。该方法将多尺度特征注意力融入到Capsnets中,多尺度特征注意力能够自动选择不同尺度的多元语法特征,通过对其进行加权求和,就能为每个单词精确捕捉到丰富的多元语法特征。同时,为了减少子胶囊与父胶囊之间的冗余信息传递,该文也对路由算法进行了改进。该文提出的算法在文本分类任务上针对7个著名的数据集进行了有效性验证,和现有的研究工作相比,性能提高显著,说明该文的算法能够捕获文本中更丰富的多元语法特征,具有更加强大的文本特征学习能力。 王超凡 琚生根 孙界平 陈润关键词:文本分类 路由算法 基于矩阵分解的电力物资需求预测 被引量:16 2019年 准确预测变电站及配网工程的物资需求,对于节约工程成本,提高资金利用率,具有重要意义.尽管研究者在电力物资需求预测方面已经开展了一系列的研究,提出了很多预测模型和算法,例如基于神经网络的算法,然而,这些算法普遍存在输入数据过于简单和理想、仅对少数几种物资的需求量进行了预测实验、预测的准确率偏低等不足.因此,目前生产系统普遍采用人工方式进行电力物资需求预测,由有经验的领域专家根据工程初步设计方案预测各类物资的需求量.为了解决现有电力物资需求预测方法存在的不足,本文提出基于矩阵分解的预测方法,以电网建设项目物资需求历史数据和项目计划的部分物资作为输入,通过矩阵分解算法对项目其他物资需求用量进行预测.矩阵分解算法不需要大量的历史用量数据,只用部分项目的物资数据就能进行预测,且算法不需要提前进行训练. 王竹君 朱颖琪 孙界平关键词:电力物资 矩阵分解 基于段落内部推理和联合问题答案匹配的选择型阅读理解模型 被引量:4 2019年 针对当前机器阅读理解方法中仅将问题与段落匹配会导致段落中的信息丢失或将问题和答案连接成单个序列与段落匹配会丢失问题与答案之间的交互,和传统的循环网络顺序解析文本从而忽略段落内部推理的问题,提出一种改进段落编码并且将段落与问题和答案共同匹配的模型.模型首先把段落在多个粒度下切分为块,编码器利用神经词袋表达将块内词嵌入向量求和,其次,将块序列通过前向全连接神经网络扩展到原始序列长度.然后,通过两层前向神经网络建模每个单词所在不同粒度的块之间的关系构造门控函数以使模型具有更大的上下文信息同时捕获段落内部推理.最后,通过注意力机制将段落表示与问题和答案的交互来选择答案.在SemEval-2018 Task 11任务上的实验结果表明,本文模型在正确率上超过了相比基线神经网络模型如Stanford AR和GA Reader提高了9%~10%,比最近的模型SurfaceLR至少提高了3%,超过TriAN的单模型1%左右.除此之外,在RACE数据集上的预训练也可以提高模型效果. 王霞 孙界平 琚生根 胡思才关键词:多粒度 融合预训练语言模型的成语完形填空算法 被引量:3 2022年 根据上下文语境选择恰当的成语,是自然语言处理领域的重要任务之一.现有的研究将成语完型填空任务看成是文本匹配问题,虽然预训练语言模型能够在文本匹配研究上取得较高的准确率,但也存在明显的缺陷:一方面,预训练语言模型作为特征提取器时,会丢失句子间相互信息;另一方面,预训练语言模型作为文本匹配器时,计算开销大,训练时间和推理时间较长.另外,上下文与候选成语之间的匹配是不对称的,会影响预训练语言模型发挥匹配器的效果.为了解决上述两个问题,利用参数共享的思想,提出了TALBERT-blank.TALBERTblank是将成语选择从基于上下文的不对称匹配过程转换为填空与候选答案之间的对称匹配过程,将预训练语言模型同时作为特征提取器和文本匹配器,并对句向量作潜在语义匹配.这样可以减少参数量和内存的消耗,在保持准确度的情况下,提高了训练和推理速度,达到了轻量高效的效果.在CHID数据集上的实验结果表明:作为匹配器,TALBERT-blank相较于ALBERT,在保证准确率的情况下,更大限度地精简了模型的结构,计算时间进一步缩短54.35%. 琚生根 黄方怡 孙界平关键词:文本匹配