何祥 作品数:9 被引量:39 H指数:4 供职机构: 四川大学电子信息学院 更多>> 发文基金: 国防科技保密通信重点实验室基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
一种纸质图书数字化辅助阅读软件 本发明提出了一种纸质图书数字化辅助阅读软件。通过该软件的使用可以减少实体书签的使用,以及实体书签丢失带来的不便;可以为图书添加更为丰富的书签、并能够对书签进行检索;可提高阅读公共书籍的效率和质量,提供了解决无法在公共书籍... 方勇 何祥 刘亮文献传递 基于vmem文件的隐藏信息检测研究 2012年 针对采用Rootkit技术进行隐藏的恶意程序,文中提出了一种基于虚拟机内外视图交叉比对的恶意程序检测方案来提取其隐藏的信息。该方案通过将虚拟机内部获取的不可信系统信息和虚拟机外部通过vmem文件分析得到的可信系统信息进行交叉比对,发现系统中被Rootkit所隐藏的进程信息,使得Rootkit类型恶意代码检测的有效性得到了保障。 何祥 周安民 蒲伟 周妍关键词:恶意程序 ROOTKIT技术 交叉视图 信息安全专业创新实践能力培养体系建设的探索与研究 当前信息安全专业的人才培养体系着重于安全理论与技术知识的传授,在实践创新能力培养方面存在不足。且现有的实验培养体系中偏重于基础性、验证性实验,而缺乏设计性、综合性和创新性实验。通过现有的培养体系,学生难以获得系统的知识结... 方勇 何祥 刘嘉勇 刘亮关键词:创新实践能力 信息安全专业 文献传递 一种解决命名实体识别数据集类别标记失衡的方法 被引量:6 2020年 命名实体识别研究中常见的公开数据集普遍存在数据类别标记不平衡的问题,限制了基于统计学习模型方法性能的进一步提高.针对上述问题,提出了基于遗传算法的数据类别标记平衡方法.该方法基于原始数据集中已有的标记数据,通过修改遗传算法中的指标适应度函数和基因组合规则,合成类别分布均衡的文本用以扩充原始数据集,降低标记数据不平衡性从而改善命名实体识别的效果.为验证该方法的有效性,采用Bi-LSTM-CRF模型分别基于CoNLL 2003及JNLPBA数据集设计了该方法与平衡欠采样、随机过采样方法的对比实验.从实验中发现,提出的方法在CoNLL2003数据集上模型召回率提高3.26%,F 1值提高1.70%;在JNLPBA数据集上召回率提高2.44%,F 1值提高1.03%.实验结果表明,提出的方法能够有效地缓解类别标记失衡问题达到提高命名实体识别效果的目的. 许丽丹 刘嘉勇 何祥关键词:命名实体识别 遗传算法 基于上下文语义的恶意域名语料提取模型研究 被引量:4 2018年 针对目前基于白名单过滤技术在海量文本中恶意域名提取的漏报、误报等问题,提出了一种基于上下文语义的恶意域名语料提取模型。该模型分别从恶意域名所在语句的上下文单词、短语进行语义分析,并利用自然语言处理技术自动生成描述恶意域名的语料。通过该模型对公开的APT(Advanced Persistent Threat)分析文档数据提取了大量恶意域名语料数据。利用安全博客文章数据并结合基于随机森林算法的机器分类模型对论文提取的恶意语料的有效性进行了验证。 黄诚 刘嘉勇 刘嘉勇 刘亮 何祥关键词:文本挖掘 基于主题模型的中文词义归纳 被引量:1 2016年 词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法关键之处在于使用文档的主题概率分布来推断多义词的词义分布.实验结果表明,本文方法在测试数据上获得了77.58%FScore值. 高章敏 何祥 刘嘉勇 汤殿华关键词:主题模型 词义消歧 基于用户关系和文本的微博用户相似性度量 被引量:1 2019年 用户相似性度量是用户关系分析的基础,在推荐系统、用户聚类、社区发现等方面都有重要的意义。对于微博用户的社交关系和微博文本分别给出相似度计算方法,并通过加权的方式构建综合的用户相似性度量方法。最后进行用户相似性度量的实验分析和比较,实验结果表明,相对于传统的用户相似度计算方法,所提方法在准确率和召回率方面具有明显提升,说明该方法度量用户相似性的有效性。 黄建军 方勇 何祥关键词:社交网络 LDA 文本相似度 基于时空语义挖掘的城市功能区识别研究 被引量:11 2019年 针对目前城市功能区划分大多依靠人工完成,且未充分使用城市中时空数据的问题,提出一种基于时空语义挖掘的城市功能区识别方案.首先,选取某城市矩形区域为研究样本,并以建筑物为划分依据将研究样本划分为有效的基础区域;然后,对各基础区域内的新浪微博位置签到数据及POI(Points of Interest)数据进行时空语义挖掘,采用狄利克雷多项式回归(DMR)主题模型生成区域的功能性向量;最后,通过向量聚类,依据POI类别比例完成区域的功能性识别.实验结果表明,本方案相比基于POI密度的k-means聚类方案和基于潜在狄利克雷分布(LDA)主题模型的城市功能区识别方法具有更高的准确性,位置签到数据所表征出的人们活动模式可以揭示城市功能区之间的差异,在城市地理空间分析上具有良好的效果. 于璐 何祥 刘嘉勇关键词:时空数据挖掘 城市功能分区 主题模型 基于BLSTM-CRF模型的安全漏洞领域命名实体识别 被引量:16 2019年 非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量. 张若彬 刘嘉勇 何祥关键词:安全漏洞 CRF