陈小军 作品数:53 被引量:205 H指数:6 供职机构: 中国科学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国科学院战略性先导科技专项 更多>> 相关领域: 自动化与计算机技术 文化科学 医药卫生 经济管理 更多>>
一种基于多属性的误发邮件检测方法 本发明提出了一种基于多属性的误发邮件检测方法,包括以下步骤:从标记的多个邮件中提取内容特征属性、社会关系属性及通信行为属性;根据所述内容特征属性、社会关系属性及通信行为属性建立基于SVM分类模型;提取新邮件的内容属性、社... 蒲以国 陈小军 时金桥 郭莉 柳厅文 文新 徐睿文献传递 基于指纹多重哈希布隆过滤器的网络取证内容溯源方法 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个... 陈小军 时金桥 蒲以国 郭莉 徐菲 陈雁 于晓杰 文新 徐睿文献传递 一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置 本发明涉及一种基于字节对编码的密码猜测集生成方法、密码破解方法及装置。该方法首先采用字节对编码对训练集密码进行分词,然后根据分词的结果,采用马尔可夫模型生成密码猜测集。进一步地,使用所述密码猜测集,通过进行字符串匹配来破... 陈小军 王大魁 时金桥 王星星 徐睿 文新 张闯 胡兰兰文献传递 一种文档图像的版式识别方法 本发明公开了一种文档图像的版式识别方法,首先设计了一个版式入库功能,库中会保存版式内容,以及由版式内容相对字高、对齐方式生成的版式序列号,如果一张未知图片经过版式分析,得到的版式序列号与库中的某个版式序列号一样,那么将通... 时金桥 范晓鹏 陈小军 郭莉 蒲以国 文新 邹亚劼 王洋文献传递 基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置 本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子s<Sub>j</Sub>,得到句子包;结合所述目标实体... 陈小军 李毓伟 王大魁 许洪波 曾帅 丁阳阳一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统 本发明涉及一种基于面向数据内容的云消息中间件的数据交换方法和云消息中间件系统。该方法包括:1)在不同的管理机站部署基于云消息中间件的节点,由各个所述节点构成消息传输网络;2)在所述消息传输网络的各节点中部署基于数据内容的... 陈小军 张闯 时金桥 丁宏 文新 王大魁 胡兰兰 王文安文献传递 一种高效可扩展的安全的文档相似性计算方法和装置 本发明涉及一种高效可扩展的安全的文档相似性计算方法和装置。该方法使用MinHash文档指纹算法将文档表示成固定数量指纹的指纹集合,既可以较好衡量文档间的相似性,又控制了指纹集合的规模;将多个指纹集合存储到multi‑GB... 陈小军 于晓杰 时金桥 申立艳 文新 张闯文献传递 一种基于相似度正则的神经网络剪枝方法 本发明公开了一种基于相似度正则的神经网络剪枝方法。本方法为:1)对待处理的神经网络进行预训练;2)对预训练后的神经网络进行剪枝:首先设定神经网络的稀疏度为s%;然后计算神经网络参数的第s分位数,将参数绝对值小于该第s分位... 陈小军 王少璞 熊刚 赵振东 丁阳阳 李晓颖隐私保护集合交集计算技术研究综述 被引量:18 2017年 隐私保护集合交集(private set intersection,PSI)计算属于安全多方计算领域的特定应用问题,不仅具有重要的理论意义也具有很强的应用背景,在大数据时代,对该问题的研究更是符合人们日益强烈的在享受各种服务的同时达到隐私保护的需求.对安全多方计算基础理论进行了简要介绍,并重点介绍了目前主流的安全多方计算框架下2类PSI研究技术:传统的基于公钥加密机制,混乱电路,不经意传输的PSI协议和新型的云辅助的PSI协议,并对各类协议的过程、适用性、复杂性进行简要分析总结.同时,也对隐私保护集合交集问题的应用场景进行详细说明,进一步体现对该问题的实际研究价值.随着对该问题的不断深入研究,目前已经设计了在半诚实模型下快速完成上亿元素规模的隐私集合求交集协议. 申立艳 陈小军 时金桥 胡兰兰一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置 本发明涉及一种基于主题词类相似性的文档语义表示方法、文本分类方法和装置。该基于主题词类相似性的文档语义表示方法包括:1)使用词向量模型对语料进行训练,得到词向量;2)在语义空间内对词向量进行聚类;3)使用WMD算法计算待... 陈小军 王大魁 时金桥 白离 胡兰兰 文新 张闯 马建伟文献传递