您的位置: 专家智库 > >

李少卿

作品数:1 被引量:7H指数:1
供职机构:复旦大学计算机科学技术学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇字符
  • 1篇字符串
  • 1篇字符串相似度
  • 1篇相似度
  • 1篇相似度计算
  • 1篇关键词识别
  • 1篇变体
  • 1篇词汇

机构

  • 1篇复旦大学

作者

  • 1篇吴承荣
  • 1篇钟亦平
  • 1篇曾剑平
  • 1篇李少卿

传媒

  • 1篇计算机应用与...

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
不良文本变体关键词识别的词汇串相似度计算被引量:7
2015年
随着网络技术的发展,网络空间出现了各种各样的文本交流类网络应用,如聊天室、BBS等。为维护网络环境的文明,这些网络应用中会将用户发表的"脏话"词汇进行过滤。有些恶意用户为了避免所发信息被系统过滤,经常会将"脏话"词汇进行变形处理,如何识别这些变形后的"脏话"词汇,是一个重要的问题。通过计算变异敏感词汇相似度,来对变形词汇进行识别。该方法具有如下特点:(1)计算结果接近于人脑识别的结果;(2)计算所用的时间复杂度较低;(3)对变体识别率较高。根据计算的相似度值,来决定是否对该疑似敏感词进行过滤。实验数据表明,所提出的相似度计算方法好于现有的算法。
李少卿吴承荣曾剑平钟亦平
关键词:字符串相似度
共1页<1>
聚类工具0