国家自然科学基金(71103085)
- 作品数:6 被引量:126H指数:6
- 相关作者:丁晟春孟美任李霄周夏伟巢乃鹏更多>>
- 相关机构:南京理工大学中国科学院更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金江苏省教育厅哲学社会科学基金更多>>
- 相关领域:文化科学经济管理自动化与计算机技术更多>>
- 面向中文微博的观点句识别研究被引量:11
- 2014年
- 中文微博包含了用户对热点话题的观点,对其进行观点挖掘可以实现突发事件预警、舆情监控等。目前,微博研究多数基于英文语料,中文微博观点句的挖掘大多混淆在情感挖掘中少量提及,由于中文微博特殊的语体特征,导致传统中文文本观点挖掘模型无法取得理想效果。区别于已有的情感挖掘工作,本文依据中文微博的语体特征分析结果选取特征,除了选取情感特征外,还加入主张性动词、语气词、程度副词以及固定词性结构等观点句特征,采用CRFs模型进行观点句识别研究。实验结果表明,仅选取情感特征准确率较高,但召回率仅为32.1%。而加入其他观点句特征后,召回率显著提高到61.8%。该方法应用于2012年中国计算机学会(CCF)组织的“观点句识别”测评任务中,取得了很好的效果。
- 丁晟春孟美任李霄
- 关键词:语体特征
- 在线商品评论信息可信度影响因素实证研究被引量:28
- 2013年
- 商品评论信息对于消费者的购买决策起着越来越重要的作用,而评论信息可信度影响因素也逐渐成为人们的关注热点。针对评论信息的文本内容、长度、情感倾向、时效性、发布者、商家活动等特征,通过问卷调查方式对大学生消费群体进行评论信息可信度影响因素实证分析,结果表明:评论信息文本内容中产品描述信息的详细度、其情感倾向的客观性,发布者身份的明确性,信息发布的及时性,其他评论阅读者的认同度等因素都会对评论信息的可信度产生正面影响。
- 龚思兰丁晟春周夏伟巢乃鹏
- 关键词:大学生
- 商品评论信息可信度研究被引量:20
- 2012年
- 网络商品评论信息的可信度对用户的购买行为有重要影响。对国内外网络商品评论信息可信度的研究现状和研究成果进行了分析总结,提出了基于文本挖掘的商品评论信息可信度测评模型,详细分析了商品评论信息的可信度特征,并对研究中的关键问题进行了探索,提出了解决方法。
- 刘逶迤逯万辉丁晟春
- 关键词:文本挖掘
- 在线中文商品评论可信度研究被引量:21
- 2013年
- 对在线中文商品评论中可信度较低的评论信息进行过滤,为消费者提供对制定购买决策有帮助的评论。在深入分析在线中文商品评论特点的基础上,结合相关研究成果,通过问卷调查进行可信度影响因素的实证分析。根据实证结果,选取内容完整性、情感平衡性、评论时效性以及发布者身份明确性4类特征,采用CRFs模型进行评论可信度4级分类,并进行特征组合实验,得到最佳特征组合。实验效果显著,分类模型正确率均在75%以上。该研究成果可以用于改善现有的"人工效用评价"方式,为在线评论的优化过滤提供一种新的方法与思路。
- 孟美任丁晟春
- 关键词:影响因素
- 垃圾商品评论信息的识别研究被引量:33
- 2013年
- 从信息有用性的角度对垃圾商品评论信息进行分析,选择数码领域的相机评论作为研究对象,构建数据集,从评论、评论者和被评论的商品三个方面选择11个特征,使用支持向量机模型中4种常用的核函数进行垃圾商品评论的识别,对识别效果较好的RBF核函数中的参数C和γ进行优化,使得商品评论中的垃圾评论识别的准确率提高到78.16%,召回率提高到72.18%,并选取4种不同特征组合进行对比,证明评论、评论者和被评论的商品三大特征组合的效果最好,最后通过与Logistic回归模型的对比,验证SVM对垃圾评论的识别效果明显优于其他算法。
- 李霄丁晟春
- 关键词:SVM垃圾评论核函数
- 虚假商品评论信息发布者行为动机分析被引量:37
- 2013年
- 由于商品评论信息商业和公众价值的不断提高,促使了虚假评论信息的产生,使得商品评论信息可信度受到严重影响。通过对从评论信息发布平台上收集到的语料以及对东风村网商的实地调查分析,分别从推销、诋毁、干扰、无意义四个方面分析了虚假评论信息发布的动机,并且结合相应数据对出于该动机的造假者的特点进行分析,最后依据前文对造假动机的研究,分析了虚假评论信息发布者的造假行为以及隐藏行为。为后续的虚假商品评论自动检测系统的研究提供了重要理论依据。
- 孟美任丁晟春
- 关键词:动机行为