姚雨凌
- 作品数:1 被引量:6H指数:1
- 供职机构:清华大学理学院数学科学系更多>>
- 相关领域:理学文化科学更多>>
- 大数据信息采集及其偏差补救方法——以甜党和咸党的口味地盘之争为例被引量:6
- 2015年
- 在大数据的时代下,互联网虽然可以在很短的时间为舆情研究者提供海量的数据,但是,互联网获取的数据样本并非随机抽样,数据代表性的问题,使得研究者对这类数据的可靠性存在质疑。使用多层次回归和事后加权方法,调整互联网获取的数据,可以得到更合理的舆情估计值,重新分析甜党和咸党粽子口味地盘大战的例子中,结合从新浪微博自动抓取数据、分析文本的技术,实现特定议题舆情的自动采集,并提供回归调整的完整过程。本研究方法具有普适性,可以推广到其他的舆情主题。
- 苏毓淞姚雨凌
- 关键词:大数据