从微博数据看公众对刘翔摔倒的情绪反应
[来源:] 2012-08-13 02:05:00 编辑:socialflow 点击: 次
原文来自: SocialFlow数据团队
全
全
原文来自: SocialFlow数据团队
本文由socialflow授权虎嗅网发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处(虎嗅网)及本页链接。
原文链接http://www.huxiu.com/article/2600/1.html
全中国都在瞩目和期待刘翔110米跨栏比赛上的表现。在北京时间8月7号下午17:40分进行的伦敦奥运男子110米跨栏比赛中,刘翔踏栏摔倒。之后他用单脚跳过了110米的跑道。刘翔的摔倒在网上引起了巨大的反应,同时在西方媒体中也被广泛报道。然而,其中仅有一小部分报道了中国大陆民众的反应。这篇文章在China Hush上报道了中国用户对刘翔的积极支持,但是通过我们的分析,这并不是故事的全部。
我们通过分析15万条关于刘翔的微博,分词并析取出其中使用的字词。在分析中,我们发现,为刘翔呐喊助威的声音占了统治地位,然而也有微博用户激烈地批评刘翔。这是我们第一次能对如此数量的中国用户进行数据可视化和情感分析。
对刘翔摔倒的反应
我们的数据记录了共15万条从北京时间8月7号凌晨开始到8月10号凌晨包含关键词“刘翔”的微博。下图是关于他的微博数量随时间变化的分布。注意到最高峰出现的时间是8月7号下午17:40左右,即当时的比赛时间。
在所有这15万条微博中,11%包含了至少一条链接,5.5%包含了@其它用户,同时20.5%包含了表情符号。分享得最广的链接中包括一个要求参与者评价刘翔的投票,他在新浪上的个人介绍页面以及各种关于他摔倒的视频等。
下图中表示的是,在所有关于刘翔的微博中出现的最显著的名词和形容词。结点越大表明越多人使用过这个词。两个结点离得越近表明它们一起出现在同一用户微博中的频率越高。我们在构造出的这个图中,可以非常明显地发现刘翔支持者所用的词语(右下)以及批评者所有的词语(左上)的巨大区别。
公众的激烈反应并不令人惊讶。在刘翔之前退出北京奥运之后,许多人批评他忙于广告代言而疏于训练。而在他肌腱拉伤摔倒之后,许多微博用户指责刘翔是在假装摔倒。诸于“电影”,“广告”,“奥斯卡影帝”这样的词句充斥对他的批评之声中。
然而从另一个角度看,也有无数的用户支持刘翔。他们用的词句包括“坚强”,“荣誉”,“骄傲”,“奥运精神”等等。到底哪一派的声音更大呢?由图上可以看出,这部分中各个结点之间的边普遍更粗,表明更多的人在发表支持刘翔的微博。
追踪摔倒事件公众的情感变化接下来,我们利用情感分析技术(详细细节可以参考这篇KDD DEMO)来绘制公众在刘翔比赛前后的情感变化。每一种情绪我们用不同的颜色来区分:激动(蓝色),吃惊(红色),悲伤(橙色),怀疑(绿色),感动(紫色)。注:下图中仅为动态原图的截图,原文中可以与数据进行交互,请点这里访问原文
比赛于7日北京5:40举行,在图上亦有体现,人们的情绪在那一时刻发生了剧烈的变化。在比赛之前,人们的情绪更多是激动和兴奋(蓝色线条)。同时,有意思的是,从数据上来看,人们对刘翔的摔倒并没有表示出过于惊讶,如图中的红线所示,赛前和赛后人们惊讶的情绪趋于不变。刘翔摔倒后,人们激动心情迅速衰减,与此同时悲伤的情绪迅速蔓延开来,达到顶峰,如图中橙色线所示。人们的感动(紫色)稍慢于激动和悲伤的变化,这主要是因为在刘翔摔倒之后一小段时间内只是在赛道上休息,之后才用单脚跳完了全程。
值得注意的是,即使“怀疑”的情绪一开始增长较慢(绿色线所示),在10点之后怀疑的情绪却逐渐超过了感动的情绪。但是从上文的实体词图中可以看出,批评刘翔的词句无论是频率还是数量都远少于支持的一方。一个解释是,这说明表达怀疑的用户更倾向使用感情符号,并在微博中掺杂带有强烈情感的词句。从情感曲线上也可以看出,激动的情绪还是占了主导(注意,这里的"激动"还包括在比赛结束后为刘翔加油打气的激励)。
结论
刘翔的摔倒激起了激烈的讨论,并且吸引了无数人的目光。在Facebook上、twitter上都有关于他的摔倒的广泛讨论,同时均链接到主要的媒体报道。同样,在中国,微博也为这样的报道页面带来了巨大的流量。信息正以不可思议的速度在中国亿万微博用户中传播。这是我们第一次,可以以这样近的距离来观察中国,以更细微的角度来接触这个国家民众之间的对话和理解这个国家。
本文由socialflow授权虎嗅网发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处(虎嗅网)及本页链接。
原文链接http://www.huxiu.com/article/2600/1.html
上一篇:“8·15”的魅族,“8·16”的小米 下一篇:我们既不是X粉,也不是X黑