higher0 2019-03-04
下面,我就使用Python,来看看各大媒体,是怎么评论这个事情的,使用Python抓取新浪微博,根据关键字“李小璐PGONE”,可以搜索到669条热门微博(这个并非所有的,而是当前新浪微博可查询的)。
图1、新浪微博媒体发布数据截图
接着,我们来统计媒体发布内容的词频,然后使用词云图,来展现词频。
图2、热门微博生成的词云
从词云中,我们可以看出,这个事件中,涉及到的人物有李小璐、PGONE、贾乃亮、王思聪、卓伟、马苏,其中,最无辜的是李小冉同学,因为名字类似,也被网友火热光临了一把。
图3、涉及的人物词频
接着,我们来看看网友们对该事件的评论如何,在李小璐的微博中,找到该微博:
图4、李小璐回复该事件的微博
直接抓取转发的4.5万用户评论,然后统计词频绘制词云,如下图所示:
图5、网友评论词云
可以看到,网友们的态度主要是集中在恶心、出轨以及相信、喜欢这两种态度上,但是呢,在网友的词频里面,竟然很少提及到PGONE,也就是说,在李小璐的微博下面,大家都是在讨论李小璐和贾乃亮的爱情啊。
下面给大家讲一个利用 Python实现新浪微博爬虫的例子。第一个模块,模拟登陆 sina 微博,创建 weiboLogin.py 文件,输入以下代码:
就分享到这个。
pytyhon学习资料
python学习资料