使用scrapy抓取Youtube播放页数据

Catastrophe 2019-06-30

可参看Knowsmore

抓取Youtube播放页数据的前提是scrapy部署的机器可以正常访问Youtube网站

抓取的原理是读取Youtube播放页桌面版网页源代码中的全局变量： ytInitialData

存取到Mongo中的数据如下：

{
    "title" : "20130410 锵锵三人行 陈平原谈中国教育问题",
    "view_count" : "12,407 views"
}

代码如下：

# -*- coding: utf-8 -*-
import scrapy
import re
import json
from scrapy import Selector
from knowsmore.items import YoutubeItem
from ..common import *

class YoutubeSpider(scrapy.Spider):
    custom_settings = {
        'DOWNLOADER_MIDDLEWARES' : {
        }
    }

    name = 'youtube'
    allowed_domains = ['www.youtube.com']
    start_urls = ['https://www.youtube.com/watch?v=3vkqOdMBP48']

    def parse(self, response):
        ytInitialData = r1(r'ytInitialData"\] = (.*?)}};', response.body)

        if ytInitialData:
            ytInitialData = '%s}}' % ytInitialData
            ytInitialDataObj = json.loads(ytInitialData)
            
            videoInfo = ytInitialDataObj['contents']['twoColumnWatchNextResults']['results']['results']['contents'][0]['videoPrimaryInfoRenderer']
            Item = YoutubeItem(
                title = videoInfo['title']['simpleText'].encode('utf-8'),
                view_count = videoInfo['viewCount']['videoViewCountRenderer']['viewCount']['simpleText']
            )
            yield Item

: Catastrophe

相关推荐

将Youtube视频插入Github Markdown文本中

Github的ReadMe文件暂时不支持Youtube视频文件，所以目前的做法都是用一个图片封面，它的链接??<a href="{video-url}" title="Link Title"><im

Hesland 0喜欢 / 0评论 2020-04-20

一起赚美元 | 如何从Youtube、Instagram视频下载器每月赚取12000美元

ahsxsk的学习之路 0喜欢 / 0评论 2020-01-29

「简单实战」YouTube IFrame Player API 的使用

业务需求需要在自己的网页上嵌入油管上的视频，所以去踩了油管 IFrame Player API 的坑。其实和大多数国内视频网站的 ifram Embed 方式是相似，比如说爱奇艺、腾讯视频、优酷等。在这些视频网站上你会发现都有分享功能，其中有一项就是通用

ForEachkaka 0喜欢 / 0评论 2019-11-04

看一次Youtube，有多少AI算法为你服务？

每个月，超过19亿的用户登录YouTube。每天，用户在Youtube上观看的视频超过10亿小时。仅在19年第一季度，就有830万视频从YouTube上被删除，其中76%的视频是由AI分类器自动识别的。YouTube如此重视删除劣质内容的原因，一是来自品牌

zhbbupt 0喜欢 / 0评论 2019-09-23

害怕被攻击？YouTube 干脆禁掉了黑客教学视频

近日，YouTube 冻结了 Kody Kinzie 在 Null Byte 频道下的 Cyber Weapons Lab 栏目，其理由是该栏目违反了 YouTube 社区准则中禁止传播黑客教学内容的条例，向用户展示了如何绕过安全的计算机系统。这一消息在网

bjzhangfei 0喜欢 / 0评论 2019-07-05

Mac电脑下载YouTube视频的方法

Windows上面下载YouTube视频的软件有很多，今天我们来谈谈Mac电脑上面的软件。虽然Mac系统依然很小众，但是苹果也是全球第4大PC厂商，使用Mac电脑的人也不少了。下面我们一起来看一下吧！客户端软件的特点是功能相对比较强大，但是可能会占用比较大

vitavae 0喜欢 / 0评论 2019-07-01

【技术性】如何快速上手知识概念

我发现自己特别懒，碰到不懂的concepts未必能有好奇心马上去搜索和理解它，这样长期以往会造成阻碍，譬如做search却不理解retrieval。首先是概念，先百度之，百度不行就优先youtube之，实在不行才看wikipedia，因为我总觉得wiki看

ksjlhy 0喜欢 / 0评论 2019-06-29

带你重读Youtube深度学习推荐系统论文，惊为神文

本文约5400字，建议阅读10+分钟。本以为毫不起眼的地方，也藏着Youtube工程师宝贵的工程经验。一是工程导向的；二是阿里、facebook、google等一线互联网公司出品的；三是前沿或者经典的。第一遍读这篇论文的时候，我想所有人都是冲着算法的架构去

moshlwx 0喜欢 / 0评论 2019-02-03

原来YouTube推荐系统的内幕是这样……

为什么YouTube平台上会源源不断产生优质视频和优质广告，真的只是偶然吗？为什么用户一上youTube就黏住了，这背后到底下了多大的功夫研究人性的细节？如此海量的数据，如何精准地推送给每一个恰当的人？这篇文章是继我们上一篇《可怕！YouTube算法如何让

simplehap 0喜欢 / 0评论 2017-09-01

可怕！YouTube算法如何让小孩沉迷到不可自

每个人小时候都渴望拥有力量。可这对于蹒跚学步的孩子们来说，太不现实了，毕竟他们什么力量都没有。因此，他们总要乱发脾气、无理取闹。(不，我要的是这个香蕉，不是那个……它们看起来是一样，但你刚刚剥皮的那个我就是不要。这种倾向同样也能用来解释YouTube视频在

hanyanqing 0喜欢 / 0评论 2017-08-28

Youtube视频推荐算法的前世今生

第一阶段，基于User-Video图游历算法，2008年[1]。在这个阶段，YouTube认为应该给用户推荐曾经观看过视频的同类视频，或者说拥有同一标签的视频。然而此时，YouTube的视频已是数千万量级，拥有标签的部分却非常小，所以如何有效的扩大视频标签

yimixgg 0喜欢 / 0评论 2018-08-14

主要推荐系统算法总结及Youtube深度学习推荐算法实例概括

现如今，许多公司使用大数据来做超级相关推荐，并以此来增加收益。在海量推荐算法中，数据科学家需要根据商业限制以及需求来选择最佳算法。为使其简单化，Statsbot 团队为现有的主要推荐系统算法准备了一份概述。协同过滤及其变式是最常用的推荐算法之一。协同过滤有

dbhllnr 0喜欢 / 0评论 2017-07-09

YouTube上最受欢迎的十大机器学习视频（最新）

虽然 YouTube 有很多不错的机器学习视频，但是很难搞清楚是否值得一看，何况每分钟上传的视频长达 300 小时。在本文中，我们整理了观看量最高的十大机器学习视频。另外，我们也添加了 4 个最受欢迎的相关视频列表。这份顶级机器学习视频排名包括斯坦福、加

qinrui 0喜欢 / 0评论 2017-05-04

谷歌为YouTube添加新功能：利用机器学习自动生成音效字幕

音频对于我们对世界的感知的影响的巨大自然不言而喻。语音显然是人们最熟悉的通信方式之一，但环境声音也能传达很多重要的信息。我们可以本能地响应这些背景声音所创造的语境，比如被突然出现的喧闹而吓到、使用音乐作为一种叙述元素或者在情景喜剧中将笑声用作一种观众提示。

Sigh 0喜欢 / 0评论 2017-03-24

这才是谷歌、Twitch、YouTube等巨头公司如此青睐HTML5的原因？

如今越来越多的人投入到HTML5开发行列，这么多学习的人市场有没有饱和，会不会学完之后不好找工作呢？对于这样的疑问，我想很多同学都会有疑问，那今天就说说，HTML5的就业问题。HTML5不仅在PC端，更是在移动端上也有广泛的应用。HTML5全栈开发技术降低

YannZoe 0喜欢 / 0评论 2018-09-17

Google的四大公司，安卓，YouTube，搜索地图和广告

Google不只是一个搜索引擎。它的总公司是Alphabet，事实上Google拥有多家公司。Google拥有200多家公司，其中包括机器人，制图，视频广播，电讯，奖学金和烟雾报警器。在收购不能增加收入的情况下，Google倾向于出售该公司。我们已经选择了

windgoogle 0喜欢 / 0评论 2017-08-18

YouTube测试新版HTML 5播放器功能已接近flash版

YouTube最近改进了其HTML 5播放器，目前其可提供的功能几乎可以跟flash播放器所媲美了。现在你可以在HTML 5版的播放器里打开注释和字幕，通过右键菜单你还可以：。如果你使用nightly的Firefox或Chrome Dev分支的话，在You

knijiokm 0喜欢 / 0评论 2011-11-22

使用Chrome扩展将YouTube播放器控件添加到Linux桌面

一个我怀念的 Unity 功能是在 Web 浏览器中访问 YouTube 等网站时在 Ubuntu 声音指示器中自动出现播放器控件，因此你可以直接从顶部栏暂停或停止视频，以及浏览视频/歌曲信息和预览。这个 Unity 功能已经消失很久了，但我正在为 Gno

新地址zhanglin 0喜欢 / 0评论 2018-10-15

Linux下本地播放Youtube客户端Minitube 安装

Minitube 是一款Linux下本地播放Youtube的客户端，支持Windows和MacOS。可以播放、下载Youtube视频。Minitube 1.4于今日发布，该版本增加了对Youtube 频道支持，同时修订了存在的一些Bug。

linuxisperfect 0喜欢 / 0评论 2011-02-09

如何破解YouTube视频推荐算法

如果你是某个发行渠道的内容工作者，那么内容的成败就取决于发行机制的运转逻辑。比如说，你制作了一档电视节目，你很想它能火起来，那么你就得知道该在哪里切入广告，怎么宣传节目，上哪个频道播放，所选的频道能被多少家庭收看，等等，诸如此类。YouTube没有把他们算

tracy 0喜欢 / 0评论 2016-12-09

网页设计80/20法则过时现在流行1%法则

一个经验法则正在逐渐成型，那就是如果在网上有100个人，只有1一个人会创造内容，10个人会与其互动而其他89个人仅仅是浏览。网页设计的80/20规则你可知道？这是一个迷因现象从Youtube统计出来的，仅仅在18个月之内已经扩散到了从零到60%的在线视频

维爱丝 0喜欢 / 0评论 2011-05-06

谷歌Chrome重要改进：支持VP8/WebM视频格式

两周前，Google在I/O2010大会上正式宣布了WebM项目，虽然Google随即在Chrome本后的开源软件Chromium上加入了VP8/WebM的支持，但这仅仅是Chrome用户的一小部分。目前Google终于在继FireFox和Opera之后在

指尖 0喜欢 / 0评论 2010-06-04

谷歌YouTube上打广告力赞Chrome浏览器

5月7日消息，谷歌在推出自己的浏览器Chrome八个月后，通过在YouTube上传宣传片掀起了一轮充分展示其服务优势的营销活动，旨在吸引更多的用户。据国外媒体报道，谷歌此次共在YouTube上发布了11部短片，其中大谈浏览器的好处，并声称Chrome最大的

beenyoung 0喜欢 / 0评论 2009-05-07

Youtube开放HTML 5视频功能

hl=en，大陆读者欲进入此站点请手脚并用），从该站上选择“HTML 5 Video”选项，便可进入HTML 5视频的演示区。

lupeng 0喜欢 / 0评论 2010-01-21

php获取YouTube视频信息的方法

PHP100 0喜欢 / 0评论 2019-03-28

同样做直播，FB凉了，YouTube却雄起？哪些打法可供借鉴

新闻媒体和游戏视频内容制作者们注意到，最近YouTube直播的收视量激增。YouTube的直播功能早已存在，近期也没有任何重大的算法策略调整，观众为何会突然增加？本期全媒派为你揭晓YouTube和Facebook在直播之路的不同打法。虽然Uygur无法量化

BitTigerio 0喜欢 / 0评论 2018-05-24

YouTube非法收集儿童数据隐私保护团体提起指控

安科科技讯北京时间4月10日上午消息，23个隐私及儿童保护团体向FTC提交文件，指责YouTube非法收集儿童数据。无商业化童年运动组织是所有团体的领导者，它认为YouTube侵犯了《儿童隐私保护法案》，未经父母允许，YouTube收集13岁以下儿童的数

航通社 0喜欢 / 0评论 2018-04-10

YouTube枪击案后硅谷CEO们首次呼吁加强枪支管控

4月5日消息，据国外媒体报道，当地时间周二下午，数名硅谷科技领袖呼吁加强枪支管控，此前一名女子在YouTube总部开枪打伤了3人，之后自杀。科技公司在很大程度上避免参与美国枪支管制的话题，但他们此前一直推动其他热门话题的进展，从气候变化到同性婚姻以及全面的

航通社 0喜欢 / 0评论 2018-04-05

YouTube枪击案震惊硅谷巨头高管呼吁加强枪支管制

安科科技讯北京时间4月4日下午消息，YouTube枪击案发生后，知名科技公司高管纷纷呼吁加强枪支管制。在这次袭击事件中，至少三人受伤，疑似袭击者饮弹自尽。袭击发生在谷歌旗下视频服务YouTube位于加州圣布鲁诺市的总部。YouTube的枪击事件让美国围绕

航通社 0喜欢 / 0评论 2018-04-04

YouTube总部枪击案现场直击，硅谷大佬说了什么？

北京时间 4 月 4 日凌晨，位于美国加州旧金山湾区San Bruno的YouTube公司总部发生枪击案。目前关于枪手的身份还未公布，其作案动机也仍在调查中，根据当地警方的初步判断，此次枪击案起因或许是私人之间的冲突。有消息称枪击事件始于男女情侣之间的情感

航通社 0喜欢 / 0评论 2018-04-04

库克等科技界CEO就枪击案发声：支持谷歌、YouTube

凤凰网科技讯据CNBC网站北京时间 4 月 4 日报道，谷歌公司旗下视频网站YouTube总部在周二发生枪击案，导致至少三人受伤，枪手疑犯自杀。在这起悲剧发生后，科技行业纷纷发声，公开表示对YouTube的支持。苹果公司CEO蒂姆·库克、亚马逊公司CEO

深圳湾 0喜欢 / 0评论 2018-04-04

YouTube首次成为美国最赚钱iPhone应用：每天盈利超10万美元

3月22日消息，据科技博客Techcrunch 报道，YouTube在周二首次成为美国顶级销售iPhone应用程序，也就是成为“Top Grossing ”排行榜的第一名，之前的排名最高只到第3位。不过YouTube只是在美国排到了第1位，在其它国家还没有

跨越美利坚面试创业技术培训 0喜欢 / 0评论 2018-03-22

谷歌YouTube对原创影视态度趋冷一年仅投数亿美元

腾讯科技讯在过去两年中，美国加州的硅谷和好莱坞出现了一个重大交集：互联网巨头纷纷进入了影视原创，其中Netflix和亚马逊每年投入了超过 50 亿美元的资金，投资影视拍摄项目、抢夺网络版权。不过据外媒最新消息，谷歌和YouTube在这波热潮中，表现并不积

深圳湾 0喜欢 / 0评论 2018-02-24

怎样下载YouTube 1080P HD高清视频

在国内在线视频网站还停留在1080P蓝光的时候，YouTube早已经支持4K和8K分辨率的极清视频。虽然4K和8K的清晰度比1080P高了许多档次，但是大部分人的电脑播放4K视频还是很卡的，所以目前来说下载1080P视频的用户还是主流，需求量是最多的。当然

最美应用有价值的好应用 0喜欢 / 0评论 2018-02-05

怎样下载YouTube播放列表（Playlist）

YouTube上面的视频种类丰富多彩，要是你想利用上面的资源来学习的话，足够你钻研很长时间了。如果你想在YouTube上面学习一门教程，比如Python，通常这些内容一个视频肯定装不下，会分为好多个视频，从初级到中级，再到高级。这时，视频拥有者会把相关的视

最美应用有价值的好应用 0喜欢 / 0评论 2018-01-24

从YouTube改版看“移动优先”附移动优先网站设计案例赏析

2011 年，Luke Wroblewski大神提出了移动优先的设计理念。在当时看来这无疑是一个打破行业常规的新型设计原则。而在移动互联网大行其道的今天，谁遵守移动优先的设计理念，设计出最好的移动端网站，谁就能赢得用户和商机。由此，移动端网站设计的重要性对

深圳湾 0喜欢 / 0评论 2017-12-11

如何下载YouTube 4K分辨率视频

随着科技的进步，人们生活水平的提高，视频的清晰度也越来越高，以前那个观看模糊视频的时代已经一去不复返了。从最开始的720P，到1080P，再到2K，进而到如今4K，视频的分辨率正在以惊人的速度发展着。4K分辨率的视频进入人们的视野已经有一段时间，从2010

爱车的诺诺 0喜欢 / 0评论 2017-11-29

如何下载YouTube 8K分辨率视频

随着科技的进步，人们对高清视频的要求越来越高，因此视频的分辨率也越来越高。从最开始的720P，到1080P，再到2K，进而到如今4K，不断地满足人们挑剔的胃口。4K分辨率的视频已经逐渐进入人们的生活中，即将成为主流。全球最大的UGC视频网站YouTube

董老师在硅谷 0喜欢 / 0评论 2017-11-28

谷歌发现俄特工在YouTube等平台投广告扰乱美国大选

安科科技讯北京时间10月10日上午消息，据路透社报道，知情人士透露，谷歌发现的证据表明，俄罗斯特工花费数万美元在YouTube、Gmail和谷歌搜索上投放广告，以此干扰2016年美国总统大选。知情人士表示，这些广告的购买者与Facebook广告似乎有所不

BitTigerio 0喜欢 / 0评论 2017-10-10

Netflix观看时长超过了Hulu、亚马逊和YouTube的总和

TechWeb报道 7月6日消息，据国外媒体报道，分析公司comScore的数据显示，美国人每月观看Netflix的时间比Hulu、亚马逊Video和YouTube的总和还多。与Netflix相比，观众平均每天观看Hulu2.9小时，YouTube粉丝观看

互联网小兵 0喜欢 / 0评论 2017-07-06

YouTube将采取更多措施打击恐怖主义视频

安科科技讯北京时间6月19日早间消息，YouTube母公司谷歌周日宣布，他们将采取新的措施打击与极端主义和恐怖主义相关的视频。谷歌总法律顾问肯·沃尔克在《金融时报》的专栏中写道。谷歌将为这些组织拨款。谷歌宣布这一消息前4个星期，Ariana Grande

互联网小兵 0喜欢 / 0评论 2017-06-19

收入太疲软 Twitter直播服务Periscope也能打广告了

安科科技讯北京时间3月29日早间消息，为了提振疲软的广告收入，Twitter将允许各大品牌在该公司旗下视频直播服务Periscope上购买广告服务。周二宣布的这项举措标志着该公司希望加强这个直播视频平台的创收力度。由于广告主对于他们的广告出现在哪些内容旁

网络游戏 0喜欢 / 0评论 2017-03-29

整合服务：谷歌合并YouTube音乐和Google Play音乐团队

安科科技讯北京时间2月9日上午消息，谷歌已将旗下两个音乐订阅服务团队YouTube音乐和Google Play音乐合二为一，合并后的团队最终将整合谷歌的音乐服务。谷歌本周三早上通知上述部门的员工，并向他们证实了以下声明：。在前进路上，谷歌面临的大问题是

82632713 0喜欢 / 0评论 2017-02-09

YouTube为网红开通手机直播功能粉丝也能向主播打赏了

安科科技讯北京时间2月8日早间消息，YouTube周二通过博客宣布，将面向粉丝超过1万人的网红推出移动流媒体直播功能，效仿Facebook Live的模式为其提供更多创收渠道。YouTube表示很快还将面向其他内容制作者推出这项功能。任何观看直播视频的粉

科技新发现 0喜欢 / 0评论 2017-02-08

YouTube 1.09更新支持PlayStation VR观看视频

互联网那些事 0喜欢 / 0评论 2016-12-24