Paw Robot的应用分析

敦厚的曹操 2010-09-06

前几日,PawRobot在自动搜索网络上的高清视频资源时,发现CCTV也开始采用了RTMP协议来传输视频文件。这是我们发现的国内第一家应用RTMP来传输高清视频文件的站点(我在这里谈的RTMP应用,主要是指媒体服务器的应用传输,而非应用RTMP来做LIVE直播。假如大家的视野更广,还望不吝指正)。

采用RTMP协议的站点,有两个吸引人的特点。其一,他们提供的视频文件的画质、音质堪比DVD;其二,从目前来看,采用RTMP的站点,大都能自己生成新的高清视频文件。这对于希望能在视频应用领域有所建树的企业来讲,这些RTMP高清视频站点所提供的资源,绝对是宝藏。

记得有次看了一个有关创业的节目,创业者做了一个服装类的电子商务网站,点评嘉宾是当当网的老板。嘉宾有几次问创业者,和当当网相比,有什么优势或者不同。创业者也罗列出几个她认为的“核心”因素,最后当当网的老板,很诚恳的告诉她:“你所能想到的,当当网都已经做了!”

的确,在别人的地盘,说他的家底,是难一语中的。手里没有和别人不一样的神器,也就难以做到“以后发而制先发”。像这个电子商务网站的创业者,只能提供图片或者文字的说明,虽然也可以制作一些动画,但总体说来都是很常规的思路,难和别家拉开距离。而另一方面,在互联网上,有关“着装”、“时尚”等内容的高清视频资源,又没有应用到她的服装类电子商务网站里面。像我们知道的,在WWW.CBS.COM站点里,专门有一组“着装”类的节目。假如我们能以很低的代价获取到此类资源,并融合到那个创业者的网站上。我不能确定这就是创业者的神器,但是,嫁接了高清视频的媒体资源的电子商务网站,可不是每家都具备的,最关键也不是每家想做就轻易能做到的。

通过上面说的这个插曲,我们只是想说明一个事实。视频应用的领域,不单单是我们传统认识上的,观看和分享;其应用面可以更广,因为视频所能表达的信息,完全可以是文字和图片的一个更好的补充。

找到一条及时、低价的获取高清视频资源的途径,是做所有视频应用的前提。目前,我们所能看到的局面是:优质视频资源的拥有者,竖起高高的壁垒,让普通人对于高清视频文件只能是,“看得到,拿不到”;还有一点,大家都说现在互联网是海量信息,但绝非海量有效信息,“大浪淘沙”是自然界的方法,我们也需要一个大浪淘沙的方法,来甄选站点。好在能提供高清视频的站点,国内、国外的数目,掰起手指也能数清,他们采用的技术也是公开的。正因为如此,PawRobot才能有用武之地。

PawRobot只做一件事情:互联网上出现了高清视频文件,它就自动下载。全过程无需人员值守。PawRobot只对高清视频敏感,对于普通画质、音质的视频自动过滤。说点技术上的细节吧,如何要做到只对高清视频敏感呢?因为高清视频的初次提供者(网站),是可以穷举的。PawRobot就监视此些站点,一旦内容有更新,PawRobot就记录下来,后续处理一衔接,整个过程就实现了。

PawRobot在应用时,可能会有一个知识产权的问题,我想再找机会谈了。上次我传了一段PawRobot抓取的RTMP传输的视频,好像还没人下载体验,不知道是担心有病毒,还是不能入大家的法眼。今天我也带来一点,PawRobot无意扫到的Google官方认可的一些视频站点。

这些信息都是FireFox浏览器自动与站点“safebrowsing.clients.google.com”通讯,只进内存,不入磁盘的东西。希望对大家有用,原样码流如下:

<cross-domain-policy>

<allow-access-fromdomain="*.bnet.com"/>

<allow-access-fromdomain="*.cbs.com"/>

<allow-access-fromdomain="*.cbsaroundtheworld.com"/>

<allow-access-fromdomain="*.cbsgames.com"/>

<allow-access-fromdomain="*.cbsig.net"/>

<allow-access-fromdomain="*.cbsnews.com"/>

<allow-access-fromdomain="*.cbssports.com"/>

<allow-access-fromdomain="*.chat.com"/>

<allow-access-fromdomain="*.chow.com"/>

<allow-access-fromdomain="*.chowhound.com"/>

<allow-access-fromdomain="*.cnet.com"/>

<allow-access-fromdomain="*.cnettv.com"/>

<allow-access-fromdomain="*.com.com"/>

<allow-access-fromdomain="*.download.com"/>

<allow-access-fromdomain="*.filmspot.com"/>

<allow-access-fromdomain="*.findarticles.com"/>

<allow-access-fromdomain="*.gamefaqs.com"/>

<allow-access-fromdomain="*.gamerankings.com"/>

<allow-access-fromdomain="*.gamespot.com"/>

<allow-access-fromdomain="*.help.com"/>

<allow-access-fromdomain="*.iphoneatlas.com"/>

<allow-access-fromdomain="*.itpapers.com"/>

<allow-access-fromdomain="*.juke.com"/>

<allow-access-fromdomain="*.last.fm"/>

<allow-access-fromdomain="*.macfixit.com"/>

<allow-access-fromdomain="*.macfixitforums.com"/>

<allow-access-fromdomain="*.maxpreps.com"/>

<allow-access-fromdomain="*.metacritic.com"/>

<allow-access-fromdomain="*.mp3.com"/>

<allow-access-fromdomain="*.moblogic.tv"/>

<allow-access-fromdomain="*.moneywatch.com"/>

<allow-access-fromdomain="*.movietome.com"/>

<allow-access-fromdomain="*.mysimon.com"/>

<allow-access-fromdomain="*.ncaa.com"/>

<allow-access-fromdomain="*.news.com"/>

<allow-access-fromdomain="*.ourchart.com"/>

<allow-access-fromdomain="*.search.com"/>

<allow-access-fromdomain="*.shareware.com"/>

<allow-access-fromdomain="*.shopper.com"/>

<allow-access-fromdomain="*.smartplanet.com"/>

<allow-access-fromdomain="*.sportsgamer.com"/>

<allow-access-fromdomain="*.sportsline.com"/>

<allow-access-fromdomain="*.startrek.com"/>

<allow-access-fromdomain="*.techrepublic.com"/>

<allow-access-fromdomain="*.theinsider.com"/>

<allow-access-fromdomain="*.trupreps.com"/>

<allow-access-fromdomain="*.tv.com"/>

<allow-access-fromdomain="*.urbanbaby.com"/>

<allow-access-fromdomain="*.versiontracker.com"/>

<allow-access-fromdomain="*.wallstrip.com"/>

<allow-access-fromdomain="*.webware.com"/>

<allow-access-fromdomain="*.winfiles.com"/>

<allow-access-fromdomain="*.zdnet.com"/>

<allow-access-fromdomain="*.zdnet.com.au"/>

<allow-access-fromdomain="*.zdnet.com.uk"/>

<allow-access-fromdomain="*.zdnetasia.com"/>

<allow-access-fromdomain="*.cbsinteractive.com"/>

<allow-access-fromdomain="*.powervideosuite.com"/><!--bug413904-->

<allow-access-fromdomain="*.clipsync.com"/><!--bug417766-->

<allow-access-fromdomain="212.86.251.190"/><!--bug417766-->

<allow-access-fromdomain="*.crunchyroll.com"/><!--bug417327-->

<allow-access-fromdomain="*.techmatter.com"/><!--bug419559-->

<allow-access-fromdomain="*.amazon.com"/><!--bug422005-->

<allow-access-fromdomain="*.aol.com"/>

<allow-access-fromdomain="*.att.com"/>

<allow-access-fromdomain="*.attributor.com"/>

<allow-access-fromdomain="*.bebo.com"/>

<allow-access-fromdomain="*.blinkx.com"/>

<allow-access-fromdomain="*.boxee.com"/>

<allow-access-fromdomain="*.brightcove.com"/>

<allow-access-fromdomain="*.buddytv.com"/>

<allow-access-fromdomain="*.cbsmobile.com"/>

<allow-access-fromdomain="*.chumby.com"/>

<allow-access-fromdomain="*.comcast.com"/>

<allow-access-fromdomain="*.comcastnet.com"/>

<allow-access-fromdomain="*.cooliris.com"/>

<allow-access-fromdomain="*.dell.com"/>

<allow-access-fromdomain="*.et.com"/>

<allow-access-fromdomain="*.fanpop.com"/>

<allow-access-fromdomain="*.freestream.com"/>

<allow-access-fromdomain="*.fuhu.com"/>

<allow-access-fromdomain="*.gotuit.com"/>

<allow-access-fromdomain="*.grabnetworks.com"/>

<allow-access-fromdomain="*.harpers.com"/>

<allow-access-fromdomain="*.hp.com"/>

<allow-access-fromdomain="*.imdb.com"/>

<allow-access-fromdomain="*.iwidget.com"/>

<allow-access-fromdomain="*.joost.com"/>

<allow-access-fromdomain="*.meevee.com"/>

<allow-access-fromdomain="*.metacafe.com"/>

<allow-access-fromdomain="*.msn.com"/>

<allow-access-fromdomain="*.msnsearch.com"/>

<allow-access-fromdomain="*.netflix.com"/>

<allow-access-fromdomain="*.radio.com"/>

<allow-access-fromdomain="*.sands.com"/>

<allow-access-fromdomain="*.showtime.com"/>

<allow-access-fromdomain="*.slide.com"/>

<allow-access-fromdomain="*.sling.com"/>

<allow-access-fromdomain="*.sony.com"/>

<allow-access-fromdomain="*.tidaltv.com"/>

<allow-access-fromdomain="*.transpond.com"/>

<allow-access-fromdomain="*.tvguide.com"/>

<allow-access-fromdomain="*.tvstations.com"/>

<allow-access-fromdomain="*.veoh.com"/>

<allow-access-fromdomain="*.yahoo.com"/>

<allow-access-fromdomain="*.youtube.com"/><!--bug422005-->

<allow-access-fromdomain="*.bing.com"/><!--bug424768-->

<allow-access-fromdomain="*.comcast.net"/>

<allow-access-fromdomain="*.fancast.com"/>

<allow-access-fromdomain="*.blinx.com"/>

<allow-access-fromdomain="apps.facebook.com"/><!--bug424768-->

<allow-access-fromdomain="*.ytimg.com"/><!--bug425655-->

<allow-access-fromdomain="*.ustream.tv"/><!--bug425655-->

<allow-access-fromdomain="*.sho.com"/><!--bug425868-->

<allow-access-fromdomain="*.cbsinteractive.com.au"/><!--bug429124-->

<allow-access-fromdomain="*.quantserve.com"/><!--bug431100-->

<allow-access-fromdomain="*.cbsimg.net"/><!--bug432878-->

<allow-access-fromdomain="*.yahoo.net"/><!--bug437208-->

<allow-access-fromdomain="*.yimg.com"/><!--bug438235-->

<allow-access-fromdomain="*.ooyala.com"/><!--bug438990-->

<allow-access-fromdomain="*.yldmgrimg.net"/><!--bug440685-->

<allow-access-fromdomain="*.cstv.com"/><!--bug442578-->

</cross-domain-policy>

相关推荐