灬扫地僧 2013-05-17
因为网络爬虫是SEO的一部分故归类到SEO,以下是一些有用的网络爬虫种子,当然你也可以去找一些;
这是以前同事找的,感觉很有用跟大家分享一下:
1、天气内容
全天预报:http://www.weather.com.cn/data/cityinfo/{101020100}.html
实时天气:http://www.weather.com.cn/data/sk/{101270101}.html
6天预报:http://m.weather.com.cn/data/{101210701}.html
注:{…….}部分为行政编码,如101270101为成都。以上url返回内容都是json格式
2、中国天气网城市编码
省级行政单位编码:http://www.weather.com.cn/data/citydata/china.html
地市级行政单位编码:http://www.weather.com.cn/data/citydata/district/{10101}.html
区县级行政单位编码:http://www.weather.com.cn/data/citydata/city/{1010100}.html
注:{…….}部分为行政编码,如101270101为成都。以上url返回内容都是json格式
3、新浪新闻
焦点新闻:http://rss.sina.com.cn/news/allnews/auto.xml
购车指导:http://rss.sina.com.cn/auto/guide/index.xml
行业动态:http://rss.sina.com.cn/auto/news/t/index.xml
汽车保养:http://rss.sina.com.cn/auto/servicing/index.xml
汽车用品:http://rss.sina.com.cn/auto/automotive/index.xml
注:以上url返回内容都是xml格式,它们并不是真正的新闻,而是RSS,是新闻列表。通过解析Rss内容,获取真正的新闻地址。
4、手机归属地
http://vip.showji.com/locating/?m={13550360786}&outfmt=json
注:{13550360786}部分为手机号码,outfmt参数用于指明返回的内容格式,此处是json
5、飞机票信息
http://jipiao.9588.com/Flight/FlightInfo?MoreTrip[0].fromcity=%s&MoreTrip[0].tocity=%s&MoreTrip[0].from=%s&MoreTrip[0].to=%s&MoreTrip[0].date=%s
注:%s部分为查询参数,依次对应为1)出发地中文名称、2)目的地中文名称、3)出发机场代码、4)目的地机场代码、5)出发日期。