ITxiaobaibai 2019-03-20
欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。
使用Urllib库实现博客园"最新文章"的爬取,可以自行扩展为全站爬虫,但是要注意它的接口
版本:Python3
系统:Windows
相关模块:
from urllib import request, error, parse from pyquery import PyQuery as pq from tqdm import tqdm from colorama import init, Fore import pymongo import time