MiracleZhao 2020-05-29
基于终端指令:
要求:只可以将parse方法的返回值存储到本地的文本文件中
注意:持久批存储对应的文本文件类型只可以为:(‘csv‘, ‘pickle‘, ‘json‘, ‘xml‘, ‘jl‘, ‘jsonlines‘, ‘marshal‘)
指令:scrapy crawl xxx -o filePath
好处:简洁高效便捷
缺点:局限性比较强(数据只可以存储到指定后缀的文本文件中)
基于管道:
编码流程:
好处:
面试题:将爬取到的数据一份存储到本地一份存储到数据库,如何实现