scrapy发送post请求

MiracleZhao 2020-04-19

重写父类中的一个方法(start_requests):该方法默认可以对start_urls列表中的元素进行get请求的发送
1.将Request方法中method参数赋值成post2.FormRequest()可以发起post请求(推荐)实例:发送post请求抓取百度翻译spider文件
import scrapy
import json


class PostdemoSpider(scrapy.Spider):
    name = ‘postDemo‘
    # allowed_domains = [‘www.baidu.com‘]
    start_urls = [‘https://fanyi.baidu.com/sug‘]

    # 该方法其实是父类中的一个方法:该方法可以对start_urls列表中的元素进行get请求的发送
    # 发起post:
    # 1.将Request方法中method参数赋值成post
    # 2.FormRequest()可以发起post请求(推荐)
    def start_requests(self):
        # for url in self.start_urls:
        #     yield scrapy.Request(url,callback=self.parse)
        print(‘start_requests()‘)
        # post请求的参数
        data = {
            ‘kw‘: ‘dog‘,
        }
        for url in self.start_urls:
            yield scrapy.FormRequest(url,callback=self.parse,formdata=data)

    def parse(self, response):
        jsobj = json.loads(response.body) # json处理
        fanyi_data = jsobj[‘data‘]
        print(fanyi_data)
 

相关推荐