网络异步请求之gevent

liuxiaohua 2019-06-20

我们知道对于网络请求这种IO bound的场景来说，最怕的就是某个请求阻塞了其余的操作，让并发性大大降低。今天就来介绍一款python下的并发库-gevent。

首先看一下他自己的介绍：

gevent是一个基于libev的并发库。它为各种并发和网络相关的任务提供了整洁的API。

嗯，确实很简洁，很易使用。待会我们就见识到了。

同步IO

首先我们来看看传统的IO请求。
比如我们请求：http://httpbin.org/ip 发个http get请求会得到我们的ip地址，如：

{
  "origin": "183.240.202.14"
}

我们来写个脚本连续发50个get请求到这个地址，以模拟多个请求。(脚本命名为get.py)

import requests

url = 'http://httpbin.org/ip'

for i in range(50):
    print("{}: {}".format(i, requests.get(url).text))

统计一下运行时间：

$ time python3 get.py

(输出略...)
python3 get.py  0.56s user 0.06s system 1% cpu 35.606 total

大概花费35s钟，当然不同网络环境可能结果不同。而且打印出来的结果是按照1, 2, 3...50这样的顺序来的，说明整个请求是同步的，一个请求结束再发下一个请求。

使用gevent

我们再来写一个gevent版的get.py，命名为gevent_get.py

import requests
import gevent
import gevent.monkey
# 这里将socket变成异步
gevent.monkey.patch_socket()

url = 'http://httpbin.org/ip'


def hello(i):
    print("{}: {}".format(i, requests.get(url).text))


tasks = [gevent.spawn(hello, i) for i in range(50)]
gevent.joinall(tasks)

再来看看运行时间：

$ time python3 gevent_get.py

(输出略...)
python3 gevent_get.py  0.49s user 0.06s system 39% cpu 1.403 total

我的天！才1.4秒左右，而且打印出来的结果没有按照1, 2, 3...50这样排列，而是按照随机顺序排列的，说明整个请求是异步非阻塞的。

结论

我又多试了几次，gevent的效率确实牛，远远高于同步io请求。最近在我的一个爬虫小项目里面用进程池 + gevent，爬取80个页面，大概花费40s左右，每个页面只要0.5s，而且还包括DOM解析的时间，而用同步请求则花费大概300s左右。

gevent的更多用法请参考其官方文档。这么简单又好用的库赶紧试试吧。^_^

: liuxiaohua

相关推荐

Python gevent协程切换实现详解

大家都知道gevent的机制是单线程+协程机制，当遇到可能会阻塞的操作时，就切换到可运行的协程中继续运行，以此来实现提交系统运行效率的目标，但是具体是怎么实现的呢？让我们直接从代码中看一下吧。这里会开启一个死循环，在循环中调用self._sock.recv

efeve 0喜欢 / 0评论 2020-09-14

如何用一行代码让gevent爬虫提速100%

用python做网络开发的人估计都听说过gevent这个库，gevent是一个第三方的python协程库，其是在微线程库greenlet的基础上构建而成，并且使用了epoll事件监听机制，这让gevent具有很好的性能并且比greenlet更好用。基于li

dashoumeixi 0喜欢 / 0评论 2020-07-20

2020最新nginx+gunicorn+supervisor部署基于flask开发的项目的生产环境的详细攻略

本攻略基于ubuntu1804的版本，服务器用的华为云的服务器，python3欢迎加我的QQ6398903，或QQ群讨论相关技术。pip intall -r requirements.txt # 一次安装全部的python模块。gunicorn是基于w

SDUTACM 0喜欢 / 0评论 2020-05-03

Python线程和协程CPU资源利用率测试

　　协程，又称为微线程，它是实现多任务的另一种方式，只不过是比线程更小的执行单元。因为它自带CPU的上下文，这样只要在合适的时机，我们可以把一个协程切换到另一个协程。　　协程与线程的差异：　　在实现多任务时, 线程切换从系统层面远不止保存和恢复CPU上下

jacktangj 0喜欢 / 0评论 2020-04-17

1.7 协程

协程的本质是个单线程,它不能同时将单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上线程阻塞操作会阻塞掉整个程序

87246237 0喜欢 / 0评论 2020-04-09

python语法基础-并发编程-协程-长期维护

# 协程和进程和线程一样都是实现并发的手段，# 开启一个线程，创建一个线程，还是需要开销，# 什么是协程：能够在多个任务之间切换来节省一些IO时间，# 不需要再浪费线程之间的切换了，只需要做程序之间的切换，# 我们在工作中会使用进程，线程，协程来提高代码的

wyqwilliam 0喜欢 / 0评论 2020-02-10

tcp_server_协程gevent版本

#使用此方法，会将代码中检查一遍，如有time.sleep()等延时方法，会自动转换为gevent.sleep(). #把标准库中的thread/socket等给替换掉.这样我们在后面使用socket的时候能够跟寻常一样使用,无需改动。# 调用此函数就不需

zuiaiqun 0喜欢 / 0评论 2020-01-23

odoo 使用协程,异步,gevent,打补丁

打补丁得时候需要在方法中实现,如果直接在外部调用猴子补丁,在odoo服务启动时,就会出现锁异常,会出现死锁,monkey.patch_all() # 这是一个错误的示例

talkincode 0喜欢 / 0评论 2020-01-11

python已协程方式处理任务

#从genent中导入monky模块①。#把程序变成协程的方式运行②。#记录程序开始时间。#把8个网站封装成列表。# 用requests.get()函数爬取网站。# 用gevent里面的spawn函数创建任务 get_data是方法名，url是参数③。#

shengge0 0喜欢 / 0评论 2019-12-26

简述 gevent模块的作用和应用场景。

当一个greenlet遇到IO操作时，比如访问网络，就自动切换到其他的greenlet，等到IO操作完成，再在适当的时候切换回来继续执行。由于IO操作非常耗时，经常使程序处于等待状态，由于切换是在IO操作时自动完成，所以gevent需要修改Python自带

dashoumeixi 0喜欢 / 0评论 2019-12-22

gevent实现并发

#_author:来童星#date:2019/12/12import geventimport timedef func1(): print(‘\033[31;1mfun1 starting...\033[0m‘,time.ctime()) g

zuiaiqun 0喜欢 / 0评论 2019-12-12

python gevent异步

monkey.patch_all()#捕捉所有阻塞，不止接收gevent.sleep. 执行协程并阻塞等待执行完毕

winmeanyoung 0喜欢 / 0评论 2019-12-07

并发编程之协程

g1.switch # 传了一次参数过后,下一次在switch的时候便不需要在传递参数了。但是greenlet模块只是进行了对任务的单纯的切换,在遇到了io阻塞时,还是会原地的阻塞住,并没有在io阻塞时对cpu进行调度。from gevent import

hamutailang 0喜欢 / 0评论 2019-11-03

python-协程gevent的使用

import geventfrom gevent import monkeyimport timeimport random# 有耗时操作时需要monkey.patch_all() # 将程序中用到的耗时操作代码，换为 gevent 中自己实现的模块de

wklken的笔记 0喜欢 / 0评论 2019-11-01

Python之路(第四十七篇) 协程

一句话说明什么是线程：协程是一种用户态的轻量级线程，即协程是由用户程序自己控制调度的。无需原子操作锁定及同步的开销 "原子操作是不需要synchronized"，所谓原子操作是指不会被线程调度机制打断的操作；这种操作一旦开始，就一直运行

georgeandgeorge 0喜欢 / 0评论 2019-10-31

python gevent网络库

CandyGL 0喜欢 / 0评论 2016-03-02

多任务-----协程gevent的使用总结。

如何判断某一类型是否可以迭代。如果一个对象是迭代器，那么一定可以迭代，如果一个对象可以迭代，但不一定是迭代器。迭代器对象必须要有__iter__和__next__方法。如果数据量很大的情况下，最好使用创建迭代器的方式来节省内存空间。print二，生成器g

chunjiekid 0喜欢 / 0评论 2019-07-01

gevent gevent.queue gevent读取文件

官方手册说的太不清楚 .自己写了个入门教程.g1 = gevent.spawn #产生一个GreenLet 协程 .# 与上面一种完全一样的方式 . gevent.spawn 相当于创建一个GreenLet ,然后start(). g2.join()下

talkincode 0喜欢 / 0评论 2019-06-30

python大佬养成计划----协程

协程，又称微线程，纤程。英文名Coroutine协程看上去也是子程序，但执行过程中，在子程序内部可中断，然后转而执行别的子程序，在适当的时候再返回来接着执行。最大的优势就是协程极高的执行效率。因为子程序切换不是线程切换，而是由程序自身控制，因此，没有线程切

solarLan 0喜欢 / 0评论 2019-06-28

关于gevent的一点总结

0x00 基本概念gevent是基于libev和greenlet的一个python异步框架。libev是一个高性能的事件循环实现。简单点说，就是event loop会捕获、处理io事件的变化：遇到阻塞，就跳出；阻塞结束，就继续。这依赖于系统底层的selec

mayflowers 0喜欢 / 0评论 2019-06-28

你要知道的10个Python第三库

Beautiful Soup是一个可以从HTML，XML进行提取文件的Python库，日常我们使用爬虫进行数据抓取回来之后，往往需要进行数据解析。题图就是requests的logo，这个库使用量之大，Python开发者应该是无人不知无人不晓。gevent是

QiaoRuoZhuo 0喜欢 / 0评论 2019-01-08

Python丨10个强大的第三库

Beautiful Soup是一个可以从HTML，XML进行提取文件的Python库，日常我们使用爬虫进行数据抓取回来之后，往往需要进行数据解析。题图就是requests的logo，这个库使用量之大，Python开发者应该是无人不知无人不晓。gevent是

bnmcvzx 0喜欢 / 0评论 2019-01-08

扣丁学堂为你讲解Python协程具体内容是什么

协程的作用，是在执行函数A时，可以随时中断，去执行函数B，然后中断继续执行函数A。但这一过程并不是函数调用，这一整个过程看似像多线程，然而协程只有一个线程执行。所以与多线程相比，线程的数量越多，协程性能的优势越明显。不需要多线程的锁机制，因为只有一个线程，

linbossdeboke 0喜欢 / 0评论 2018-01-19

Mac OS X & Ubuntu 安装 gevent

首先安装libevent，在libevent.org下载最新稳定版本libevent-2.0.21-stable.tar.gz，提取压缩包内容。

dashoumeixi 0喜欢 / 0评论 2013-06-22

你必须知道的10个Python第三库

Beautiful Soup是一个可以从HTML，XML进行提取文件的Python库，日常我们使用爬虫进行数据抓取回来之后，往往需要进行数据解析。题图就是requests的logo，这个库使用量之大，Python开发者应该是无人不知无人不晓。gevent是

honghao0 0喜欢 / 0评论 2019-01-08

在FreeBSD的virtualenv环境下安装pysqlite和gevent

virtualenv是个好东西，可以为各个Python应用建立各自独立的虚拟环境，对于开发和部署都是很有用的。特别是增强版的virtualenvwrapper，好用到爆。但是它也会带来很妖蛾子的问题。比如之前我就曾经碰到过这样的问题：。题外话：Mac OS

hamutailang 0喜欢 / 0评论 2012-10-04

Python协程：概念及其用法

真正有知识的人的成长过程，就像麦穗的成长过程：麦穗空的时候，麦子长得很快，麦穗骄傲地高高昂起，但是，麦穗成熟饱满时，它们开始谦虚，垂下麦芒。对于协程，我表示其效率确非多线程能比，但本人对此了解并不深入，因此最近几日参考了一些资料，学习整理了一番，在此分享出

Tristahong 0喜欢 / 0评论 2017-06-15

深入flask之异步非堵塞实现代码示例

官方其实已经给出了方案，只不过藏的有点深，在加上网上有很多不太靠谱的帖子误导了我。所以为了让有些朋友的少走点弯路，也为给自己做个备忘。

wangshuliang 0喜欢 / 0评论 2018-07-31

详解python之协程gevent模块

我们通常所说的协程Coroutine其实是corporate routine的缩写，直接翻译为协同的例程，一般我们都简称为协程。在linux系统中，线程就是轻量级的进程，而我们通常也把协程称为轻量级的线程即微线程。而寄存器和栈的结合就可以理解为上下文，上下

chauncygu 0喜欢 / 0评论 2018-06-14

Python网络爬虫中的同步与异步示例详解

await表达式中的对象必须是awaitable requests不支持非阻塞 aiohttp是用于异步请求的库代码。gevent是一个python的并发库，它为各种并发和网络相关的任务提供了整洁的API。gevent中用到的主要模式是greenlet

PythonGCS 0喜欢 / 0评论 2018-02-03

Python并发编程协程(Coroutine)之Gevent详解

我们通常所说的协程Coroutine其实是corporateroutine的缩写，直接翻译为协同的例程，一般我们都简称为协程。在linux系统中，线程就是轻量级的进程，而我们通常也把协程称为轻量级的线程即微线程。操作系统保存shell进程的上下文，创建一个

BlueBuleSky 0喜欢 / 0评论 2017-12-27

Python实现批量检测HTTP服务的状态

用Python实现批量测试一组url的可用性并统计出现不可用情况的次数和频率等。类似的，这样的脚本可以判断某个服务的可用性，以及在众多的服务提供者中选择最优的。默认情况下，执行脚本会检测一组url的可用性。如果可用，返回从脚本所在的机器到HTTP服务器所消

billbliss 0喜欢 / 0评论 2016-10-27

使用Python的Tornado框架实现一个Web端图书展示页面

首先，为什么选择Tornado：1.高性能的网络库，这可以和gevent,twisted,libevent等做对。提供了异步io支持，超时事件处理，在此基础上提供了tcpserver,httpclient，尤其是curlhttpclient,在现有http

jessieHJ 0喜欢 / 0评论 2016-07-11

Python的网络编程库Gevent的安装及使用技巧

安装gevent依赖libevent和greenlet：1.安装libevent直接yum install libevent然后配置python的安装2.安装easy_install. python ez_setup.py使用easy_install 查看

talkincode 0喜欢 / 0评论 2016-06-24

浅谈python多线程和队列管理shell程序

首先来描述下环境，在机器上有很多个JAVA程序，我们在每个JAVA程序里都配置了一个启动|停止|重启的脚本。我们现在要同时运行这些脚本，来达到快速启动所有的JAVA程序，如果我们只用多线程的话，线程是不会返回消息给父进程，我们如何才能知道这些程序是启动成功

pythonpycharm 0喜欢 / 0评论 2019-04-21

Python下载懒人图库JavaScript特效

gevent.joinall以上所述就是本文的全部内容了，希望大家能够喜欢。

丝丝air 0喜欢 / 0评论 2019-04-20

Python的gevent框架的入门教程

而第三方的gevent为Python提供了比较完善的协程支持。当一个greenlet遇到IO操作时，比如访问网络，就自动切换到其他的greenlet，等到IO操作完成，再在适当的时候切换回来继续执行。由于IO操作非常耗时，经常使程序处于等待状态，有了gev

Triagen 0喜欢 / 0评论 2015-04-29

在Python的gevent框架下执行异步的Solr查询的教程

我经常需要用Python与solr进行异步请求工作。这里有段代码阻塞在Solr http请求上，直到第一个完成才会执行第二个请求，代码如下：。通过脚本把文档索引到Solr，进而可以并行工作是很好的。不幸的是，当进行异步编程时python不像Javasc

随手一记 0喜欢 / 0评论 2015-04-16

对Python协程之异步同步的区别详解

一下代码通过协程、多线程、多进程的方式，运行代码展示异步与同步的区别。老张爱喝茶，废话不说，煮开水。4 老张把响水壶放到火上，去客厅看电视，水壶响之前不再去看它了，响了再去拿壶。虽然都能干活，但响水壶可以在自己完工之后，提示老张水开了。同步只能让调用者去轮

Pythonandme 0喜欢 / 0评论 2019-02-19

python编程使用协程并发的优缺点

协程是一种用户态的轻量级线程，又称微线程。所以很适合用于高并发处理。视作整体是原子性的核心。gevent是python的一个并发框架,以微线程greenlet为核心，使用了epoll事件监听机制以及诸多其他优化而变得高效.

pythontty 0喜欢 / 0评论 2018-09-20

python小技巧之批量抓取美女图片

下面直接上代码：。)jpg" /></p>',html.group(),re.I) for i in urls: url=i.group.strip()+str url_list.append return url_listde

zuiaiqun 0喜欢 / 0评论 2014-06-06

python网络编程（十三）

协程-greenlet版为了更好使用协程来完成多任务，python中的greenlet模块对其封装，从而使得切换任务变的更加简单。其原理是当一个greenlet遇到IO操作时，比如访问网络，就自动切换到其他的greenlet，等到IO操作完成，再在适当的时

面向工资编程 0喜欢 / 0评论 2018-05-14

python 协程 gevent 简单测试

串行测试from gevent import monkey; monkey.patch_all()#有IO才做时需要这一句。# cost time: 5.034070014953613被请求的tornado代码sleep 5s

每周学点土壤知识 0喜欢 / 0评论 2018-05-14

数据挖掘_利用协程抓取

协程，又称微线程，纤程。协程的概念很早就提出来了，但直到最近几年才在某些语言中得到广泛应用。子程序，或者称为函数，在所有语言中都是层级调用，比如A调用B，B在执行过程中又调用了C，C执行完毕返回，B执行完毕返回，最后是A执行完毕。子程序调用总是一个入口，一

出版圈郭志敏 0喜欢 / 0评论 2018-05-05

python gevent并发socket

import queue. import gevent. socket_server = socket.socket(). address_server = ('0.0.0.0',8080). socket_server.bind(address_serv

松鼠的窝 0喜欢 / 0评论 2018-05-05

协程与简单的爬虫

# from greenlet import greenlet #协程的手动切换，生成器属于自己开的一个协程，而greenlet是一个封装好的协程。python 3.x中urllib库和urilib2库合并成了urllib库，因此，python3.x

BitTigerio 0喜欢 / 0评论 2018-03-24

python：协程

1，如何实现在两个函数之间的切换？from greenlet import greenlet # 在单线程中切换状态的模块。import gevent # greenlet gevent在切换程序的基础上又实现了规避IO. g1 = gevent.

真匿名打脸爱好者 0喜欢 / 0评论 2018-02-08

python基础===进程，线程，协程的区别（转）

进程拥有自己独立的堆和栈，既不共享堆，亦不共享栈，进程由操作系统调度。协程和线程一样共享堆，不共享栈，协程由程序员在协程的代码里显示调度。进程和其他两个的区别还是很明显的。现在 A B 两个线程并行，操作系统会不停的在 A B 两个线程之间切换，达到一种伪

稀土 0喜欢 / 0评论 2018-01-18

flask + celery + gunicorn + gevent + nginx + supervisord 实现业务系统

接触了flask开发有一小段时间了，使用flask主要完成了我们产品的Android客户端的后台服务，还有就是为运营提供数据统计及应用发布的web系统。文中如果有什么错误欢迎指出，对flask开发有兴趣的朋友也可以互相交流，探讨问题。flask在他的官方文

编程爱好者联盟 0喜欢 / 0评论 2016-11-04