python小白学习记录多线程爬取ts片段

kikaylee 2020-02-23

from lxml import etree
import requests
from urllib import request
import time
import os
from queue import Queue
import threading
import re
from multiprocessing import pool
from urllib import request
def download(urls):
    for index in range(0,1342):
        n = index
        if(index<=999):
            n = str(n).zfill(3)
        else:
            n = str(n)
        # print(n)
        url = "https://zy.512wx.com/20171106/vM1OOVna/1200kb/hls/ppvod1983%s.ts" %n
        print("url",url)
        urls.put(url)
class Consumer(threading.Thread):
    def __init__(self,urls,*args,**kwargs):
        super(Consumer, self).__init__(*args,**kwargs)
        self.urls = urls
        self.queueLock = threading.Lock()
    def run(self):
        while True:
            if self.urls.empty():
                break
            else:
                self.queueLock.acquire()
                file = self.urls.get()
                self.queueLock.release()
                name = file.split(‘/‘)[-1]
                print("name",name)
                with open("./video/{}".format(name), "wb") as fp:
                    if os.access("./video/{}".format(name), os.F_OK):
                        pass
                    else:
                        resp = requests.get(file,verify = False)
                        fp.write(resp.content)
                print(name + "下载完成")
def get_ts(urls):
    with open("./video/kuiba.ts","wb") as fp:
        for index in range(0, len(urls)):
            resp =  requests.get(urls[index])
            fp.write(resp.content)
            print(str(index)+"下载完成")
def main():
    urls = Queue(2000)
    download(urls)
    # while not urls.empty():
    #     print(urls.get())
    for index in range(0,16):
        x = Consumer(urls)
        x.start()
if __name__ == ‘__main__‘:
    main()

此处开了16个子线程

: kikaylee

相关推荐

多线程真的比单线程快？

事实上，Python 多线程另一个很重要的话题叫，GIL。在Python中，可以通过多进程、多线程和多协程来实现多任务。难道多线程就一定比单线程快?下面我用一段代码证明我自己得观点。GIL 的工作原理：比如下面这张图，就是一个 GIL 在 Python 程

farewellpoem 0喜欢 / 15评论 2020-11-09

区分python中的进程与线程

今天整理的文章是给大家梳理Python的进程与线程的区别，没什么代码，希望大家能清楚知道他们的区别，什么情况用线程，什么情况用进程做到心中有数，希望大家能熟练掌握.进程一般由程序、数据集、进程控制块三部分组成。提高并发性,通过线程可方便有效地实现并发性。在

chunjiekid 0喜欢 / 0评论 2020-08-16

多线程中如何使用gdb精确定位死锁问题

本文转载自微信公众号「程序喵大人」，作者程序喵大人。在多线程开发过程中很多人应该都会遇到死锁问题，死锁问题也是面试过程中经常被问到的问题，这里介绍在c++中如何使用gdb+python脚本调试死锁问题，以及如何在程序运行过程中检测死锁。当两个以上的运算单

lhtzbj 0喜欢 / 0评论 2020-08-13

Python多线程

多任务可以由多进程完成，也可以由一个进程内的多线程完成。进程是由若干线程组成的，一个进程至少有一个线程。# target=线程需执行的方法， name=线程的名字， args=. # 任何进程都会默认启动一个线程，这里启动的就是 MainThread ，

learnpy 0喜欢 / 0评论 2020-07-19

python 多线程 QTimer实现多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。程序的运行速度可能加快。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都有他自己的一组CPU寄存器，

kyelu 0喜欢 / 0评论 2020-07-09

python 锁

每个线程在执行的过程都需要先获取GIL，保证同一时刻只有一个线程可以执行代码。计数器不能为0，当计数器为0时acquire（）将阻塞线程，直到其他线程调release（）。

小菜鸟的代码世界 0喜欢 / 0评论 2020-06-17

Python-多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。线程在执行过程中与进程还是有区别的。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都

举 0喜欢 / 0评论 2020-06-14

线程-GIL、锁

Python 解释器中可以“运行”多个线程，但在任意时刻只有一个线程在解释器中运行。对Python虚拟机的访问由全局解释器锁来控制，正是这个锁能保证同一时刻只有一个线程在运行。c、运行指定数量的字节码指令或者线程主动让出控制；d、把线程设置为睡眠状态；d、

bizercsdn 0喜欢 / 0评论 2020-06-06

Python当中的线程模块threading【多测师】

在Python语言中，对线程的操作使使用的是threading，下面首先通过一个案例来测试进程和线程的。从输出结果来来看，进程的效率更搞点，在进程中，主要使用的是threading里面的Thread类，下面还是以访问。最终输出的结果是0。因为守护进程1秒就

usepython 0喜欢 / 0评论 2020-05-31

第54天：Python 多线程 Event

Event 是一个事务处理的机制，用于通知多个异步任务某个事件已经发生了。比如在交通红绿灯中多辆在行驶中的汽车可以表示成程序中的多个异步任务，红绿灯的亮起可以表示成一个通知，红灯通知这个汽车的行驶任务必须停止了，绿灯通知这个汽车的行驶任务可以继续驾驶了。E

haokele 0喜欢 / 0评论 2020-05-31

第53天： Python 线程池

大家都知道当任务过多，任务量过大时如果想提高效率的一个最简单的方法就是用多线程去处理，比如爬取上万个网页中的特定数据，以及将爬取数据和清洗数据的工作交给不同的线程去处理，也就是生产者消费者模式，都是典型的多线程使用场景。那是不是意味着线程数量越多，程序的执

fengling 0喜欢 / 0评论 2020-05-31

第49天：Python 多线程之 threading 模块

在之前的文章中，我们已经介绍了 Python 通过 _thread 和 threading 模块提供了对多线程的支持，threading 模块兼具了 _thread 模块的现有功能，又扩展了一些新的功能，具有十分丰富的线程操作功能，本节我们就来详细学习一下

maimang00 0喜欢 / 0评论 2020-05-30

python的线程

python的线程和java的线程是有差别的，在一些等待的任务上有优势，如用户输入、文件读写、网络收发数据等。在这些情况下可以释放珍贵的内存cpu资源。musics = [‘音乐1‘, ‘音乐2‘, ‘音乐3‘, ‘音乐4‘, ‘音乐5‘, ‘音乐6‘,

yawei 0喜欢 / 0评论 2020-05-30

Python多线程之死锁

死锁是由于两个或以上的线程互相持有对方需要的资源，且都不释放占有的资源，导致这些线程处于等待状态，程序无法执行。　　　1.互斥性：线程对资源的占有是排他性的，一个资源只能被一个线程占有，直到释放。这样线程A和线程B相互持有对方需要的锁，从而发生阻塞，最终变

坚持是一种品质 0喜欢 / 0评论 2020-05-28

Python中的多线程如何正确运用？案例详解

function 是开发者定义的线程函数，args 是传递给线程函数的参数，必须是tuple类型，kwargs 是可选参数，字典类型。调用 threading.Thread 之后，会创建一个新的线程，参数 target 指定线程将要运行的函数，args 和

laityc 0喜欢 / 0评论 2020-05-27

Python 多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等，线程就比较有用了。线程在执行过程中与进程还是有区别的。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都

jling 0喜欢 / 0评论 2020-05-19

Python多任务

由于进程是资源拥有者，创建、撤消与切换存在较大的内存开销，因此需要引入轻型进程即线程，进程是资源分配的最小单位,线程是 CPU 调度的最小单位每一个进程中至少有一个线程。进程和线程关系：一个进行可以有一个或者多个线程，但是一个线程只属于一个进程，一个进程

cenylon 0喜欢 / 0评论 2020-05-15

Python中的多处理与多线程：新手简介

你为什么想要它?Python是一种线性语言。但是，当您需要更多的处理能力时，线程模块就派上用场了。Python中的线程不能用于并行CPU计算。但是它非常适合于I/O操作，比如web抓取，因为处理器处于空闲状态，等待数据。线程化改变了游戏规则，因为许多与网络

YENCSDN 0喜欢 / 0评论 2020-05-14

说说 Python 里关于线程安全的那些事儿

在并发编程时，如果多个线程访问同一资源，我们需要保证访问的时候不会产生冲突，数据修改不会发生错误，这就是我们常说的线程安全。本篇文章会一一回答你的问题。要搞清楚什么是线程安全，就要先了解线程不安全是什么样的。比如下面这段代码，开启两个线程，对全局变量

Yasin 0喜欢 / 0评论 2020-05-07

说说 Python 里关于线程安全的那些事儿

在并发编程时，如果多个线程访问同一资源，我们需要保证访问的时候不会产生冲突，数据修改不会发生错误，这就是我们常说的线程安全。本篇文章会一一回答你的问题。要搞清楚什么是线程安全，就要先了解线程不安全是什么样的。比如下面这段代码，开启两个线程，对全局变量 n

iOampDagWatu 0喜欢 / 0评论 2020-05-06

GIL

GIL，中文译为全局解释器锁。在讲解 GIL 之前，首先通过一个例子来直观感受一下 GIL 在 Python 多线程程序运行的影响。可以看到，a 的引用计数值为 3，因为有 a、b 和作为参数传递的 getrefcount 都引用了一个空列表。所以，CPy

paopao00 0喜欢 / 0评论 2020-05-01

多线程默认情况,守护线程及join对子线程运行的影响

Python多线程与多进程中join()方法的效果是相同的。此时join的作用就凸显出来了，join所完成的工作就是线程同步，即主线程任务结束之后，进入阻塞状态，一直等待其他的子线程执行结束之后，主线程在终止，例子见下面三。当设置守护线程时，含义是主线程对

singer 0喜欢 / 0评论 2020-04-30

Python中多线程和多处理的初学者指南

使用Python分析数据，如果使用了正确的数据结构和算法，有时可以大量提高程序的速度。实现此目的的一种方法是使用Muiltithreading(多线程)或Multiprocessing。在这篇文章中，我们不会详细讨论多线程或多处理的内部原理。相反，我们举一

举 0喜欢 / 0评论 2020-04-29

python多线程实现方式，最基础的实现方式模块是什么

python3.x中通过threading模块创建新的线程有两种方法：一种是通过threading.Thread-即传递给Thread对象一个可执行方法（或对象）;第二种是继承threading.Thread定义子类并重写run()方法。第二种方法中，唯一

学习备忘录 0喜欢 / 0评论 2020-04-20

Python线程和协程CPU资源利用率测试

　　协程，又称为微线程，它是实现多任务的另一种方式，只不过是比线程更小的执行单元。因为它自带CPU的上下文，这样只要在合适的时机，我们可以把一个协程切换到另一个协程。　　协程与线程的差异：　　在实现多任务时, 线程切换从系统层面远不止保存和恢复CPU上下

jacktangj 0喜欢 / 0评论 2020-04-17

python多线程实现异步

import timefrom threading import Threaddef long_io: def func: print time.sleep print res = "

Lexan 0喜欢 / 0评论 2020-04-11

Python学习第47天（递归锁、同步对象、信号量）

　　今天三个部分的知识、递归锁、同步对象、信号量，悄悄的说一下，算上昨天的同步锁，虽然已经讲了四种锁了，但是据说总共是有五种锁的，最后一个我还不知道是个啥。　　昨天引入了同步锁的概念，但是因为同步锁的引入，又发生了一个问题，就是两个锁来回锁，导致程序最终被

paopao00 0喜欢 / 0评论 2020-04-09

代码详解Python多线程、多进程、协程

很多时候我们写了一个爬虫，实现了需求后会发现了很多值得改进的地方，其中很重要的一点就是爬取速度。本文就通过代码讲解如何使用多进程、多线程、协程来提升爬取速度。下面代码的目的是访问300次百度页面并返回状态码，其中parse_1函数可以设定循环次数，每次循环

CloudXli 0喜欢 / 0评论 2020-04-07

Python爬虫案例演示：Python多线程、多进程、协程

很多时候我们写了一个爬虫，实现了需求后会发现了很多值得改进的地方，其中很重要的一点就是爬取速度。本文就通过代码讲解如何使用多进程、多线程、协程来提升爬取速度。P ython实现多线程有一个无数人诟病的 GIL，但多线程对于爬取网页这种多数属于IO密集型的

oXiaoChong 0喜欢 / 0评论 2020-04-07

python-线程三（锁）

lock = Lock() # 创建一个共享锁实例。lock = threading.Lock() # 创建一个锁对象。# 设置限制最多3个线程同时访问共享资源。time.sleep # 睡眠的目的是让线程2获得调度，得到第二把锁。线程1：锁1.a

文山羊 0喜欢 / 0评论 2020-03-28

多线程--vthread

# 就是简单的多退少补，用来动态修改伺服线程数量的。# 因为如果所有线程不停止的话，控制权就不会交还给命令窗口;[ Thread-1 ] foolstring, test1 foolnumb: 123 @ 1585216798.0833788. #

ericxieforever 0喜欢 / 0评论 2020-03-26

Python+PyQT5的子线程更新UI界面的实例《新手必学》

今天小编就为大家分享一篇Python+PyQT5的子线程更新UI界面的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧子线程里是不能更新UI界面的，在移动端方面。Android的UI访问是没有加锁的，多个线程可以同时访问更新操作同一个U

zcabcd 0喜欢 / 0评论 2020-02-22

python-协程、多线程、多进程性能比较

进程是操作系统动态执行的基本单元。线程是独立运行和独立调度的基本单元。协程无需线程上下文切换的开销，也无需原子操作锁定及同步的开销。

学习备忘录 0喜欢 / 0评论 2020-02-18

Python中的GIL锁

在Python中，可以通过多进程、多线程和多协程来实现多任务。在多线程的实现过程中，为了避免出现资源竞争问题，可以使用互斥锁来使线程同步(按顺序)执行。但是，其实Python的CPython解释器上有一把GIL锁，也就是说Python的程序是处于一个解释器

ITxiaobaibai 0喜欢 / 0评论 2020-02-18

爬虫基础知识（陆）

线程没有独立资源，所有线程共享该进程的全部资源。　　　　线程的划分尺度比进程小。　　（二）为什么多进程和多线程可以提高程序的运行速度？　　　　　　解决方式：CPU不用休息。　　　　　　程序中如果只有一个线程，CPU就只处理它。　　　　　　CPU是多核的。

cas的无名 0喜欢 / 0评论 2020-02-18

python语法基础-并发编程-协程-长期维护

# 协程和进程和线程一样都是实现并发的手段，# 开启一个线程，创建一个线程，还是需要开销，# 什么是协程：能够在多个任务之间切换来节省一些IO时间，# 不需要再浪费线程之间的切换了，只需要做程序之间的切换，# 我们在工作中会使用进程，线程，协程来提高代码的

wyqwilliam 0喜欢 / 0评论 2020-02-10

Python 多线程

线程5 种状态: 新建、就绪、运行、阻塞、死亡。Python 提供了 _thread 和 threading 两个线程模块。_thread 是低级、原始的模块，threading 是高级模块，对 _thread 进行了封装，增强了其功能与易用性，绝大多数时

assastor 0喜欢 / 0评论 2020-01-23

Python多线程的事件监控

你创建了10个子线程，每个子线程分别爬一个网站，一开始所有子线程都是阻塞等待。一旦某个事件发生：例如有人在网页上点了一个按钮，或者某人在命令行输入了一个命令，10个爬虫同时开始工作。实际上，在Python的多线程中，有一个 Event模块，天然就是用来实现

learnpy 0喜欢 / 0评论 2020-01-16

二、Python开发---25、多线程多进程（2）

多进程的几种方法。　　Queue：多进程安全的队列，实现多进程之间的数据传递

singer 0喜欢 / 0评论 2020-01-12

java入门篇13 -- 多线程

// thread end mianend与thread start 打印顺序并非一定的，这个是并发，不一定谁会先执行。线程一般会存在几个状态，New 新建的线程对象，Runnable 正在运行中，Block 被阻塞，Waitting 等待中， Time

typhoonpython 0喜欢 / 0评论 2020-01-10

Python——网络编程（三）进程与线程

每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。

shengge0 0喜欢 / 0评论 2020-01-08

Python多线程threading

在Python中，使用多线程multi-threading可以『同时』执行多个任务，比如你需要一个线程来复制读取信息，另一个线程来解析。为什么这里的同时要加引号呢，这是由于Python中GIL，也就是全局锁，看似同时执行多个任务，实际上是分布执行的，只不过

wklken的笔记 0喜欢 / 0评论 2019-12-30

如何让 Python 处理速度翻倍？内含代码

概念篇在理解协程这个概念及其作用场景前，先要了解几个基本的关于操作系统的概念，主要是进程、线程、同步、异步、阻塞、非阻塞，了解这几个概念，不仅是对协程这个场景，诸如消息队列、缓存等，都有一定的帮助。是的，系统由一个个程序，也就是进程组成的，一般情况下，分为

ddxygq 0喜欢 / 0评论 2019-12-30

python多线程join/setDaemon

t.setDaemon # 将主线程设置为（被）守护线程，主线程结束，子线程也随之结束。# 2. t.start()的for循环内join,会阻塞主进程，且下一个子线程被迫等待执行。# 3. 另起一个for循环join，同时执行，等待，执行，主线程结束

georgeandgeorge 0喜欢 / 0评论 2019-12-28

Python 多线程

target ：指定该线程要调用的目标方法。daemon ：指定所构建的线程是否为后台线程。t = threading.Thread # 创建线程

zhouhaihua00 0喜欢 / 0评论 2019-12-26

【python爬虫】多线程爬虫

　　　　　想要提高程序的运行速度----->提高cpu利用率。cup每时每刻都在处理任务，这个任务可以理解为线程。这种情况就叫做多线程。　　　　2、cpu都是分核。最好是多进程和多线程结合，即根据实际的需求，每个cpu开启一个子进程，这个子进程开启多

pengkunstone 0喜欢 / 0评论 2019-12-24

如何提升python的处理速度？

但python是单线程的，想要提升python的处理速度，涉及到一个很关键的技术——协程。本篇文章，将讲述python协程的理解与使用。　　进程是操作系统分配资源的最小单位，系统由一个个程序（进程）组成的，一般而言，分为文本区域、数据区域和堆栈区域

pengkunstone 0喜欢 / 0评论 2019-12-23

threading模块

threading模块用于操作线程，python当前版本的多线程库没有实现优先级、线程组，线程也不能被停止、暂停、恢复、中断，这些功能可在代码中自行实现。threading模块提供的类：　　Thread, Lock, Rlock, Condition, [

meylovezn 0喜欢 / 0评论 2019-12-21

Python多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。线程在执行过程中与进程还是有区别的。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行，必须依存在应用程序中，由应用程序提供多个线程执行控制。每个线程都有他自己的一组C

Yasin 0喜欢 / 0评论 2019-12-19