Python线程讲解

1.多线程threading

python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用

2.进程和线程的关系

线程是进程里面一种真正执行代码的东西,类似进程里面的箭头
进程是资源分配的单位,线程是cpu调度的单位
进程,能够完成多任务,比如 在一台电脑上能够同时运行多个QQ
线程,能够完成多任务,比如 一个QQ中的多个聊天窗口

定义的不同:

  • 进程是系统进行资源分配和调度的一个独立单位.
  • 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位
  • 线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈), 但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源

区别:

  • 一个程序至少有一个进程,一个进程至少有一个线程
    -线程的划分尺度小于进程(资源比进程少),使得多线程程序的并发性高
    -进程在执行过程中拥有独立的内存单元,而多个线程共享内存,从而极大地提高了程序的运行效率
    -线程不能够独立执行,必须依存在进程中

优缺点

  • 线程和进程在使用上各有优缺点:线程执行开销小,但不利于资源的管理和保护;而进程正相反

3.多线程执行

import threading
import time
 
def saySorry():
 
    print("Python才是最好的语言")
 
    time.sleep(1)
 
if __name__ == "__main__":
 
    for i in range(5):
 
    t = threading.Thread(target=saySorry)
 
    t.start() # 启动线程,即让线程开始执行
 
说明:
# 可以明显看出使用了多线程并发的操作,花费时间要短很多
# 创建好的线程,需要调用start()方法来启动
# 主线程会等待所有的子线程结束后才结束

4.线程执行代码的封装

通过使用threading模块能完成多任务的程序开发,为了让每个线程的封装性更完美,所以使用threading模块时,往往会定义一个新的子类class,只要继承threading.Thread就可以了,然后重写 run方法

python的threading.Thread类有一个run方法,用于定义线程的功能函数,可以在自己的线程类中覆盖该方法。而创建自己的线程实例后,通过Thread类的start方法,可以启动该线程,交给python 虚拟机进行调度,当该线程获得执行的机会时,就会调用run方法执行线程

多线程程序的执行顺序与多进程类似,都是不确定的

5.总结

每个线程一定会有一个名字,尽管上面的例子中没有指定线程对象的name,但是python会自动为线程指定一个名字。
当线程的run()方法结束时该线程完成。
无法控制线程调度程序,但可以通过别的方式来影响线程调度的方式

6.多线程-共享全局变量

在一个进程内的所有线程共享全局变量,能够在不适用其他方式的前提下完成多线程之间的数据共享(这点要比多进程要好)

缺点就是,线程是对全局变量随意遂改可能造成多线程之间对全局变量的混乱(即线程非安全),在线程中,不能同时对全局变量进行修改,解决办法是轮流让线程进行修改

7.同步

多线程开发可能遇到的问题

假设两个线程t1和t2都要对num=0进行增1运算,t1和t2都各对num修改10次, num的最终的结果应该为20。但是由于是多线程访问,答案可能不一样,所以在修改时, 就要让其修改完再轮到下一个线程来修改

什么是同步:

同步就是协同步调,按预定的先后次序进行运行。如:你说完,我再说,"同"字从字面上 容易理解为一起动作其实不是,"同"字应是指协同、协助、互相配合

解决问题的思路:
系统调用t1,然后获取到num的值为0,此时上一把锁,即不允许其他现在操作num

对num的值进行+1解锁,此时num的值为1,其他的线程就可以使用num了,而且是 num的值不是0而是1

同理其他线程在对num进行修改时,都要先上锁,处理完后再解锁,在上锁的整个过程 中不允许其他线程访问,就保证了数据的正确性

8.互斥锁

当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制

某个线程要更改共享数据时,先将其锁定,此时资源的状态为锁定,其他线程不能更改;直到该线程释放资源,将资源的状态变成非锁定,其他的线程才能再次锁定该资源。互斥锁保证了每次 只有一个线程进行写入操作,从而保证了多线程情况下数据的正确性

threading模块中定义了Lock类,可以方便的处理锁定:

# 创建锁
mutex = threading.Lock()
#Python小白学习交流群:711312441 
# 锁定
mutex.acquire([blocking])
  
# 释放
mutex.release()

如果设定blocking为True,则当前线程会堵塞,直到获取到这个锁为止(如果没有指定,那么默认为True)如果设定blocking为False,则当前线程不会堵塞

上锁解锁过程:

  • 每次只有一个线程可以获得锁。如果此时另一个线程试图获得这个锁,该线程就会变为 “blocked” 状态,称为“阻塞”,直到拥有锁的线程调用锁的release()方法释放锁之后,锁进 入 “unlocked”状态。
  • 线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁,并使得该线程进入运行( running)状态。

总结:

  • 锁的好处:
    确保了某段关键代码只能由一个线程从头到尾完整地执行
  • 锁的坏处:
    阻止了多线程并发执行,包含锁的某段代码实际上只能以单线程模式执行,效率就大大地下降了
    由于可以存在多个锁,不同的线程持有不同的锁,并试图获取对方持有的锁时, 可能会造成死锁

9.多线程-非共享数据

对于全局变量,在多线程中要格外小心,否则容易造成数据错乱的情况发生
在多线程开发中,全局变量是多个线程都共享的数据,而局部变量等是各自线程的,是非共享的

10.死锁

举个例子:就好比是现实社会中,男女双方都在等待对方先道歉

在线程间共享多个资源的时候,如果两个线程分别占有一部分资源并且同时等待对方的资源,就会造成死锁

避免死锁:

# 程序设计时要尽量避免(银行家算法)<br># 添加超时时间等<br>if mutex.acquire(2):

11.同步应用

可以使用互斥锁完成多个任务,有序的进程工作,这就是线程的同步

12.生产者与消费者模式

Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列 Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue

这些队列都实现了锁原语(可以理解为原子操作,即要么不做,要么就做完),能够在多线程中直接使用

可以使用队列来实现线程间的同步

Queue的说明:

  • 对于Queue,在多线程通信之间扮演重要的角色
  • 添加数据到队列中,使用put()方法
  • 从队列中取数据,使用get()方法
  • 判断队列中是否还有数据,使用qsize()方法
  • 队列就是用来给生产者和消费者解耦的

13.ThreadLocal

在多线程环境下,每个线程都有自己的数据。一个线程使用自己的局部变量比使用全局变量好,因为局部变量只有线程自己能看见,不会影响其他线程,而全局变量的修改必须加锁一个thread.local()变量虽然是全局变量,但每个线程都只能读写自己线程的独立副本,互不干扰。thread.local()解决了参数在一个线程中各个函数之间互相传递的问题

14.异步

  • 同步调用就是你喊你朋友吃饭,你朋友在忙,你就一直在那等,等你朋友忙完了,你们一起去
  • 异步调用就是你喊你朋友吃饭,你朋友说知道了,待会忙完去找你 ,你就去做别的了
pool.apply_async(func=test,callback=test2) # callback是回调

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>