多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
[TOC] # 简介 由于线程是操作系统直接支持的执行单元,因此,高级语言通常都内置多线程的支持,Python也不例外,并且,Python的线程是真正的Posix Thread,而不是模拟出来的线程. Python的标准库提供了两个模块:`_thread`和threading,`_thread`是低级模块,threading是高级模块,对_thread进行了封装。绝大多数情况下,我们只需要使用threading这个高级模块 启动一个线程就是把一个函数传入并创建Thread实例,然后调用start()开始执行 # 线程名字 由于任何进程默认就会启动一个线程,我们把该线程称为主线程,主线程又可以启动新的线程,Python的threading模块有个`current_thread()`函数,它永远返回当前线程的实例。主线程实例的名字叫MainThread. 子线程的名字在创建时指定,我们用LoopThread命名子线程。名字仅仅在打印时用来显示,完全没有其他意义,如果不起名字Python就自动给线程命名为Thread-1,Thread-2…… # 常用方法 在一个新线程中运行loop方法,线程名字叫LoopThread,args表示给这个方法传递参数 ~~~ threading.Thread(target=loop, name='LoopThread', args=(g_nums, )) ~~~ 当前线程的名字 ~~~ threading.current_thread().name ~~~ 查看线程的数量 ~~~ len(threading.enumerate()) ~~~ # 多线程,函数函数 ~~~ import threading # 新线程执行的代码: def loop(): print('thread %s is running...' % threading.current_thread().name) print('thread %s is running...' % threading.current_thread().name) t = threading.Thread(target=loop, name='LoopThread') # 启动线程 t.start() ~~~ 当调用start()时,才会真正的创建线程,并开始执行 # 查看线程的数量 ~~~ import threading # 新线程执行的代码: def loop(): print('thread %s is running...' % threading.current_thread().name) print('thread %s is running...' % threading.current_thread().name) t1 = threading.Thread(target=loop, name='t1') t2 = threading.Thread(target=loop, name='t2') t1.start() t2.start() length = len(threading.enumerate()) print('当前运行的线程数为 : %d' %length) ~~~ # 多线程,对象方式 ~~~ import threading, time class MyThread(threading.Thread): def run(self): for i in range(3): time.sleep(1) msg = "I'm " + self.name + ' @ ' + str(i) # name属性中保存的是当前线程的名字 print(msg) if __name__ == '__main__': t = MyThread() # start会自动执行run方法 t.start() ~~~ # lock **常用方法** ~~~ # 创建锁 mutex = threading.Lock() # 锁定 mutex.acquire() # 释放 mutex.release() ~~~ **注意** * 如果这个锁之前是没有上锁的,那么acquire不会阻塞 * 如果在调用acquire对这个锁上锁之前,它已经被其他线程上了锁,那么此时acquire锁被解锁为止 # 多核CPU 如果你不幸拥有一个多核CPU,你肯定在想,多核应该可以同时执行多个线程。 如果写一个死循环的话,会出现什么情况呢? 打开Mac OS X的Activity Monitor,或者Windows的Task Manager,都可以监控某个进程的CPU使用率。 我们可以监控到一个死循环线程会100%占用一个CPU。 如果有两个死循环线程,在多核CPU中,可以监控到会占用200%的CPU,也就是占用两个CPU核心。 要想把N核CPU的核心全部跑满,就必须启动N个死循环线程。 试试用Python写个死循环: ~~~ import threading, multiprocessing def loop(): x = 0 while True: x = x ^ 1 for i in range(multiprocessing.cpu_count()): t = threading.Thread(target=loop) t.start() ~~~ 启动与CPU核心数量相同的N个线程,在4核CPU上可以监控到CPU占用率仅有102%,也就是仅使用了一核。 但是用C、C++或Java来改写相同的死循环,直接可以把全部核心跑满,4核就跑到400%,8核就跑到800%,为什么Python不行呢? 因为Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。 GIL是Python解释器设计的历史遗留问题,通常我们用的解释器是官方实现的CPython,要真正利用多核,除非重写一个不带GIL的解释器。 所以,在Python中,可以使用多线程,但不要指望能有效利用多核。如果一定要通过多线程利用多核,那只能通过C扩展来实现,不过这样就失去了Python简单易用的特点。 不过,也不用过于担心,Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响