课程内容

进程间通信复杂 [内存空间独立]、切换成本高 [时间局部性]，所以发明了线程

线程

一个进程的分支 [pthread]，本质上是一个轻量级的进程

创建一个新的线程

man pthread_create
原型
- thread：线程id [注意：不是数字类型，不能直接用==判断，见pthread_equal]
- attr：属性
- arg是start_routine的参数
描述
- 开启一个新的线程，并执行start_route函数
  - start_route函数只能收一个arg参数 [多个参数可用结构体封装]
- 线程有4种终结的方式 [作为工具人，死亡方式很重要]
  - ① 自杀：自己调用pthread_exit
    - 同一进程下的线程可使用pthread_join接收它的死亡状态 [有点像wait]
  - ② 正常死亡：从start_routine函数中返回
    - 与pthread_exit方式等价
  - ③ 他杀：pthread_cancel
  - ④ 同归于尽：进程中的一个线程调用exit，或者主线程从main函数中返回
    - [PS] 如果一个线程导致内存崩溃，极有可能也产生同归于尽的效果，即进程中的所有线程都死亡
- attr可以为NULL，对应默认属性
- 调用成功后，会将线程id保存在thread变量中，后续都可以通过这个id使用它 [类似文件描述符]
返回值
- 0，成功；否则，失败

线程自杀

man pthread_exit
❗ 线程自杀，将retval传给join的线程 [线程默认是可加入的]
执行完pthread_cleanup_push注册的函数，随后释放线程特有的数据
- 进程中共享的资源不会被释放 [因为还有兄弟线程]
- atexit注册的函数不会被调用 [这是属于进程的]
在最后一个线程结束后，进程以exit(0)的方式结束，释放进程共享的资源，并执行atexit注册的函数
【注意】线程和进程的关系

给一个线程发送取消请求 [他杀]

终止普通进程

man exit
传给父进程的值为：status & 0377
- 注意：0377是8进制，对应二进制的8个1，也就是只保留status的低8位
使用atexit和on_exit注册的函数会以与注册相反的顺序被调用
- 可以套娃：注册的函数中还可以有注册，并且会放在调用列表的最前面
- 如果注册的函数没有返回，比如调用了_exit或者使用信号自杀，剩余的函数不会再被调用，exit相关的处理也会被禁止
- 多次注册函数，会被多次调用
⭐ exit后会刷新并关闭所有标准IO流

等待线程终止

man pthread_join
可类比进程中的wait函数
retval接收线程退出状态
- 如果线程是自杀的，则复制pthread_exit中的retval值
- 如果线程是他杀的，则赋值为PTHREAD_CANCELED
[思考] 这里的retval是二级指针，也就是指针的指针，为什么？
- 表面原因：pthread_exit里的retval是一个指针，按照惯例，这里就要用二级指针了 [同理，如果接收的是一个int数据，这里就用int *]
- 进一步原因：为了可以修改传过来的指针
- 这里有一个博客也提到了：探讨pthread_join()函数第二个形参为啥是二级指针问题——CSDN

分离线程

让出处理器 [processor]

man pthread_yield
[类似sleep的效果]
该方法只用于某些系统，更标准的用法：sched_yield
- 对于协同式系统，调用此函数来主动让出CPU
- 对于抢占式系统，内核会进行调度，该函数没有太大意义，也可直接使用sleep
- 协同式与抢占式，详见4 高级进程管理——调度器分类

对比两个线程的id [不能直接用==判等]

让一堆线程在池子里待命，随时工作

基本组成部分👇

①任务队列：存放需要处理的任务

② 多个线程：时刻准备着，减少创建响应和销毁的时间

③ 线程功能：do_work()

❗ 注意：push和pop的时候都需要加锁，防止数据竞争 [饥渴的线程]

线程是谁产生的？线程模型

两者的区别主要在调度上：内核线程由内核调度；用户线程由用户进程调度
内核线程的优势
- ① 每个内核线程有自己的时间片。所以其进程因为有多个线程，会拥有更多的处理器时间；而用户进程不会因为多分出了几个用户线程获得更多的处理器时间
- ② 如果一个内核线程被阻塞，进程中剩余的线程还可以继续运行。如果一个用户线程被阻塞，整个进程就都会被阻塞
  - PS：如果一个内核线程给自己的进程发送sleep信号，这个线程依然可以继续运行
用户线程的优势
- ① 切换成本低。不会涉及用户态向内核态的转换
- ② 调度算法完全由进程控制。用户进程可以用自己的调度算法，所以自主性更好；而内核线程的调度，对用户来说是一个黑箱
所以可以结合两者的优势，设计既有内核线程，也有用户线程的混合式线程

关注：pthread_create函数的使用
如果在创建线程后，没有usleep或者usleep的时间过短，可能发生：
- 主线程return，从而使所有子线程同归于尽
- 此时会发生某些输出出现两次的情况，如①、② [③为正常输出]
- 猜测：输出缓冲区的问题，在线程突然结束时，又输出了一次缓冲区的内容 [缓冲区没来得及更新]
- [PS] 使用fflush也不能解决，可能因为线程是突然结束的
注意：所有线程都可以操作同一个地址的值