io 模型
阻塞非阻塞与同步异步
《操作系统概念(第九版)》,中指出:
进程间通信通过
send()
和receive()
两种基本操作完成,具体实现存在着不同的设计.消息的传递(message passing)可能是阻塞或非阻塞,也被称为同步或异步:
- 阻塞发送(blocking send):发送消息的进程会一直阻塞到消息被接收进程接收
- 非阻塞发送(nonblocking send):发送进程发送消息后,立刻就可以执行其他操作
- 阻塞接收(blocking receive): 接收方调用receive()后一直阻塞到消息到达可用.
- 非阻塞接收(nonblocking receive): 接收者调用receive()后,要么有个有效的结果,要么得到一个null值.
以上send()和receive()有不同的组合方式
在系统的进程级通信的维度上,阻塞非阻塞,同步非同步是类似的,只需要针对接收者和发送者区分即可.
io中的阻塞非阻塞,同步异步与上述不同.
io与进程状态
阻塞,非阻塞,同步与异步.
进程的状态
- new
- ready
- waiting: 除了调用
sleep或wait
,调用system call
,system call涉及到了io操作,不能立即完成,因此内核将该进程切换为wait. - running: 1个核心同一时间只会有1个running
- terminated
io的五种模型
linux内核将所有外部设备都看作一个文件来操作。对一个文件的读写会调用内核提供的系统命令,返回一个file descriptor(fd 文件描述符)
。而对于一个socket的读写也会有响应的描述符,称为socketfd(socket 描述符)
,描述符就是一个数字,指向内核中的一个结构体(文件路径,数据区等属性)
阻塞io
最常用的模型就是阻塞io,所有文件操作都是阻塞的。
在进程空间中调用recvfrom
,其系统调用直到数据包到达且被可复制到应用进程的缓冲区或者发生错误时才返回,在此期间一直会等待。
非阻塞io
recvfrom
从应用层到内核的时候,如果该缓冲区没有数据的话,直接返回一个EWOULDBLOCK错误,一般都对 非阻塞IO模型进行轮询检查找个状态,看内核是不是有数据
io复用
linux提供select/poll
,进程通过将一个或多个fd传送给select或poll系统调用,阻塞在select操作上。这样select/poll
可以帮我们侦测多个fd是否处于就绪状态。
select/poll
顺序扫描fd是否就绪,而且扫描的fd个数有限。
linux还提供了一个epoll系统调用,epoll使用基于事件驱动方式代替顺序扫描。性能更高。当有fd就绪,立即回调函数rollback
信号驱动io模型
开启套接口信号驱动io功能,通过系统调用sigaction执行一个信号处理函数(此系统调用立即返回,进程继续工作,它是非阻塞)。当数据准备就绪时,就为该线程生成一个sigio信号,通过信号回调通知应用程序调用recvfrom
来读取数据,并通知主循环函数处理数据
异步io
告知内核启动某个操作,并让内核在整个操作完成后(包括将数据从内核复制到用户自己缓冲区)通知我们。这种操作于信号驱动模型的主要区别:
- 信号驱动IO由内核告知我们何时开启下一个io
- 异步io模型由内核通知我们io操作何时已经完成。