简单理解计算机io和通信

how to communicate between server and client

Posted by licslan on August 7, 2018

这篇文章之前一直想去写,由于自己是半路出家,很多东西不会,但是自己又不想比别人(科班)差太远,所以看了好多的书,目前对于算法是自己非常薄弱的一项。 工作差不多4年了,自己在两年前就像搞清楚一件事情,就是用户和计算机(server与clien—->cs/bs)如何通信的?于是家里就躺了厚厚的几本书,像TCP/IP协议簇, 深入理解计算机系统啊,图解http,当然也去了看了好多,但也没有看完吧。。。。

在这个过程中,自己会去网上查资料啊,看看别人理解的呀但始终感觉自己没有理解的太透彻吧。。。就琢磨着写这篇文章,如今我就试着写写自己的看法和理解。如果有人能看到这篇文章,或是发现里面有不正确的欢迎指正和讨论。

由于我自己对于Java相对其他语言熟悉,就用Java来理解吧,但是2主机通信和语言相关性较低,能理解就行,所以大神一般和语言无关了,语言只是表达的自己要完成一件事情的工具吧,任何语言最终会被编译成计算机能理解的语言===机器语言,被cpu执行。通信之间都是以流的形式进行交互。

要弄清楚2台主机如何通信? 需要了解哪些知识呢?
1.首先要理解通信协议
2.要理解io流
3.要理解计算机硬件结构 冯诺依曼
4.要知道一些框架吧(Netty,dubbo) 对于通信方式的一种封装,针对有语言来实现了底层的通信协议的一种语言框架吧
5.其实计算机理解会看到很多很多术语,但我自己的理解是,这些术语是是针对一些底层功能更好的封装的一种实现之后的叫法了 大家约定俗成了。

对于第一点:
为什么要理解通信协议呢?socket
对于计算机行业的人来说:http/https/ftp/dns/icmp/rap/tcp/udp/ip 这些常用的协议我们要了熟于心,不管是任何有关计算机专业的人,多多少少都要去了解一些的。
这里面主要说说tcp/ip协议,是传输控制协议和网路协议的缩写。Transmission Control Protocol/Internet Protocol

说到tcp就要谈到3次握手,4次挥手,他们保证数据在传输过程中可靠性。上面是关于网络传输协议抽象出来会涉及到的一张图片

来源请请参考:https://www.cnblogs.com/onepixel/p/7092302.html

下面的图便于理解画的

对于第二点: 参考李林锋的《Netty权威指南》 第一章和第二章
1.io流 jdk里面抽象了很多关于流的接口,有BIO的 也有NIO的(jdk1.4) 也有AIO的(jdk1.7)
那么对于同步阻塞IO 同步非阻塞IO 异步非阻塞IO 怎么理解呢 BIO NIO 伪异步IO AIO 阻塞非阻塞/同步异步 怎么理解?

下面我们来看一些图 针对IO流我们放在Linux环境下面来理解 因为企业级的应用全部是放在Linux服务器上面的
下面来讲解一些Linux基础知识点
A.用户空间和内核空间
现在操作系统都采用虚拟寻址,处理器先产生一个虚拟地址,通过地址翻译成物理地址(内存的地址),再通过总线的传递,最后处理器拿到某个物理地址返回的字节。

对32位操作系统而言,它的寻址空间(虚拟存储空间)为4G(2的32次方)。操作系统的核心是内核,独立于普通的应用程序,可以访问受保护的内存空间,也有访问底层硬件设备的所有权限。为了保证用户进程不能直接操作内核(kernel),保证内核的安全,操心系统将虚拟空间划分为两部分,一部分为内核空间,一部分为用户空间。针对linux操作系统而言,将最高的1G字节(从虚拟地址0xC0000000到0xFFFFFFFF),供内核使用,称为内核空间,而将较低的3G字节(从虚拟地址0x00000000到0xBFFFFFFF),供各个进程使用,称为用户空间。

补充:地址空间就是一个非负整数地址的有序集合。如{0,1,2…}。

B.进程上下文切换(进程切换)

为了控制进程的执行,内核必须有能力挂起正在CPU上运行的进程,并恢复以前挂起的某个进程的执行。这种行为被称为进程切换(也叫调度)。因此可以说,任何进程都是在操作系统内核的支持下运行的,是与内核紧密相关的。

从一个进程的运行转到另一个进程上运行,这个过程中经过下面这些变化:

B1. 保存当前进程A的上下文。

上下文就是内核再次唤醒当前进程时所需要的状态,由一些对象(程序计数器、状态寄存器、用户栈等各种内核数据结构)的值组成。

这些值包括描绘地址空间的页表、包含进程相关信息的进程表、文件表等。

B2. 切换页全局目录以安装一个新的地址空间。

B3. 恢复进程B的上下文。

可以理解成一个比较耗资源的过程

C.进程的阻塞
正在执行的进程,由于期待的某些事件未发生,如请求系统资源失败、等待某种操作的完成、新数据尚未到达或无新工作做等,则由系统自动执行阻塞原语(Block)
,使自己由运行状态变为阻塞状态。可见,进程的阻塞是进程自身的一种主动行为,也因此只有处于运行态的进程(获得CPU),才可能将其转为阻塞状态。当进程进入阻塞状态,是不占用CPU资源的

D.文件描述符
文件描述符(File descriptor)是计算机科学中的一个术语,是一个用于表述指向文件的引用的抽象化概念。
文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符。在程序设计中,一些涉及底层的程序编写往往会围绕着文件描述符展开。但是文件描述符这一概念往往只适用于UNIX、Linux这样的操作系统。

E.直接I/O和缓存I/O

缓存 I/O 又被称作标准 I/O,大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中,以write为例,数据会先被拷贝进程缓冲区,在拷贝到操作系统内核的缓冲区中,然后才会写到存储设备中。 缓存I/O的write:

直接I/O的write:(少了拷贝到进程缓冲区这一步)

write过程中会有很多次拷贝,知道数据全部写到磁盘。好了,准备知识概略复习了一下,开始探讨IO模式。

2 I/O模式

对于一次IO访问(这回以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的缓冲区,最后交给进程。所以说,当一个read操作发生时,它会经历两个阶段:

  1. 等待数据准备 (Waiting for the data to be ready)

  2. 将数据从内核拷贝到进程中 (Copying the data from the kernel to the process)

正式因为这两个阶段,linux系统产生了下面五种网络模式的方案:

– 阻塞 I/O(blocking IO)

– 非阻塞 I/O(nonblocking IO)

– I/O 多路复用( IO multiplexing)

– 信号驱动 I/O( signal driven IO)

– 异步 I/O(asynchronous IO)

注:由于signal driven IO在实际中并不常用,所以我这只提及剩下的四种IO 模型。

2.1 block I/O模型(阻塞I/O)

阻塞I/O模型示意图:


read为例:

(1)进程发起read,进行recvfrom系统调用;

(2)内核开始第一阶段,准备数据(从磁盘拷贝到缓冲区),进程请求的数据并不是一下就能准备好;准备数据是要消耗时间的;

(3)与此同时,进程阻塞(进程是自己选择阻塞与否),等待数据ing;

(4)直到数据从内核拷贝到了用户空间,内核返回结果,进程解除阻塞。

也就是说,内核准备数据和数据从内核拷贝到进程内存地址这两个过程都是阻塞的。

2.2 non-block(非阻塞I/O模型)

可以通过设置socket使其变为non-blocking。当对一个non-blocking socket执行读操作时,流程是这个样子:


(1)当用户进程发出read操作时,如果kernel中的数据还没有准备好;

(2)那么它并不会block用户进程,而是立刻返回一个error,从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果;

(3)用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call;

(4)那么它马上就将数据拷贝到了用户内存,然后返回。

所以,nonblocking IO的特点是用户进程在内核准备数据的阶段需要不断的主动询问数据好了没有。

2.3 I/O多路复用

I/O多路复用实际上就是用select, poll, epoll监听多个io对象,当io对象有变化(有数据)的时候就通知用户进程。
好处就是单个进程可以处理多个socket。当然具体区别我们后面再讨论,现在先来看下I/O多路复用的流程


(1)当用户进程调用了select,那么整个进程会被block;

(2)而同时,kernel会“监视”所有select负责的socket;

(3)当任何一个socket中的数据准备好了,select就会返回;

(4)这个时候用户进程再调用read操作,将数据从kernel拷贝到用户进程。

所以,I/O 多路复用的特点是通过一种机制一个进程能同时等待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态,select()函数就可以返回。

这个图和blocking IO的图其实并没有太大的不同,事实上,还更差一些。因为这里需要使用两个system call (select 和 recvfrom),而blocking IO只调用了一个system call (recvfrom)。但是,用select的优势在于它可以同时处理多个connection。

所以,如果处理的连接数不是很高的话,使用select/epoll的web server不一定比使用多线程 + 阻塞 IO的web server性能更好,可能延迟还更大。

select/epoll的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接。)

在IO multiplexing Model中,实际中,对于每一个socket,一般都设置成为non-blocking,但是,如上图所示,整个用户的process其实是一直被block的。只不过process是被select这个函数block,而不是被socket IO给block。

2.4 asynchronous I/O(异步 I/O)

  真正的异步I/O很牛逼,流程大概如下


(1)用户进程发起read操作之后,立刻就可以开始去做其它的事。

(2)而另一方面,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。

(3)然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。

2.5 小结

(1)blocking和non-blocking的区别

调用blocking IO会一直block住对应的进程直到操作完成,而non-blocking IO在kernel还准备数据的情况下会立刻返回。

(2)synchronous IO和asynchronous IO的区别

在说明synchronous IO和asynchronous IO的区别之前,需要先给出两者的定义。POSIX的定义是这样子的:

  • A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;

  • An asynchronous I/O operation does not cause the requesting process to be blocked;

两者的区别就在于synchronous IO做”IO operation”的时候会将process阻塞。按照这个定义,之前所述的blocking IO,non-blocking IO,IO multiplexing都属于synchronous IO。

有人会说,non-blocking IO并没有被block啊。这里有个非常“狡猾”的地方,定义中所指的”IO operation”是指真实的IO操作,就是例子中的recvfrom这个system call。non-blocking IO在执行recvfrom这个system call的时候,如果kernel的数据没有准备好,这时候不会block进程。但是,当kernel中数据准备好的时候,recvfrom会将数据从kernel拷贝到用户内存中,这个时候进程是被block了,在这段时间内,进程是被block的。

而asynchronous IO则不一样,当进程发起IO 操作之后,就直接返回再也不理睬了,直到kernel发送一个信号,告诉进程说IO完成。在这整个过程中,进程完全没有被block。

(3)non-blocking IO和asynchronous IO的区别

可以发现non-blocking IO和asynchronous IO的区别还是很明显的。

–在non-blocking IO中,虽然进程大部分时间都不会被block,但是它仍然要求进程去主动的check,并且当数据准备完成以后,也需要进程主动的再次调用recvfrom来将数据拷贝到用户内存。

–而asynchronous IO则完全不同。它就像是用户进程将整个IO操作交给了他人(kernel)完成,然后他人做完后发信号通知。在此期间,用户进程不需要去检查IO操作的状态,也不需要主动的去拷贝数据。

ok 暂时先写到这里 后面会写一下关于Netty和dubbo 以及现在正在改造中的demo gitlab + docker + k8s + springcloud