Socket 通信原理

什么是Socket?

Socket的中文翻译过来就是“套接字”。套接字是什么,我们先来看看它的英文含义:插座。

Socket就像一个电话插座,负责连通两端的电话,进行点对点通信,让电话可以进行通信,端口就像插座上的孔,端口不能同时被其他进程占用。而我们建立连接就像把插头插在这个插座上,创建一个Socket实例开始监听后,这个电话插座就时刻监听着消息的传入,谁拨通我这个“IP地址和端口”,我就接通谁。

实际上,Socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口,供应用层调用实现进程在网络中的通信。Socket起源于UNIX,在Unix一切皆文件的思想下,进程间通信就被冠名为文件描述符(file desciptor),Socket是一种“打开—读/写—关闭”模式的实现,服务器和客户端各自维护一个“文件”,在建立连接打开后,可以向文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。

另外我们经常说到的Socket所在位置如下图:

Socket通信过程

Socket保证了不同计算机之间的通信,也就是网络通信。对于网站,通信模型是服务器与客户端之间的通信。两端都建立了一个Socket对象,然后通过Socket对象对数据进行传输。通常服务器处于一个无限循环,等待客户端的连接。

一图胜千言,下面是面向连接的TCP时序图

客户端过程:

客户端的过程比较简单,创建Socket,连接服务器,将Socket与远程主机连接(注意:只有TCP才有“连接”的概念,一些Socket比如UDP、ICMP和ARP没有“连接”的概念),发送数据,读取响应数据,直到数据交换完毕,关闭连接,结束TCP对话。

import socket
import sys

if __name__ == '__main__':
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  # 创建Socket连接
    sock.connect(('127.0.0.1', 8001))  # 连接服务器
    while True:
        data = input('Please input data:')
        if not data:
            break
        try:
            sock.sendall(data)
        except socket.error as e:
            print('Send Failed...', e)
            sys.exit(0)
        print('Send Successfully')

        res = sock.recv(4096)  # 获取服务器返回的数据,还可以用recvfrom()、recv_into()等
        print(res)
    sock.close()

sock.sendall(data)

这里也可用 send()方法:不同在于 sendall()在返回前会尝试发送所有数据,并且成功时返回None,而 send()则返回发送的字节数量,失败时都抛出异常。

服务端过程:

咱再来聊聊服务端的过程,服务端先初始化Socket,建立流式套接字,与本机地址及端口进行绑定,然后通知TCP,准备好接收连接,调用 accept()阻塞,等待来自客户端的连接。如果这时客户端与服务器建立了连接,客户端发送数据请求,服务器接收请求并处理请求,然后把响应数据发送给客户端,客户端读取数据,直到数据交换完毕。最后关闭连接,交互结束。

import socket
import sys

if __name__ == '__main__':
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  # 创建Socket连接(TCP)
    print('Socket Created')

    try:
        sock.bind(('127.0.0.1', 8001))  # 配置Socket,绑定IP地址和端口号
    except socket.error as e:
        print('Bind Failed...', e)
        sys.exit(0)

    sock.listen(5)  # 设置最大允许连接数,各连接和Server的通信遵循FIFO原则

    while True:  # 循环轮询Socket状态,等待访问
        conn, addr = sock.accept()
        try:
            conn.settimeout(10)  # 获得一个连接,然后开始循环处理这个连接发送的信息

            # 如果要同时处理多个连接,则下面的语句块应该用多线程来处理
            while True:
                data = conn.recv(1024)
                print('Get value ' + data, end='\n\n')
                if not data:
                    print('Exit Server', end='\n\n')
                    break
                conn.sendall('OK')  # 返回数据
        except socket.timeout:  # 建立连接后,该连接在设定的时间内没有数据发来,就会引发超时
            print('Time out')

        conn.close()  # 当一个连接监听循环退出后,连接可以关掉
    sock.close()

conn, addr = sock.accept()

调用 accept()时,Socket会进入“waiting”状态。客户请求连接时,方法建立连接并返回服务器。 accept()返回一个含有两个元素的元组(conn, addr)。第一个元素conn是新的Socket对象,服务器必须通过它与客户通信;第二个元素addr是客户的IP地址及端口。

data = conn.recv(1024)

接下来是处理阶段,服务器和客户端通过 send()recv()通信(传输数据)。

服务器调用 send(),并采用字符串形式向客户发送信息, send()返回已发送的字符个数。

服务器调用 recv()从客户接收信息。调用 recv()时,服务器必须指定一个整数,它对应于可通过本次方法调用来接收的最大数据量。 recv()在接收数据时会进入“blocked”状态,最后返回一个字符串,用它表示收到的数据。如果发送的数据量超过了 recv()所允许的,数据会被截短。多余的数据将缓冲于接收端,以后调用 recv()时,多余的数据会从缓冲区删除(以及自上次调用 recv()以来,客户可能发送的其它任何数据)。传输结束,服务器调用Socket的 close()关闭连接。

TCP三次握手的Socket过程:
  1. 服务器调用 socket()bind()listen()完成初始化后,调用 accept()阻塞等待;
  2. 客户端Socket对象调用 connect()向服务器发送了一个SYN并阻塞;
  3. 服务器完成了第一次握手,即发送SYN和ACK应答;
  4. 客户端收到服务端发送的应答之后,从 connect()返回,再发送一个ACK给服务器;
  5. 服务器Socket对象接收客户端第三次握手ACK确认,此时服务端从 accept()返回,建立连接。

接下来就是两个端的连接对象互相收发数据。

TCP四次挥手的Socket过程:
  1. 某个应用进程调用 close()主动关闭,发送一个FIN;
  2. 另一端接收到FIN后被动执行关闭,并发送ACK确认;
  3. 之后被动执行关闭的应用进程调用 close()关闭Socket,并也发送一个FIN;
  4. 接收到这个FIN的一端向另一端ACK确认。

上面的代码是简单的演示Socket的基本函数使用,其实不管有多复杂的网络程序,这些基本函数都会用到。上面的服务端代码只有处理完一个客户端请求才会去处理下一个客户端的请求,这样的服务器处理能力很弱,而实际中服务器都需要有并发处理能力,为了达到并发处理,服务器就需要fork一个新的进程或者线程去处理请求。

原文发布于微信公众号 - php(phpdaily)

原文发表时间:2018-03-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏用户2442861的专栏

recv函数说明返回值

客户端的程序连接上服务器后recv函数阻塞接受,有时会返回0,说明接收超时服务器主动断开了连接,需要重新connect服务器,但重新connect时会报“Tr...

54010
来自专栏Hadoop实操

如何在RedHat7上使用Bind搭建DNS服务

搭建私有的DNS服务的方式有多种,如Window Server、Dnsmasq、BIND等,前面Fayson介绍了《如何利用Dnsmasq构建小型集群的本地DN...

59440
来自专栏哲学驱动设计

一个简单的 Chrome 插件

之前做秒杀器的时候,使用的是 WPF 客户端,借助 HttpWebRequest 来实现远程调用。 后来看到别人抢火车票的软件是一个 Chrome 插件,发现这...

20450
来自专栏大闲人柴毛毛

Linux系统服务——Daemon

什么是Daemon? Daemon是Linux的一些系统服务,它们是一些常驻内存的进程。 Daemon分类 Daemon拥有两种分类方式,按照“daemon是...

39140
来自专栏飞雪无情的博客

Go语言经典库使用分析(三)| Gorilla Handlers 详细介绍

在我们编写web服务端程序的时候,我们可能会对一些甚至全部的Http Request统一处理,比如我们记录每个访问的Request,对提交的Form表单进行映射...

12810
来自专栏Java学习网

Java中的Socket编程学习

Java中的Socket编程学习   Socket,又称为套接字,Socket是计算机网络通信的基本的技术之一。如今大多数基于网络的软件,如浏览器,即时通讯工...

30370
来自专栏linux驱动个人学习

预处理

预处理有很多,以下选取我实际用过和见过的: #ifdef 电脑程序语句,我们可以用它区隔一些与特定头文件、程序库和其他文件版本有关的代码。 1 #includ...

27830
来自专栏pangguoming

创建GitHub技术博客全攻略

说明: 首先,你需要注册一个 github 账号,最好取一个有意义的名字,比如姓名全拼,昵称全拼,如果被占用,可以加上有意义的数字. 1. 注册账号: 地址:...

41570
来自专栏CSDN技术头条

Webpack 的 HMR 运行机制

首先利用 Chrome 的 dev-tools 中的 network 观察,代码改变的时候,页面与后端之间发生了什么?示例中的项目代码地址已上传 Github。

11320
来自专栏SDNLAB

【连载-4】数据中心网络虚拟化 配置管理技术

在构建虚拟网络时,管理员需要进行大量的配置工作,例如端口的ip地址和VXLAN配置等等。显然,没有人愿意在系统每次启动时都将繁琐的配置工作重复一遍,所以将配置信...

28650

扫码关注云+社区

领取腾讯云代金券