专栏首页我的技术专栏Socket编程实践(1) 基本概念

Socket编程实践(1) 基本概念

1. 什么是socket

socket可以看成是用户进程与内核网络协议栈的编程接口。TCP/IP协议的底层部分已经被内核实现了,而应用层是用户需要实现的,这部分程序工作在用户空间。用户空间的程序需要通过套接字来访问内核网络协议栈。

套接口是全双工的通信,它不仅可以用于本机的进程间通信,还可以用于网络上不同主机的进程间通信。

套接字还可以异构系统间进行通信,异构系统指的是在硬件或软件上有所差别的系统,例如安卓系统的手机与windows系统的PC机上都可以实现QQ通信,套接字可以实现在这两个设备上的通信。

2. IPV4套接口地址结构

套接口既然能够连接两个端系统,那它就需要一个地址来标记该端系统,例如两个电话需要电话号码来标记才可以进行拨号。这抽象成套接口的地址结构。IPV4套接口地址结构通常也称为“网际套接字地址结构”,它以sockaddr_in命名,定义在头文件< netinet/in/h >中。

struct sockaddr_in{

    uint8_t sin_len;

    sa_family_t sin_family;

    in_port_t sin_port;

    struct in_addr sin_addr;

    char sin_zero[8];

};

说明:

  1. sin_len:整个sockaddr_in结构体的长度,在4.3BSD-Reno版本之前的第一个成员是sin_family。
  2. sin_family:指定带地址家族,在这里必须设置为AF_INET。socket在设计时不仅可以用于TCP/IP协议,它还可以用于其他协议,例如unix域协议,地址家族用于指定该套接字用于哪种协议。AF_INET表示用于IPV4协议。
  3. sin_port:端口号,16位的无符号整数,能够表示到65535。2个字节。
  4. sin_addr: IPV4的地址。4个字节的整数。
  5. sin_zero:暂不使用,一般将其设置为0。

其中,struct in_addr仅仅是一个32位的无符号整数,可以在终端下输入man 7 ip进行查看:

接下来看一下通用的地址结构。上面说过,socket可以用于不同的协议上,通用的地址结构可以用于任何协议的socket编程。

struct sockaddr{

    uint8_t sin_len;

    sa_family sin_family;

    char sa_data[14];

};

说明:

  1. sin_len:整个sockaddr结构大小
  2. sin_family:指定该地址家族
  3. sa_data:由sin_family决定它的形式

可以看到,在通用地址结构中sa_data是14个字节,而在IPV4的地址结构中,sin_port、sin_addr、sin_zero三个变量加起来也等于14个字节。也即是说,这两种结构是兼容的。

3. 网络字节序

字节序可以分为大端字节序与小端字节序:

  • 大端字节序(Big Endian) :最高有效位存储于最低内存地址处,最低有效位存储于最高地址内存处。
  • 小端字节序(Little Endian):刚好与大端字节序倒过来,最高有效位存于最高内存地址处,最低有效位存储于最低内存地址处。

这样说起来挺抽象,通过一幅图来说明:

上面说过,socket可以用于异构系统之间的通信。而不同的系统采用的字节序可能是不同的,有的系统采用大端字节序,例如Motorola 6800;有的采用小端字节序,如X86。因此,在进行字节传输时,应该同一一个字节序,称为网络字节序。网络字节序采用大端字节序。如果主机A为小端字节序的系统,那么在传输时需要先将小端字节序转换成网络字节序。这需要一些字节序的转换函数。

我们可以编写程序来测试自己的主机是什么字节序:

#include<stdio.h>

int main(void)

{

        unsigned int x = 0x12345678;

        unsigned char *p = (unsigned char*)&x;

        printf("%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        return 0;

} 

在我的电脑上输出结果为:78,56,34,12. 因此我的主机为小端字节序。

4. 字节序转换函数

如果主机的字节序与网络字节序不同,那么需要进行字节序的转换。下面是一些字节序转换函数:

   # include < arpa/inet.h >

   uint32_t htonl(uint32_t hostlong);

   uint16_t htons(uint16_t hostshort);

   uint32_t ntohl(uint32_t netlong);

   uint16_t ntohs(uint16_t netshort);

说明:h代表host;n代表network;s代表short;l代表long

描述:

  • htonl()函数将无符号整数hostlong从主机字节序转换成网络字节序。
  • htons()函数将无符号短整型hostshort从主机字节序转换成网络字节序。
  • ntohl()函数功能与 htonl()函数相反
  • ntohs()函数功能与htons()函数相反

我们可以进行验证,刚才已经通过程序测试出我的主机是小端字节序,接下来使用函数 htonl()将整数0x12345678转换成网络字节序。

#include<stdio.h>

#include <arpa/inet.h>

int main(void)

{

        unsigned int x = 0x12345678;

        unsigned char *p = (unsigned char*)&x;

        printf("转换前:%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        unsigned int y = htonl(x);

        p = (unsigned char *) &y;

        printf("转换后:%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        return 0;

}         

结果输出:

转换前:78,56,34,12

转换后:12,34,56,78

5. 地址转换函数

对于IP地址,我们通常采用点分十进制的形式进行直观的认识,而程序更多的时候是处理32位的地址,因此需要有函数在点分十进制与32位地址这两种形式间进行转换。

   # include < sys/socket.h>

   # include < netinet/in.h>

   # include < arpa/inet.h>



   int inet_aton(const char *cp, struct in_addr *inp);

   in_addr_t inet_addr(const char *cp);

   char *inet_ntoa(struct in_addr in);

描述:

  • inet_addr()函数:表示将点分十进制的IP地址转换成32位的ip地址(整数)。
  • inet_ntoa()函数:将32位ip地址(网络字节序)转换成点分十进制的ip之地。

例程:

#include<stdio.h>

#include<arpa/inet.h>

int main()

{

        unsigned long addr = inet_addr("192.168.0.100");//将点分十进制转换为32bit地址

        printf("addr = %u\n",htonl(addr)); 



        struct in_addr ipaddr;

        ipaddr.s_addr = addr;

        printf("ipaddr = %s\n",inet_ntoa(ipaddr)); //网络字节序地址转换为点分十>进制

        return 0;

}

输出:

addr = 3232235620

ipaddr = 192.168.0.100

6. 套接字类型

套接字类型主要有三种:

  1. 流方套接字(SOCK_STREAM):它对应TCP协议,它提供面向连接的、可靠的数据传输服务,数据无差错、无重复的发送,且按发送顺序接收。
  2. 数据报套接字(SOCK_DGREAM):提供无连接服务。不提供无错保证,数据可能丢失或重复,并且接收顺序混乱。
  3. 原始套接字(SOCK_RAW):它提供一种能力,让我们直接跨越传输层,直接对IP层进行数据封装,通过该套接字,我们可以直接将数据封装成IP层能够认识的协议格式。

文章连接:http://www.cnblogs.com/QG-whz/p/5426634.html

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Java是编译执行的语言”这句话对吗?

    现在让你谈谈对Java平台的理解,你是否会感觉内容过于庞大?这个问题是比较宽泛的,Java发展到现在已经不仅仅是语言这么简单了,Java平台涉及的,包括但不仅限...

    Tencent JCoder
  • 分布式服务的幂等性设计

    编程中的“幂等性”是指任意多次执行所产生的影响,与一次执行的影响相同。一个拥有幂等性设计的接口,保证无论一次或多次来调用接口,都能够得到相同的结果。接口的幂等性...

    Tencent JCoder
  • 图说C++对象模型:对象内存布局详解

    Tencent JCoder
  • 说说编译插桩

    说到这里,有必要说一下Java字节码和Dalvik 字节码 java字节码可以参考这篇文章作为了解一文让你明白Java字节码,里面演示了如何将字节码反过来解析...

    提莫队长
  • JVM规范系列第4章:Class文件格式

    这一章节讲的是字节码的整个组成格式,读懂了这一章,就读懂了字节码文件。对于这一章的学习,我更推荐作为工具书去查找。最好是找一个最简单的Hello World例子...

    陈树义
  • 字符与字节有什么区别呢?

    1、计算机存储信息的最小单位,称之为位(bit),音译为比特,二进制的一个“0”或一个“1”叫一位。 2、计算机存储容量基本单位是字节(Byte),音译为拜特...

    黑泽君
  • 编解码相关

    张申傲
  • 计算机编码基础

         乱码是我们在日常的工作中经常遇到的问题,你可能从网上好不容易下载了一个炫酷的jQuery插件,但是却在打开的时候,发现某几个js文件都是类似“澶у0?...

    Single
  • 脑残式网络编程入门(九):面试必考,史上最通俗大小端字节序详解

    最近在从头重写 MobileIMSDK 的TCP版,自已组织TCP数据帧时就遇到了字节序大小端问题。所以,借这个机会单独整理了这篇文章,希望能加深大家对字节序问...

    JackJiang
  • 一文读懂 DEX 文件格式解析

    我想说的是写个解析脚本不是为了模仿着 apktools 造轮子,而是在解析过程中寻找逆向的道路,方法会变,工具会变,但一切都建立在 dex 上的安卓不会变

    信安之路

扫码关注云+社区

领取腾讯云代金券