最近在从头重写 MobileIMSDK 的TCP版,自已组织TCP数据帧时就遇到了字节序大小端问题。所以,借这个机会单独整理了这篇文章,希望能加深大家对字节序问题的理解,加强对IM这种基于网络通信的程序在数据传输这一层的知识掌控情况。
我一直都不理解,为什么要有大小端区分,尤其是小端,总是会忘记,因为他不符合人类的思维习惯,但存在即为合理,存在就有他存在的价值。这里有一个比较合理的解释:计算机中电路优先处理低位字节,效率比较高,因为计算机都是从低位开始的,所以计算机内部处理都是小端字节序。但是我们平常读写数值的方法,习惯用大端字节序,所以除了计算机的内部,其他场景大都是大端字节序,比如:网络传输和文件储存时都是用的大端字节序。
在计算机领域,大小端(Endianness)是指字节序的排列顺序。简单来说,就是存储器中多字节数据的字节序列,从高到低或从低到高的顺序不同。那么,何谓大小端呢?
对于涉及跨平台开发的项目,就可能会遇到数据大小端的问题,其实就是一个数字在内存中的字节序的问题,判断当前系统是大小端有现成的例子,自己实现转换代码也非常方便,网上有好多不用多说。 但我是个懒人,就算是这么简单的代码,有现成的就不想自己写。 今天要说的是gcc本身已经提供了大小端的判断和数据转换的函数,真的没必要自己写。
科学巨匠尚且如此,何况芸芸众生呢。我们不可能每个软件都从头开始搞起。大部分时候,我们都是利用已有的软件,不管是应用软件,还是操作系统。所以,对于MIPS架构来说,完全可以把在其它架构上运行的软件拿来为其所用。
许多操作系统使用8位的块作为最小可寻址内存单元,我们把内存看做一个很大的数组,最小可寻址单元的大小就是一个数组成员的大小。
经常在写代码的时候需要处理宽字符,ASCII 字符,在代码中看到 wchar、char 等等。一般都是处理一个方法的时候发现需要的是某字符串,然后这边有什么字符串,之后查一个转换方法。还有对于 Unicode 、ANSI 这些不太分得清,所以花了一点时间看了一看。做个小结。
MurmurHash 是一种非加密型哈希函数,适用于一般的哈希检索操作。与其它流行的哈希函数相比,对于规律性较强的 key,MurmurHash 的随机分布特征表现更良好。
类对象模型是一种编程概念,用于描述和实现面向对象编程(OOP)中的类和对象。在这个模型中,类定义了对象的结构和行为,包括数据成员(属性)和成员函数(方法)。对象是类的实例,具有类的所有属性和方法。类对象模型支持封装、继承和多态等OOP特性,使得代码更加模块化、可重用和易于维护。通过类对象模型,程序员可以创建复杂的软件系统,提高开发效率和代码质量。
关于整数在内存中的存储形式,在博主之前写的文章里已经介绍了!友友们可以去点下面链接去看,这里就不过多介绍。
小端 ( little-endian):低位字节在前,高位字节在后。大端(Big-Endian),则反之。具体而言,就是为了说清楚,CPU架构中1字(word)的存储顺序。计算机内存中数据自然流动的顺序就是:低位先来,高位紧随其后
因为在计算机系统中,数值统一用补码来表示和存储。原因在于,用补码来存储,可以将符号位和数值统一处理,同时加法减法也可以统一处理(CPU只有加法器),补码和原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
一个整形1,只占4个字节,为了节省内存空间,我们就用int类型来存储,而没必要用long long类型。
最近基于MFC对话框,编写一个字节转码小工具(数值与字节码的相互转换,包括大小端和swap形式,数据包括整型、浮点型数据)。在使用串口、网络通信、嵌入式软件开发时,大小端字节序和Byte Swap是很常见的事情,许多工具软件诸如Modbus Poll和Modbus Slave都提供了数值(short,unsigned short,int, unsigned int,long long,unsigned long long,float,double等数值)的4种表示方式:Big-endian(大端)、Little-endian(小端)、Big-endian byte swap、Little-endian byte swap。如下图所示,Modbus Poll和Modbus Slave的Display菜单显示了这种情况:
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第2天,点击查看活动详情
使用这些内置类型就意味着开辟内存的大小和看待内存空间的视角,是C语言中必不可少的。
0000 0000 0000 0000 0000 0000 0000 0000 到 1111 1111 1111 1111 1111 1111 1111 1111 1111 也就是0到255
什么是计算机大小端?简单来说,大小端(Endian)是指数据存储或者传输时的字节序,大小端分大端和小端。 所谓大端(Big-Endian)模式,是指数据的低位(就是权值较小的后面那几位)保存在内存的高地址中,而数据的高位,保存在内存的低地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放。 所谓小端(Little-Endian)模式,是指数据的低位保存在内存的低地址中,而数 据的高位保存在内存的高地址中,这种存储模式将地址的高低和数据位权有效地结合起来,高地址部
static inline uint16_t bswap_16(uint16_t x) { return (x >> 8) | (x << 8); }
上一个专题我们详细的分享了c语言里面的结构体用法,读者在看这些用法的时候,可以一边看一边试验,掌握了这些基本用法就完全够用了,当然在以后的工作中,如果有遇到了更高级的用法,我们可以再来总结学习归纳。好了,开始我们今天的主题分享。
一个变量的创建是要在内存中开辟空间的,空间的大小是根据不同的类型而决定的。 那数据在所开辟的内存当中是如何存储的呢? 比如:
16bit宽的数0x1234在Little-endian模式(以及Big-endian模式)CPU内存中的存放方式(假设从地址0x4000开始存放)为:
https://blog.csdn.net/Easonmax/article/details/134298830?spm=1001.2014.3001.5501
这段代码的结果是什么呢? 首先关于char,存储的时候是是一个字节,意味着的是最高只能是2的7次方-1。为什么是7次方呢? 因为char是有符号的类型,符号位占了一个字节,也就还剩下127为最高,最小为-128。 此外,127和-128其实是连在一起的,意思是,对于char或者是别的一些有符号的类型也相当于是这样的,从0开始一直加1,能到127,在加上1就会变成-128,然后再加,最后又到0。 所以,a=101加上27,变成的是相当于-128,存储方式是1000 0000作为补码存储再内存中,符号位是1。但是在和int类型的sum进行计算时会整型提升(可以点进去看看,里面有相关介绍),此时由于最高位置是1,所以高位补1,然后再取反+1。为-128,所以sum+=a为sum=200-128=72。
上周写过一个什么是大小端的答疑解惑,今天接着说如何使用C语言来确定当前系统的大小端,下面介绍两种有效的方法。 方法1:利用union类型 —— 可以利用union类型数据的特点:所有成员的起始地址一致。 #include <cstdio> int checkSystem() { union check { int i; char ch; }c; c.i=1; return (c.ch==1);
任意一个整数(当然是不能超过INT_MAX的一个数字),都是以2进制的表示方式存储的,表示方法有三种,分别为原码,反码,补码 而这三种方法都是既有符号位又有数值位的两个部分,符号位都是0来表示“正”,用1来表示“负”,最高的那位被当作是符号位,剩下来的31个bit全是数值位。 正数的三种表示形式都是相同的 而负数三种表示方式不同 原码:直接将数值按照正负数的形式,表示为二进制,就是原码 反码:将原码的符号位不改变,其余的按位取反。 补码:反码+1得到。 当然不管是正数还是负数,整数的存储存放的就是补码。 关于为什么要存放补码存贮,其实真正的原因是因为,使用补码,可以将符号位和数值域统一处理,同时加法和减法也可以统一处理,并且原码和补码的相互转换的处理过程是相同的,不需要额外的硬件电路(符号位不变,取反,+1)
Stub是一段代码,用来转换RPC过程中传递的参数。处理内容包括不同OS之间的大小端问题。另外,Client端一般叫Stub,Server端一般叫Skeleton。
字节序关系到我们的网络数据能否被正确地解析或使用。那么什么是字节序?又怎么处理字节序的问题呢?本文就来谈一谈字节序的问题。
整形即有符号(signed)和无符号(unsigned)定义的char,short,int,long型。
目录 大小端 如何理解 注意 基本概念 如何影响数据存储 如何存取 以小端为例 总结 取值范围 对于-128的理解 为什么存的是补码 ---- 大小端 数据在内存的存入有大小端之分 如何理解 吃鸡蛋:对于吃鸡蛋从大的一端还是小的一端这件事情,没有一定的合理说法 不通电脑硬件厂商的选择不同 📷 注意 📷 无论如何放,以同条件去取,都可以! 基本概念 📷 记忆:小小小(成为小端),其他的是大端 如何影响数据存储 大小端存储方案本质是数据和空间按照字节为单位的一种映射关系 📷
然后开始面试,面试过程比较凌乱,感觉面试官在想问题问,中间比较尴尬。下面是记得的一下题目:
https://mp.weixin.qq.com/s/rGtgS9ZoHZQ7fPkzKp-0Tw
1.这里需要提醒大家的就是其实char也是整形家族的,因为char类型在内存中是以ASCII码值存储的。
Unicode 标准有上千页,还有几十页的补充附录、报告和注解。想要深入了解 Unicode,确实要下些功夫。
(简单来说)因为: 计算机的CPU只有加法器,但是在**二进制中,正数和负数的表示方法不同。如果我们想统一加法和减法的操作,就需要将所有的数(无论正负)都转换为一种表示方式**,【补码就是其中的一种表示方式。】 当都转化为补码这一种形式的时候,我们就可以统一加法和减法操作,从而简化了计算机的运算过程。
先问大家一个隐私习惯,吃茶叶蛋的时候,你会先磕破鸡蛋比较小的那一端,还是比较大的那一端?
1、什么是进程,线程,有什么区别 2、多进程、多线程的优缺点 3、什么时候用进程,什么时候用线程 4、多进程、多线程同步(通讯)的方法 5、进程线程的状态转换图 。什么时候阻塞,什么时候就绪 6、父进程、子进程的关系以及区别 7、什么是进程上下文、中断上下文 8、一个进程可以创建多少线程,和什么有关 9、进程间通讯: (1)管道/无名管道(2)信号(3)共享内存(4)消息队列(5)信号量(6)socket 注意:临界区则是一种概念,指的是访问公共资源的程序片段,并不是一种通信方式。 10、线程通讯(锁): (1)信号量(2)读写锁(3)条件变量(4)互斥锁(5)自旋锁
✨作者:@平凡的人1 ✨专栏:《C语言从0到1》 ✨一句话:凡是过往,皆为序章 ✨说明: 过去无可挽回, 未来可以改变 📷 ---- 🌹感谢您的点赞与关注,同时欢迎各位有空来访我的🍁平凡舍 ---- 前面,我们通过这一篇博客👉关键字 对我们前面学过的关键字进行了一些内容的补充拓展,同时,认识学习了我们3个不太常用的关键字,老规矩,现在,通过这一篇新的博客——我们仍然对关键字这块的相关内容进行一些补充拓展,同时对一些关键字进行简单的剖析。 话不多说,直接进入主题👇 文章目录 基本数据类型 最冤枉
常用工具 在线工具 在线工具 开发者工具 在线IDE(coder-server) 腾讯开发者手册 get-pip脚本 各种计算器 镜像站 清华源主页 清华yum源 清华epel源 清华pip源 清华apt源 清华Node源 清华Docker源 Mac软件 gif录制工具:kap 粘贴板工具:Maccy 截图工具:ishot Windows软件 粘贴板:CopyQ 粘贴板:Ditto Linux软件 以web形式共享你的终端:ttyd 将linux命令以HttpServer的形式共享:gott
注:不要将sizeof误认为函数,虽然sizeof带有(),但是sizeof是操作符,关键字
char unsigned char signed char short unsigned short [int] signed short [int] int unsigned int signed int long unsigned long [int] signed long [int] 或许有朋友会疑问,为什么char是整型家族的?它不是字符型的吗,那是因为
说明:这里我们可以看到IP地址点分十进制表示方法被转换成一般形式(这里打印出的是十六进制表示法)。
在上一篇博客 【Android 逆向】ELF 文件格式 ( 安装 010 Editor 二进制查看工具的 ELF.bt 插件模板 | 安装 ELF.bt 模板 | 打开 ELF 文件 ) 中 , 准备 ELF 文件解析环境 , 在 010 Editor 中安装了 ELF.bt 模板 ;
我们知道,一个变量的创建是要在内存中开辟空间的,而且所开辟空间的大小是根据不同的类型决定的,那么,数据在所开辟内存中到底是如何存储的呢?接下来我们探讨这个问题。
创建网络套接字,用于网络通信使用,类似于文件操作的open函数。该函数在服务器和客户端都会用到。
前面我发过用vs看内存存储的文章,90%耐心看的都懂了,这次结合上次发的文章,对大小端对齐再来个说明(有一个没学过计算机的朋友都懂了,自己看自己的悟性定位吧~努力可以弥补99%的可能) 单位,补码之类
strings命令是二进制工具集GNU Binutils的一员,用于打印文件中可打印字符串,文件可以是文本文件(test.c),但一般用于打印二进制目标文件、库或可执行文件中的可打印字符。字符串默认至少是4个或更多可打印字符的任意序列,可使用选项改变字符串最小长度。
领取专属 10元无门槛券
手把手带您无忧上云