首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ANSI, UNICODE,UTF8编码的区别

中文的网页和操作系统中通常采用ANSI编码,这也是微软OS的一个字符标准。...具体区别: ANSI:16384个字符。这就是ANSI字符标准。...使用两个字节对世界上几乎所有的语言进行编码(0x0000-0xFFFF),65536个字符,每种语言的代码段不 同,两个字节(英文、中文都是两个字节)所表达的字符是唯一的,所以不同语种可以共存于文本中,解决国际化的问题 UTF8...是Unicode一种压缩形式,英文A在unicode中表示为0x0041,老外觉得这种存储方式太浪费,因为浪费了50%的空间,于是就把英文压缩成1个字节,成了utf8编码,但是汉字在utf8中占3个字节...,显然用做中文不如 ansi合算,这就是中国的网页用作ansi编码而老外的网页常用utf8的原因。

2.1K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Linux GNU C 和 ANSI C 的区别

    Linux 上可用的 C 编译器是 GNU C 编译器,它建立在自由软件基金会的编程许可证的基础上,因此可以自由发布。GNU C对标准C进行一系列扩展,以增强标准C的功能。...C99已经支持__func__宏,因此建议在Linux编程中不再使用__FUNCTION__,而转而使用__func__: void example(void) { printf("This...IN_DEV_ROUTE_LOCALNET(in_dev))) if (ipv4_is_loopback(saddr)) goto e_inval; 在使用gcc编译C程序的时候,如果使用“-ansi–pedantic...var_data { int len; char data[0]; }; struct var_data a; 直接编译可以通过: gcc -c test.c 如果使用“-ansi–pedantic...”编译选项,编译会报警: gcc -ansi -pedantic -c test.c test.c:3: warning: ISO C forbids zero-size array 'data'

    5.3K40

    ansi unicode_ansi unicode utf-8

    ANSI编码最常见的应用就是在Windows当中的记事本程序中,当新建一个记事本,默认的保存编码格式就是ANSIANSI应该算是一种压缩编码了,当遇到标准的ASCII字符时,采用单字节表示,当遇到非标准的...但是通过分析得知,在文本存储的时候并不是仅存了一个“回车”,还存了一个“换行”,而且是先存储的“回车”后存储的“换行”(见ASCII码表:0D->回车;0A->换行),这与Linux/Unix中的换行方式不同...,在Linux/Unix中仅用一个0D(回车)就可以令文本换行。...如果将一个在Linux/Unix中编写的文本文档直接拷贝到Windows中打开(最简单的可以在Windows下查看百度首页的源代码),就会看到这些文字几乎都是连着的,没有换行,那是因为在该文档中并没有显式地存储...0A(换行符),虽然这篇文章在Linux/Unix中看起来很正常。

    1.2K20

    ANSI是什么?

    ANSI是一种字符代码,为使计算机支持更多语言,通常使用 0x00~0x7f(即0000 0000~0111 1111)范围的1 个字节来表示1个英文字符。...ANSI编码 为使计算机支持更多语言,通常使用 0x80~0xFFFF 范围的 2 个字节来表示1个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。...这些使用多个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。...在简体中文Windows操作系统中,ANSI 编码代表 GBK 编码; 在繁体中文Windows操作系统中,ANSI编码代表Big5; 在日文Windows操作系统中,ANSI 编码代表 Shift_JIS...不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。 ANSI编码表示英文字符时用一个字节,表示中文用两个或四个字节。

    1.8K20

    ansi编码转换器安卓版_ansi编码批量转换器

    这是ansi编码批量转换器,是一款转换器支持多种文字编码格式的软件。 软件简介 ansi编码批量转换器是款转换器支持多种文字编码格式的软件。...软件功能 本工具能把字符串(包括汉字)转换成10进制或16进制的ANSI码,以空格分开,另外能把上述格式的10进制或16进制的ANSI码转换成字符串(包括汉字)。...3.自己归纳的ANSI字符存放规律: 0x21~0x80:普通字符。 0x8140~0xA0FE:不常用中文。...4.在以ANSI为编码的程序中,按住Alt键再按下小键盘上对应的十进制ANSI码,输入完毕后放开Alt,该字符就会出现了。(如果仍然没反应,请先打开中文输入法再执行此操作。)...5.windows记事本(.txt文件)、广大论坛、和QQ里都默认以ANSI码输入,即可按上述方法用Alt输入字符。例如:在论坛的回复里按住Alt再输入43337,就会出现一个特殊字符。

    1.9K20

    ASCII、 Unicode 和 UTF8

    由此也可看出,当待保存文本为纯英文字母时, 采用Unicode的存储效率太低了 UTF8便是为了解决Unicode存储效率低下而产生的。具体的规则就不讲了,先来看一下UTF8能够达到的效果。...对于相同的文本:'abcd',Unicode需要12个字节,而UTF8只需要4个字节(和ASCII一样,达到最优)。 UTF8之所以可以用一个字节存储英文字母,是因此它使用了变长的编码方式。...所以UTF8对于存储英文字母的高效率来源于对之后字符保存效率的牺牲。这里的合理性在于:如果待保存的文本中字符大多数为英文字母,则存储效率能够提高,因为大多数字符都是采用一个字节保存。...总结来说, UTF8是对Unicode在存储效率上的优化 以上便是三者的关系。...Unicode存在存储效率低下的问题,UTF8是在这个方面对Unicode的优化。

    1.3K20

    UTF8变长编码

    UTF8变长编码可以解决。有的文字是1个字节存储的,有的文字是2个字节存储的,还有3个字节存储的,还有4个字节存储的。 最后集合起来就是一共有一到四字节四种变长的编码。...还有一点要说明,就是一个UTF8格式的文件,它要表明它的身份,以让人用UTF8的读法来读它。...可能我们仔细的看一下这个文件的内容,看一下字节出现个格式,和我们上面所说的是否一样,也就知道它是不是UTF8编码了。...不过还有一种保险一点的方法,就是在文件的最开头加上三个字节的信息,这三个字节比较少见,所以一见到它们三个开头,我们就知道是UTF8格式的文件了,使用这种方式可以让我们快速判断出来文件是不是UTF8格式的...,有助于提高性能,不过这不是必须的,我们没有这三个字节也可以判断文件的格式是不是UTF8编码方式。

    2.9K20

    【C语言笔记】什么是ANSI C标准?

    什么是ANSI C、ISO C、C89、C90标准? 随着C语言使用得越来越广泛,出现了许多新问题,人们日益强烈地要求对C语言进行标准化。...1983年,美国国家标准协会(ANSI)组成了一个委员会,X3J11,为了创立 C 的一套标准。...经过漫长而艰苦的过程,该标准于1989年完成,这个版本的语言经常被称作ANSI C,或有时称为C89(为了区别C99)。...在1990年,ANSI C标准(带有一些小改动)被美国国家标准协会(ANSI)采纳为ISO/IEC 9899:1990。这个版本有时候称为C90或者ISO C。...综上,ANSI C、ISO C、C89、C90其实是同一种标准。 什么是C99标准? 2000年3月,ANSI采纳了 ISO/IEC 9899:1999 标准。这个标准通常指C99。

    2.8K30
    领券