首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

汉字内码简介及转换工具

汉字内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。...机内码汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。...汉字内码=汉字国标码+8080H 例如,上述“啊”字的国标码是3021H,其汉字内码则是B0A1H。 汉字内码的基础是汉字国标码。...这样既解决了汉字内码与西文机内码之间的二义性,又使汉字内码与国标码具有极简单的对应关系。...利用“汉字内码获取工具”可获得所有汉字的机内码,例如,“啊”字的汉字内码如图所示。 再利用“汉字内码获取工具”获取“我爱中国”几个字的汉字内码如图所示。

4.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

转载:从程序员的角度看ASCII, GB2312, UNICODE, UTF-8

我们可以制定一个内码表,指定一个内码对应一个汉字. (由于中文的字符非常多,所以一个字节是不够的,至少也要有2个字节存储一个内码.)...(2) 很多C语言的库函数是以内码0作为字符串结束标志的,为了兼容那些以前就已经编写好,并且运行良好的程序,我们指定的内码中不能含有值为0的字节.....对于 strlen("A汉字"), 由于strlen()是以内码为0作为边界的,而所有中文字符的GB2312内码高位都为1,不会出现0,并且每个汉字占用2个字节,所以 strlen 返回5....就是采用2个 - UCS-2 (或者4个字节 - UCS-4)字节标识一个字符. 2个字节总共可以表示65535个字符,足够表示世界上的所有语言的所有字符.(汉字不就有4万多个吗,65535怎么够....(WIndows自然知道你的编码是GB2312,因为你在Windows系统中设置的语言区域是中国, CodePage 936. 如果改成其它语言,就会显示为乱码.)

93930

UNICODE,GBK,UTF-8区别

1、字符编码、内码,顺带介绍汉字编码 字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。...微软提供了GB18030的升级包,但这个升级包只是提供了一套支持CJK扩展A的6582个汉字的新字体:新宋体-18030,并不改变内码。Windows 的内码仍然是GBK。...例如“汉”字的Unicode编码是6C49,而GB码是BABA。 Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。...2.1、内码和code page 目前Windows的内核已经支持Unicode字符集,这样在内核上可以支持全世界所有的语言文字。...内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的。现在的Windows在系统内部支持Unicode,然后用代码页适应各种语言,“内码”的概念就比较模糊了。

2.9K21

计算机高频知识点详解

3.汉字的机内码 汉字的机内码是供计算机系统内部进行存储、加工处理、传输统一使用的代码,又称为汉字内部码或汉字内码。不同的系统使用的汉字内码有可能不同。...目前使用最广泛的一种为两个字节的机内码,俗称变形的国标码。 4.汉字的输出码 汉字字形码是汉字字库中存储的汉字字形的数字化信息,用于汉字的显示和打印。...目前汉字字形的产生方式大多是数字式,即以点阵方式形成汉字。因此,汉字字形码主要是指汉字字形点阵的代码。...C类地址,C类地址原主机号为8位,从这8位里借位划分子网号。 借1位,用二进制表示,则只有0、1两种,而全0全1是不可用的。 借2位,则只有00、01、10、11四种,去掉全0全1则可划分2个子网。...优先选取使用频率最高的一些简单指令; 指令长度固定; 只有取数/存数指令(load/store)访问内存; CPU中的寄存器数量很多; 大部分指令在一个或小于一个机器周期完成; 硬布线控制逻辑为主,不用或少用微码控制; 一般用高级语言编程

51050

UNICODE,GBK,UTF-8

1、字符编码、内码,顺带介绍汉字编码 字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。...微软提供了GB18030的升级包,但这个升级包只是提供了一套支持CJK扩展A的6582个汉字的新字体:新宋体-18030,并不改变内码。Windows 的内码仍然是GBK。...例如“汉”字的Unicode编码是6C49,而GB码是BABA。 Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。...2.1、内码和code page 目前Windows的内核已经支持Unicode字符集,这样在内核上可以支持全世界所有的语言文字。...内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的。现在的Windows在系统内部支持Unicode,然后用代码页适应各种语言,“内码”的概念就比较模糊了。

2.6K20

C语言C加加编程新手基础入门,学习之嵌入式系统编程,修炼之屏幕操作

全文目录: C语言嵌入式系统编程修炼之道——背景篇 C语言嵌入式系统编程修炼之道——软件架构篇 1.模块划分 2.多任务还是单任务 3.单任务程序典型架构 4.中断服务程序 5.硬件驱动模块 6.C的面向对象化...总结 C语言嵌入式系统编程修炼之道——内存操作篇 1.数据指针 2.函数指针 3.数组vs.动态申请 4.关键字const 5.关键字volatile 6.CPU字长与存储器位宽不一致处理 总结 C语言嵌入式系统编程修炼之道...总结 C语言嵌入式系统编程修炼之道——性能优化篇 1.使用宏定义 2.使用寄存器变量 3.内嵌汇编 4.利用硬件特性 5.活用位操作 总结 汉字处理 现在要解决的问题是,嵌入式系统中经常要使用的并非是完整的汉字库...如果包括的汉字库较完整,那么,由内码计算出汉字字模在库中的偏移是十分简单的:汉字库是按照区位的顺序排列的,前一个字节为该汉字的区号,后一个字节为该字的位号。...,只需要从数组中查找内码与要求汉字内码相同的即可获得字模。

1.1K70

字符编码

英文ASCII字符采用一个字节的内码表示,中文字符如国标字符集中,GB2312、GB12345、GB13000皆用双字节内码,GB18030(27,533汉字)双字节内码汉字为20,902个,其余6,631...个汉字用四字节内码。...而EASCII虽然解决了部份西欧语言的显示问题,但对更多其他语言依然无能为力。因此现在的苹果电脑已经抛弃ASCII而转用Unicode。 最早的英文DOS操作系统的系统内码是:ASCII。...后来还是不够用,于是干脆不再要求低字节一定是127号之后的内码,只要第一个字节是大于127就固定表示这是一个汉字的开始,不管后面跟的是不是扩展字符集里的内容。...另一个更加严重的问题是,C语言使用'\0'作为字符串结尾,而Unicode里恰恰有很多字符都有一个字节为0,这样一来,C语言的字符串函数将无法正常处理Unicode,除非把世界上所有用C写的程序以及他们所用的函数库全部换掉

2.1K40

C语言嵌入式系统编程修炼之屏幕操作

全文目录: C语言嵌入式系统编程修炼之道——背景篇 C语言嵌入式系统编程修炼之道——软件架构篇 1.模块划分 2.多任务还是单任务 3.单任务程序典型架构 4.中断服务程序 5.硬件驱动模块 6.C的面向对象化...总结 C语言嵌入式系统编程修炼之道——内存操作篇 1.数据指针 2.函数指针 3.数组vs.动态申请 4.关键字const 5.关键字volatile 6.CPU字长与存储器位宽不一致处理 总结 C语言嵌入式系统编程修炼之道...——屏幕操作篇 1.汉字处理 2.系统时间显示 3.动画显示 4.菜单操作 5.模拟MessageBox函数 总结 C语言嵌入式系统编程修炼之道——键盘操作篇 1.处理功能键 2.处理数字键 3.整理用户输入...总结 C语言嵌入式系统编程修炼之道——性能优化篇 1.使用宏定义 2.使用寄存器变量 3.内嵌汇编 4.利用硬件特性 5.活用位操作 总结 汉字处理 现在要解决的问题是,嵌入式系统中经常要使用的并非是完整的汉字库...,只需要从数组中查找内码与要求汉字内码相同的即可获得字模。

1.2K80

刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系

简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系 GB2312、GBK、GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?...内码”。...GB2312区位码、国标码、内码对照表(其中汉字内码B0A1~F7FE,共6763个) 五、外码(输入码、输入法编码) 1....七、小结 可以这样理解,为在计算机内表示汉字而采取统一的编码方式所形成的汉字编码叫内码。为方便汉字输入而形成的汉字编码为外码,也叫输入码。...计算机通过键盘输入的外码(重码时还需附加选择编号)对应于汉字内码,将汉字外码转换(即映射)为汉字内码,以实现输入汉字的目的;通过汉字内码在字模库(即字库)中找出汉字的字形码,将汉字内码转换(即映射)为汉字字形码

1.8K10

mcu单片机开发_AVR单片机

对于复杂而开发时长紧的项目时,能够采用C语言,但前提是要求你对该MCU系统的C语言C编译器非常熟悉,特别要注意该C编译系统所能支持的数据类型和算法。...虽然C语言是最普遍的一种高级语言,但由于不同的MCU厂家其C语言编译系统是有所差别的,特别是在一些特殊功能模块的操作上。...为在计算机内表示汉字而统一的编码方式构成汉字编码叫内码(如国标码),内码是惟一的(相当于该字的身份证号)。...为显示和打印输出汉字而构成的汉字编码为字形码,计算机通过汉字内码在字模库中找出汉字的字形码,实现其转换。...,一个点阵序列,以前的点阵库是按内码顺序放的,不须要内码索引的,假如只放局部汉字,就须要内码索引了。

81120

Unicode编码

例如“汉”字的Unicode编码是6C49。那么写到文件里时,究竟是将6C写在前面,还是将49写在前面?如果将6C写在前面,就是big endian。...1、字符编码、内码,顺带介绍汉字编码   字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。...GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。...GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。...例如“汉”字的Unicode编码是6C49,而GB码是BABA。   Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。

1.3K10

精述字符编码

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的首字母,英文名称:Chinese Internal Code Specification)。...例如“汉”字的Unicode编码是U+6C49。那么写到文件里时,究竟是将6C写在前面,还是将49写在前面?如果将6C写在前面,就是Big Endian。...而之后的两字节用UTF8解码之后是U+0368,查看Unicode字符表发现为字符COMBINING LATIN SMALL LETTER C,显示为极小的字母c。...内码是指操作系统内部的字符编码,内码其实就是字符编码。之所以称之为内码,是因为有外码这种东西。汉字输入码(外码)是指用户从键盘上键入汉字时所使用的汉字编码,计算机内部存储的就是汉字内码。...早期操作系统的内码是与语言相关的,现在的Windows在内部统一使用Unicode,然后用代码页适应各种语言,”内码”的概念就比较模糊了。我们一般将缺省代码页指定的编码说成是内码

1.3K32

万字长文讲解编码知识,看这文就够了!

后来还是不够用,于是干脆不再要求低字节一定是127号之后的内码,只要第一个字节是大于127就固定表示这是一个汉字的开始,不管后面跟的是不是扩展字符集里的内容。...例:“汉”的UCS-2编码为6C49。...UCS-2只能编码“基本多语言平面”中的字符,此时UTF-16与UCS-2的编码一样(都直接使用Unicode的码位作为编码值),例:“汉”在Unicode中的码位为6C49,而在UTF-16编码也为6C49...ANSI编码 为使计算机支持更多语言,通常使用0x800~xFF范围的2个字节来表示1个字符。比如:汉字‘中’ 在中文操作系统中,使用 [0xD6,0xD0]这两个字节存储。...许多编程语言也采用Unicode为内码,如Java、Python3。 外码:除了内码,皆是外码。

1.1K30
领券