专栏首页Jerry的SAP技术分享an example of Ascii using 问号 as example

an example of Ascii using 问号 as example

版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 (Creative Commons

Created by Wang, Jerry on Sep 25, 2015

根据Ascii表,问号的code为63:

若记事本里只存储了一个问号字符:

3F的十进制正好是63:

若改为big5:

内容不变。

UTF-8 - 不变。

多字节的Unicode编码方式定义了一个"字节顺序标记(Byte Order Mark)",它是一个特殊的非打印字符,你可以把它包含在文档的开头来指示你所使用的字节顺序。对于UTF-16,字节顺序标记是U+FEFF。如果收到一个以字节FF FE开头的UTF-16编码的文档,你就能确定它的字节顺序是单向的(one way)的了;如果它以FE FF开头,则可以确定字节顺序反向了。

如果记事本里存成

在ABAP debugger 3F00: ( UTF-16)

UTF-8使用一至四个字节为每个字符编码:

  1. 128个US-ASCII字符只需一个字节编码(Unicode范围由U+0000至U+007F)。
  2. 带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要二个字节编码(Unicode范围由U+0080至U+07FF)。
  3. 其他基本多文种平面(BMP)中的字符(这包含了大部分常用字)使用三个字节编码。
  4. 其他极少使用的Unicode辅助平面的字符使用四字节编码。 这解释了为什么? ( 63) 在UTF8 编码格式下仍然是3F的原因。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • SAP ABAP老司机平时是怎么做代码审查的

    In line 27:strange callstack.Why from API layer directly to local class level? ...

    Jerry Wang
  • SAP Commerce(原Hybris)的一些架构图,持续更新

    Jerry Wang
  • Java里使用volatile进行线程同步的一个例子

    The working thread is started to do increment on i and after one second, the fla...

    Jerry Wang
  • 计算机编码基础

         乱码是我们在日常的工作中经常遇到的问题,你可能从网上好不容易下载了一个炫酷的jQuery插件,但是却在打开的时候,发现某几个js文件都是类似“澶у0?...

    Single
  • 刨根究底字符编码之九——字符编码方案的演变与字节序

    前文已经提及,编号字符集CCS(简称字符集)与字符编码方式CEF(简称编码方式)这两个概念,在早期并没有必要严格区分。

    用户1876609
  • 字节序转换详解

    在跨平台和网络编程中我们经常会提到网络字节序和主机字节序,如果没有正确对两者进行转换,从而导致两方产生了不同的解释,就会出现意想不到的bug。

    信安本原
  • 脑残式网络编程入门(九):面试必考,史上最通俗大小端字节序详解

    最近在从头重写 MobileIMSDK 的TCP版,自已组织TCP数据帧时就遇到了字节序大小端问题。所以,借这个机会单独整理了这篇文章,希望能加深大家对字节序问...

    JackJiang
  • 一文读懂 DEX 文件格式解析

    我想说的是写个解析脚本不是为了模仿着 apktools 造轮子,而是在解析过程中寻找逆向的道路,方法会变,工具会变,但一切都建立在 dex 上的安卓不会变

    信安之路
  • 字符与字节有什么区别呢?

    1、计算机存储信息的最小单位,称之为位(bit),音译为比特,二进制的一个“0”或一个“1”叫一位。 2、计算机存储容量基本单位是字节(Byte),音译为拜特...

    黑泽君
  • 刨根究底字符编码之十二——UTF-8究竟是怎么编码的

    UTF-8编码是Unicode字符集的一种编码方式(CEF),其特点是使用变长字节数(即变长码元序列、变宽码元序列)来编码。一般是1到4个字节,当然,也可以更长...

    用户1876609

扫码关注云+社区

领取腾讯云代金券