开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

修复Windows 7上的Unicode问题

是指解决在Windows 7操作系统中出现的Unicode字符显示或处理异常的情况。Unicode是一种用于表示世界上所有字符的标准编码系统，但在某些情况下，Windows 7可能无法正确地处理或显示Unicode字符，导致乱码或无法正常使用。

为了修复Windows 7上的Unicode问题，可以采取以下步骤：

更新操作系统：确保Windows 7操作系统已经安装了最新的补丁和更新。微软定期发布修复程序和更新，以解决操作系统中的各种问题，包括Unicode字符处理。
安装语言包：如果Unicode字符问题与特定语言相关，可以尝试安装相关的语言包。语言包可以提供更全面的字符支持，以确保Unicode字符能够正确显示和处理。
更新字体库：有时，Unicode字符无法正确显示是因为缺少相应的字体。通过更新字体库，可以获得更全面的字体支持，以确保Unicode字符能够正确地显示。
检查应用程序兼容性：某些应用程序可能不兼容Windows 7的Unicode字符处理机制，导致显示或处理异常。在这种情况下，可以尝试更新或替换应用程序，以解决Unicode问题。
腾讯云相关产品推荐：腾讯云提供了一系列云计算产品，可以帮助用户解决各种问题，包括Unicode字符处理。例如，腾讯云服务器（https://cloud.tencent.com/product/cvm）提供了稳定可靠的云服务器实例，用户可以在上面部署和运行Windows 7操作系统，并进行相关的修复工作。

需要注意的是，以上建议仅供参考，具体的修复方法可能因具体情况而异。在解决Unicode问题时，建议参考相关的技术文档、论坛或向专业人士寻求帮助，以确保问题能够得到有效解决。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Python2.7在Windows下CM

使用python2.7处理unicode的字符串，环境变量已设置PYTHONIOENCODING为utf-8，cmd编码为utf-8时print unicode字符串会报错[Errno 0]或[Errno 2]（python3.6环境下未出现此问题）

03

[PHP] PHP 7.4.4错误修复版本的更改日志

核心：修复了错误＃79329（一个空字节后get_headers（）默默地被截断）（CVE-2020-7066）修复了错误＃79244（PHP在解析INI文件时崩溃）的问题。修复了错误＃63206（restore_error_handler无法还原以前的错误掩码）。 COM：修复了错误＃66322（COMPersistHelper :: SaveToFile可以保存到错误的位置）。修复了错误＃79242（COM错误常量与x86上的com_exception代码不匹配）。修复了错误＃79247（垃圾收集变体对象段错误）。修复了错误＃79248（遍历空的VT_ARRAY会引发com_exception）。修复了错误＃79299（com_print_typeinfo打印重复的变量）。修复了错误＃79332（永远不会释放php_istreams）。修复了错误＃79333（com_print_typeinfo（）泄漏内存）。 CURL：修复了错误＃79019（复制的cURL处理上载空文件）。修复了错误＃79013（发布带有curl的curlFile时缺少Content-Length）。 DOM：修复了错误＃77569 ：（在DomImplementation中写入访问冲突）。修复了错误＃79271（DOMDocumentType :: $ childNodes为NULL）。 Enchant：修复了错误＃79311（在大端架构下，enchant_dict_suggest（）失败）。 EXIF：修复了错误＃79282（在exif中使用未初始化的值）（CVE-2020-7064）。 Fileinfo：修复了错误＃79283（libmagic补丁中的Segfault包含缓冲区溢出）。 FPM：修复了错误＃77653（显示运行者而不是实际的错误消息）。修复了错误＃79014（PHP-FPM和主要脚本未知）。 MBstring：修复了错误＃79371（mb_strtolower（UTF-32LE）：php_unicode_tolower_full处的堆栈缓冲区溢出）（CVE-2020-7065）。 MySQLi：修复了错误＃64032（mysqli报告了不同的client_version）。 MySQLnd：已实现FR＃79275（在Windows上支持auth_plugin_caching_sha2_password）。 Opcache：修复了错误＃79252（预加载会导致php-fpm在退出过程中出现段错误）。 PCRE：修复了错误＃79188（preg_replace / preg_replace_callback和unicode中的内存损坏）。修复了错误＃79241（preg_match（）上的分段错误）。修复了错误＃79257（重复的命名组（？J），即使不匹配，也更倾向于最后一种选择）。 PDO_ODBC：修复了错误＃79038（PDOStatement :: nextRowset（）泄漏列值）。反射：修复了错误＃79062（具有Heredoc默认值的属性对于getDocComment返回false）。 SQLite3：修复了bug＃79294（:: columnType（）在SQLite3Stmt :: reset（）之后可能失败。标准：修复了错误＃79254（没有参数的getenv（）未显示更改）。修复了错误＃79265（将fopen用于http请求时，主机标头注入不当）。压缩：修复了错误＃79315（ZipArchive :: addFile不支持开始/长度参数）。

01

xmake v2.2.8 发布, 新版vs工程生成插件

这个版本提供了全新的vs工程生成插件（非常感谢@OpportunityLiu的贡献），跟之前的生成vs的插件处理模式上有很大的不同，原先生成的vs工程是把所有源文件展开后，转交给vs来处理编译。

01

文本编辑器EmEditor v20.8.0附正版激活密钥

EmEditor是一款强大的 Windows 文本编辑器，支持宏、Unicode，还能处理大数据以及 CSV 文件，可应用于各类领域，包括网页设计、程序设计、编辑或出版、数据库管理、服务器管理等等。

03

ATMMalScan - DFIR搜索ATM上的恶意软件痕迹。

ATMMalScan是Windows 7和更高版本的Windows操作系统的命令行工具，有助于在DFIR流程中在ATM上搜索恶意软件跟踪。该工具根据指定的文件路径检查系统以及硬盘的运行过程。要扫描系统，具有标准权限的用户就足够了。但是，ATMMalScan具有管理员权限，可以提供最佳结果。

01

浅析Punycode钓鱼攻击

网络钓鱼（Phishing，与钓鱼的英语fishing发音相近，又名钓鱼法或钓鱼式攻击）是通过大量发送声称来自于银行或其他知名机构的欺骗性垃圾邮件，意图引诱收信人给出敏感信息（如用户名、口令、帐号ID 、 ATM PIN 码或信用card详细信息）的一种攻击方式。

02

为什么你现在必须迁移到Python 3？

2020年初，对Python 2的支持将停止。如果你没迁移到 Python 3，将面临各种风险，比如安全漏洞。幸好，从 Python 2 迁移到 Python 3 没那么难，本文会提供一些有用的建议。

03

VS Code 1.63 版本又带来哪些新特性？

Visual Studio Code 1.63 现已发布。Visual Studio Code 是一个开源的代码编辑器，支持 IntelliSense、调试、Git 和代码片断。可在 Windows、Linux 和 macOS 上下载使用。支持常见的脚本和编程语言，还可以通过安装扩展来获得更多语言和功能的支持。

02

【原创】IDA Unicode字符串自动解析注释插件3.0

直接上图，废话就不多说了，目前只有32位的插件，64位的插件编译存在一点点问题，希望能很快解决。

01

如何复制 OR 删除 200 万个小文件，而且电脑不卡？

Windows 系统，单个文件夹下根目录文件有超过 200w，如何快速复制到另外一个电脑上？

05

MySQL 8 新特性介绍

该文介绍了MySQL 8.0的新特性，包括对Unicode更好的支持、对JSON格式和文档的处理，以及一直以来呼吁增加的象window函数的功能等。

00

delphi android 音乐播放器,Mcool音乐播放器

Mcool音乐播放器APP是一款非常不错的手机音乐播放软件，用户可以使用该软件在线免费听大量好音乐，音质比较好，使用界面简洁明了，喜欢听音乐的朋友可以来西西下载Mcool音乐播放器APP使用！

04

Python90-3 bytes和str的区别

写在前面：我们一般用字符串(str)表示字符序列，但是还有另一种包含原始数据的字符序列，比特序列(bytes)，比特序列可能在网络传输和文件读写时用到。

02

2010年09月06日 Go生态洞察：Go语言荣获2010年度Bossie奖

猫头虎博主在此向所有Go语言开发者喵喵叫！🎉 Go语言在2010年荣获Bossie奖项，被评为“最佳开源应用开发软件”。今天，我们将聚焦于这一里程碑事件，深入探讨Go语言所获此殊荣的原因以及它如何改变现代编程。 Go语言，Bossie奖，开源项目，应用开发。

01

任系游戏高清化，Wii U 模拟器 Cemu 宣布开源！

前言 / 2022.8.26 Cemu 作为流行的任天堂 Wii U 模拟器之一，前段时间发布了 2.0 实验版本，并宣布其正式开源，还新增了对 Linux 系统的初步支持！ 01 Cemu 宣布正式开源！先来介绍介绍，Cemu 是一个 Wii U 模拟器，能在 PC 上高清且流畅地运行和呈现 Wii U 游戏，比如塞尔达传说：荒野之息、马里奥制造、异度之刃 X 等等。虽说它的强大是真的，但不幸的是，许多人会认为这是“假的”，因为在此之前，他一直是处于闭源状态。 Cemu 项目始于2017年，创作者在

02

Pip10已正式发布

我代表Python包管理局(Python Packaging Authority)，很高兴在此宣布：pip10刚刚正式发布了。这个版本是几个月以来社区工作的结晶。

00

讲解decode bytes in position 2-3: truncated \UXXXXXXXX escape

在 Python 开发中，我们经常会遇到各种异常和错误。本篇博客文章将重点讲解一个特定的错误：decode bytes in position 2-3: truncated \UXXXXXXXX escape。我们将解释这个错误的含义以及如何定位和解决它。

01

【漏洞通告】Windows 网络文件系统漏洞（CVE-2020-17051、CVE-2020-17056）

11月11日，绿盟科技监测到微软在11月月度补丁更新中修复了两个存在于Windows 网络文件系统（Network File System）中的漏洞，CVE-2020-17051为远程代码执行漏洞，CVE-2020-17056为信息泄露漏洞。

01

微软开源的命令行神器成Win 11默认工具,网友/是时候彻底弃用 cmd了

Windows 用户的命令行工具要换 “天” 了，用开发者的评论来说：这一天终于来了！

04

Python3和Go成最大赢家？一张主流编程语言变迁图讲清程序员迁移模式

导读：本文作者以自己作为程序员的角度出发，绘制了一个主流编程语言的变迁图，用以表示程序员在不同语言之间的切换路径。也就是当程序员开始使用编程语言 A，下一个最有可能切换过去的是哪一种编程语言。

03

讲解'utf-8' codec can't decode byte 0xb6 in position 34: invalid start byte

在编程过程中，我们经常会遇到各种编码和解码的问题。其中一个常见的错误是 'utf-8' codec can't decode byte 0xb6 in position 34: invalid start byte。这个错误表示在使用 utf-8 编码解码时，无法解码某个字节。

01

xftp5 中文破解版

xftp5破解版是一款基于MS windows平台上的使用灵活且功能强大的SFTP、FTP 文件传输软件，它可以在 UNIX/Linux 和 Windows PC 之间传输文件，使用起来非常的方便。同时它具有多窗格、支持FXP、直接编辑、文件夹同步、服务器到服务器传输、第三方编辑器集成等强大的功能，可以帮助用户更好的传输文件，节省时间和精力，从而提高用户的构造效率！软件学堂提供xftp5破解版下载，并在下文为大家附上安装破解教程，同时还有产品秘钥哦！

09

利用Winrm.vbs绕过白名单限制执行任意代码

winrm.vbs（一个位于system32目录下的具有Windows签名的脚本文件）可以被用来调用用户定义的XSL文件，从而导致任意的、没有签名的代码执行。当用户向winrm.vbs提供'-format:pretty'或者'-format:text'参数时，winrm.vbs将从cscript.exe所在目录读取WsmPty.xsl或Wsmtxt.xsl文件。这意味着若将cscript.exe拷贝到攻击者可以控制的目录下，并将恶意的XSL文件也置于相同路径中，攻击者将可以绕过签名保护而执行任意代码。这个攻击手段和Casey Smith的wmic.exe技术很相像。

04

老旧笔记本电脑安装体验WIN11精简版

上次在网上买的风扇到了后，动手拆卸老笔记本置换风扇，当时还购买了一些拆笔记本工具，如撬棍和散热硅胶。东西到全后开始动手。换完笔记本风扇组装好开机出现花屏，屏幕上出现不规律的彩色竖条纹，当时以为屏幕排线没有插好。维修判断故障要先从最简单地方入手。可是，当我排线拔下又重新插好后，开机故障依旧。考虑是不是换显卡硅胶时没有装好，只好重新拆机仔细查看一遍，都没发现异样，又重新组装上开机还是花屏。当时心情懊恼的无法描述。

02

一种几乎无法被检测到的Punycode钓鱼攻击，Chrome、Firefox和Opera等浏览器都中招

国内的安全专家最近发现一种新的钓鱼攻击，“几乎无法检测”，即便平时十分谨慎的用户也可能无法逃过欺骗。黑客可利用Chrome、Firefox和Opera浏览器中的已知漏洞，将虚假的域名伪装成苹果、谷歌或

09

【Windows编程】系列第四篇：使用Unicode编程

上一篇我们学习了Windows编程的文本及字体输出，在以上几篇的实例中也出现了一些带有“TEXT”的Windows宏定义，有朋友留言想了解一些ANSI和Unicode编程方面的内容，本章就来了解和学习一些Windows下关于ANSI和Unicode方面的编程基础。计算机最早在美国诞生，所以最开始都是以英语为作为交互语言，由于只有26个字母，用一个字节（范围-128 ~ 127）表示，这个范围足够表示26个因为字符和一些常用的控制字符，这个就是ASCII编码。因此最早的各种程序设计语言以及使用的字符串都用字

05

[Python零基础入门篇⓪②] - Pycharm 简介、安装与配置

PyCharm 是 Python 目前最著名使用者最多的集成开发环境 IDE 之一，是由大名鼎鼎的 JetBrains 公司开发，旗下还有像 Intellij IDEA 、 WebStorm 、PhpStorm 、Space 、Upsource等知名开发者工具、团队工具与代码审计工具。该公司旗下产品在功能布局及设置等方面一直都保持了很好的一致性，由此也获得了大量程序开发从业者的喜爱。

02

CA1838：不要对 P/Invoke 使用 StringBuilder 参数

StringBuilder 的封送处理总是会创建一个本机缓冲区副本，这导致一个 P/Invoke 调用出现多次分配。若要将 StringBuilder 作为 P/Invoke 参数进行封送，运行时将：

00

Go 1.18 发行说明（翻译）

美国时间 2022 年 3 月 15 日，Go 团队官宣 Go 1.18 正式发布。下面让我们一起了解下 Go 1.18 为我们带来的新特性吧。

01

17.9.15日报

1，修复flash退出时候crash的问题。原因不是很清楚，只知道在异步回调里调用destroywindow的时候，窗口函数的地址变成一个莫名其妙的0015ec74，

05

Unicode,GBK和UTF-8

看到题目,你也许会说,“又是这种月经帖,这问题我早弄清楚了”. 但如果有人问你,“Unicode,GBK和UTF-8有什么区别?”, 你能自信地给他一句简短清晰的回答吗? 如果不能的话, 那还是看一下

02

Python2.x的编码问题

好像写Python的人经常遇到这个问题,如果是一个新手,对网上的解答简直头都大了.如果又是Python2.x,简直了都(历史原因,不赘述) 但是,字符串编码是经常要面对的问题,不可不察.

01

Ubuntu 安装 Wine 4.4 并设置微软雅黑字体解决中文乱码

Wine 4.4是一个在Linux上运行Windows应用程序的开源兼容层的新开发版本，它是在近期发布的。

01

宝塔面板用frm和ibd文件恢复Mysql数据

写这篇文章我是非常不情愿的，我现在是在写这篇文章，但是同时我也在恢复我服务器数据库的数据，出这篇文章也是在我的意料之外，由于我正在这件事类，我就出一版这样的mysql.frm.ibd文件数据恢复教程，希望这次教程可以帮助到更多需要恢复的人，我现在是情绪暴涨。

04

MFC常用基本数据类型

ATOM 原子（原子表中的一个字符串的参考） BOOL 布尔变量 BOOLEAN 布尔变量 BYTE 字节（8位） CCHAR Windows字符 CHAR Windows字符 COLORREF 红、绿、蓝(RGB)彩色值(32位) Const 变量，该变量的值在执行期间保持为常量 CRITICAL_SECTION

06

【VC++】字符串详解&窗口&第一个windows程序

根本原因是程序使用了标准函数，而在你的机器上，没有这个标准函数对应的动态库实现，如果想要顺利运行则需要到官方网站下载对应版本的动态库安装即可

01

ANSI和ASCII、GBK和GB2312、Unicode和UTF-8的区别

NSI码（American National Standards Institute）

01

UNICODE,GBK,UTF-8区别

UNICODE,GBK,UTF-8区别简单来说，unicode，gbk和大五码就是编码的值，而utf-8,uft-16之类就是这个值的表现形式．而前面那三种编码是一兼容的，同一个汉字，那三个码值是完全不一样的．如＂汉＂的uncode值与gbk就是不一样的，假设uncode为a040，gbk为b030，而uft-8码，就是把那个值表现的形式．utf-8码完全只针对uncode来组织的，如果ＧＢＫ要转ＵＴＦ－８必须先转uncode码，再转utf-8就ＯＫ了．详细的就见下面转的这篇文章．谈谈Unicode编码，简要解释UCS、UTF、BMP、BOM等名词这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念，增进知识，类似于打RPG游戏的升级。整理这篇文章的动机是两个问题：问题一：使用Windows记事本的“另存为”，可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件，Windows是怎样识别编码方式的呢？我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节，分别是FF、FE（Unicode）,FE、FF（Unicode big endian）,EF、BB、BF（UTF-8）。但这些标记是基于什么标准呢？问题二：最近在网上看到一个ConvertUTF.c，实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF-8这些编码方式，我原来就了解。但这个程序让我有些糊涂，想不起来UTF-16和UCS2有什么关系。查了查相关资料，总算将这些问题弄清楚了，顺带也了解了一些Unicode的细节。写成一篇文章，送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂，但要求读者知道什么是字节，什么是十六进制。 0、big endian和little endian big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。如果将49写在前面，就是little endian。 “endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开，由此曾发生过六次叛乱，一个皇帝送了命，另一个丢了王位。我们一般将endian翻译成“字节序”，将big endian和little endian称作“大尾”和“小尾”。 1、字符编码、内码，顺带介绍汉字编码字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码，为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。 GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。 GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。从ASCII、GB2312到GBK，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK都属于双字节字符集 (DBCS)。 2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。从汉字字汇上说，GB18030在GB13000.1的20902个汉字的基础上增加了CJK扩展A的6582个汉字（Unicode码0x3400-0x4db5），一共收录了27484个汉字。 CJK就是中日韩的意思。Unicode为了节省码位，将中日韩三国语言中的文字统一编码。GB13000.1就是ISO/IEC 10646-1的中文版，相当于Unicode 1.1。 GB18030的编码采用单字节、双字节和4字节方案。其中单字节、双字节和GBK是完全兼容的。4字节编码的码位就是收录了CJK扩展A的6582个汉字。例如：UCS的0x3400在GB18030中的编码应该是8139EF30，UCS的0x3401在GB18030中的编码应该是8139EF31。微软提供了GB18030的升级包，但这个升级包只是提供了一

02

Windows 编程中的字符编码

经常在写代码的时候需要处理宽字符，ASCII 字符，在代码中看到 wchar、char 等等。一般都是处理一个方法的时候发现需要的是某字符串，然后这边有什么字符串，之后查一个转换方法。还有对于 Unicode 、ANSI 这些不太分得清，所以花了一点时间看了一看。做个小结。

04

【java基础之字符问题】UTF-8和GBK的区别与联系

1 字符集字符集就是编码的集合，例如unicode、GBK、GB2312等都属于字符集。

02

win7-字符集-乱码问题

我先了解下非unicode是什么意思，小编这里要写的时候系统的非unicode中文显示乱码怎么办？就是要更改非unicode的语言，那么哪里修改呢？大家一起来看下吧。

03

UNICODE,GBK,UTF-8

UNICODE,GBK,UTF-8 简单来说，unicode，gbk和大五码就是编码的值，而utf-8,uft-16之类就是这个值的表现形式．而前面那三种编码是一兼容的，同一个汉字，那三个码值是完全不一样的．如＂汉＂的uncode值与gbk就是不一样的，假设uncode为a040，gbk为b030，而uft-8码，就是把那个值表现的形式．utf-8码完全只针对uncode来组织的，如果ＧＢＫ要转ＵＴＦ－８必须先转uncode码，再转utf-8就ＯＫ了．详细的就见下面转的这篇文章．谈谈Unicode编码，简要解释UCS、UTF、BMP、BOM等名词这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念，增进知识，类似于打RPG游戏的升级。整理这篇文章的动机是两个问题：问题一：使用Windows记事本的“另存为”，可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件，Windows是怎样识别编码方式的呢？我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节，分别是FF、FE（Unicode）,FE、FF（Unicode big endian）,EF、BB、BF（UTF-8）。但这些标记是基于什么标准呢？问题二：最近在网上看到一个ConvertUTF.c，实现了UTF-32、UTF-16和UTF-8这三种编码方式的相互转换。对于Unicode(UCS2)、GBK、UTF-8这些编码方式，我原来就了解。但这个程序让我有些糊涂，想不起来UTF-16和UCS2有什么关系。查了查相关资料，总算将这些问题弄清楚了，顺带也了解了一些Unicode的细节。写成一篇文章，送给有过类似疑问的朋友。本文在写作时尽量做到通俗易懂，但要求读者知道什么是字节，什么是十六进制。 0、big endian和little endian big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。如果将49写在前面，就是little endian。 “endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开，由此曾发生过六次叛乱，一个皇帝送了命，另一个丢了王位。我们一般将endian翻译成“字节序”，将big endian和little endian称作“大尾”和“小尾”。 1、字符编码、内码，顺带介绍汉字编码字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码，为了处理汉字，程序员设计了用于简体中文的GB2312和用于繁体中文的big5。 GB2312(1980年)一共收录了7445个字符，包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7，低字节从A1-FE，占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。 GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。从ASCII、GB2312到GBK，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK都属于双字节字符集 (DBCS)。 2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。从汉字字汇上说，GB18030在GB13000.1的20902个汉字的基础上增加了CJK扩展A的6582个汉字（Unicode码0x3400-0x4db5），一共收录了27484个汉字。 CJK就是中日韩的意思。Unicode为了节省码位，将中日韩三国语言中的文字统一编码。GB13000.1就是ISO/IEC 10646-1的中文版，相当于Unicode 1.1。 GB18030的编码采用单字节、双字节和4字节方案。其中单字节、双字节和GBK是完全兼容的。4字节编码的码位就是收录了CJK扩展A的6582个汉字。例如：UCS的0x3400在GB18030中的编码应该是8139EF30，UCS的0x3401在GB18030中的编码应该是8139EF31。微软提供了GB18030的升级包，但这个升级包只是提供了一套支

02

通过 NT 符号链接重定向杀死 Defender，同时保持其不受打扰

使用管理员级别的权限并且无需与 GUI 交互，可以通过重定向 NT 符号链接来阻止 Defender 执行其工作，同时保持其活动状态，并且不会禁用篡改保护，该\Device\BootDevice链接是 NT 路径的一部分，从中加载 Defender 的 WdFilter 驱动程序二进制文件.这也可以用来使 Defender 加载任意驱动程序，没有工具可以成功定位，但它无法在重新启动后继续存在。执行此操作的代码位于 APTortellini 的 Github 存储库unDefender中。

08

Python Unicode编码

事实上，只要遵守以下规则，可以规避90%由于Unicode字符串处理引起的bug，剩下的10%通过python的库和模块能够解决。

01

Windows核心编程第二章,字符串的表示以及宽窄字符的转换

何为双字节字符集,在以前我们都是将文本字符串编码为一组以0结尾的单字符. 可以调用strlen进行判断结尾是否是0进而返回字符串的字符个数. 双字节字符集都是由1个或者2个字节组成.日本的汉子就是字符在0x81到0x9f 之间.或者在0xE0 - 0XFC之间,需要检查下一个字节才能判断是一个完整汉字对于我们来说,一会1个字节,一会两个字节很麻烦,所以除了UNICODE字符集.

02

Excelize 2.4.0 正式版发布, 新增 152 项公式函数支持

Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库，基于 ECMA-376，ISO/IEC 29500 国际标准。可以使用它来读取、写入由 Microsoft Excel™ 2007 及以上版本创建的电子表格文档。支持 XLSX / XLSM / XLTM 等多种文档格式，高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档，并提供流式读写 API，用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。入选 2020 Gopher China - Go 领域明星开源项目 (GSP)、 2018 开源中国码云 Gitee 最有价值开源项目 GVP，目前已成为 Go 语言最受欢迎的 Excel 文档基础库。

07

【编程基础】Win32平台数据类型总结

在Win32编程的时候，会常常遇到各种各样的字符（串）数据类型，比如CHAR、LPSTR、PCTSTR、LPTSTR等等，这些种类繁多，又很相似的数据类型怎么才能分清楚，他们跟C语言中的char又有什么关系呢？首先在C语言下的基本字符串类型是char，这个字符串类型与ANSI规定的是一样的。一个字节的低7位用于存放ASCII码，多个字符以空\0x00结尾即表示一个字符串。但是由于符号太多，根本不能用256字符来全部概括，所以出现多字节编码的方式，比如Unicode、UTF、BIG5等等。比如W

07

UTF8最好不要带BOM

摘自：http://www.cnblogs.com/findumars/p/3620078.html

06

开源是一种态度

对于开源我并没有什么太高深的理解，只是这两天的事情给我的一些启发而已。在这里简单的表述一下，首先要明确的第一件事情是开源不代表免费，也不代表你拥有代码的全部处置权。这里我不想对于对待的所有的权利进行说明，也不想讨论权利的问题。只是从开源代码的生命周期来看。

01

ansi unicode_ansi unicode utf-8

利用今天一天的时间，研究了一下ANSI编码和Unicode编码的不同，下面把我的研究成果写下来，以备日后参考。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭