首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

C语言/C加加程序员编程学习之unicode编码与ansi编码

C语言是面向过程的,而C++是面向对象的

C和C++的区别:

C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得到输出(或实现过程(事务)控制)。

C++,首要考虑的是如何构造一个对象模型,让这个模型能够契合与之对应的问题域,这样就可以通过获取对象的状态信息得到输出或实现过程(事务)控制。 所以C与C++的最大区别在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进,是因为“ 设计这个概念已经被融入到C++之中 ”。

C与C++的最大区别:在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进,是因为“ 设计这个概念已经被融入到C++之中 ”,而就语言本身而言,在C中更多的是算法的概念。那么是不是C就不重要了,错!算法是程序设计的基础,好的设计如果没有好的算法,一样不行。而且,“C加上好的设计”也能写出非常好的东西。

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

在学习字符串时一定会碰到CString的字符串要转换为char*的问题,在此总结一下unicode工程下的字符串处理问题。

Ansi与Unicode简要说明及各自的优缺点。

他们是两种字符的编码格式,Ansi表示窄字节,Unicode表示宽字节,Ansi用char格式表示一个字符,占用一个字节的存储空间,最多表示255个字符,表示英文还可以,但对于中文、日文、韩文等语言来说就不够用了,所以如果你的程序是Ansi编码的话,那么你写的中文语言的程序拿到日文、韩文等系统上面就会出现乱码。所以有了Unicode,用二个字节去表示一个字符,格式是 unsigned short,被定义成 wchar_t 格式这样就可以表示世界上绝大多数的语言了!但有利就有弊,缺点呢?就是空间占用翻倍了,网络传输的数据量也增大了。

Windows 2000 及其以后的 Xp、2003、Vista、Win7 等系统都是使用Unicode从头进行开发的,如果调用任何一个Windows API 函数并给它传递一个 ANSI 字符串,那么系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。为了避免系统转换消耗的资源通常都使用unicode。

不同编码格式下的字符串处理及相互转化。

在编程时经常遇到的数据类型:

Ansi:

char、char * 、const char *

CHAR、(PCHAR、PSTR、LPSTR)、LPCSTR

Unicode:

wchar_t、wchar_t * 、const wchar_t *

WCHAR、(PWCHAR、PWSTR、LPWSTR)、LPCWSTR

T 通用类型:

TCHAR、(TCHAR * 、PTCHAR、PTSTR、LPTSTR)、LPCTSTR

以上,其中:P代表指针的意思,STR代表字符串的意思,L是长指针的意思,在WIN32平台下可以忽略,C代表const常量的意思,W代表wide宽字节的意思,T表示模板,也就是通用的意思,在使用时系统会根据当前的工程性质进行转换。例如在unicode下,TCHAR其实就是wchar_t,否则就被定义成char。

字符串类型的对象的定义:

Ansi:char *pAnsiStr = "hello";

Unicode:wchar_t *pUnicodeStr = "hello";

通用类型:TCHAR *pTStr = _T("hello"); 或者 TCHAR *pTStr = _TEXT("hello");(_T,_TEXT是一个意思)

动态申请内存:TCHAR *pszBuf = new TCHAR[100];

Ansi 与 Unicode 字符串类型的互相转换:

上面给大家介绍的都是窄字节就是窄字节,宽字节就是宽字节,那么下面就给大家介绍下他们两个之间的转换。

在程序中还是不建议大家来回来去的进行字符串编码的转换,要么就都使用Ansi,要么就都使用Unicode,

但是呢,往往有些 API 函数只提供了窄字节版本(比如:GetProcAddress,见MSDN)或者只提供宽字节版本(比如:CommandLineToArgvW,见MSDN),

这个时候就要进行字符串编码格式的转换了。

但是,这里提醒下大家,不是所有的都需要转换,有一些是不需要转换的,比如 socket 中的 send 或者 recv 函数.

字符串占用字节数:

Ansi:

char szStr[] = "abc";

占用字节数求法:sizeof(szStr);

char *psz = "defgh";

占用字节数求法:strlen(psz)*sizeof(char);

Unicode:

wchar_t szwStr[] = L"abc";

占用字节数求法:sizeof(szwStr);

wchar_t *pwsz = L"defgh";

占用字节数求法:wcslen(pwsz)*sizeof(wchar_t);

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

通用函数:

TCHAR szStr[] = _T("abc");

占用字节数求法:sizeof(szStr);

TCHAR *psz = _T("defgh");

占用字节数求法:_tcslen(psz)*sizeof(TCHAR);

转换用到的最根本的 API 函数:

WideCharToMultiByte 实现宽字节转换到窄字节

MultiByteToWideChar 实现窄字节转换到宽字节

A2W、W2A、T2A、T2W 宏的使用以及注意事项:

其实这些宏根本上还是用到了上面的两个函数。

[1]、这些函数都是在栈中分配空间的。例如:A2W("abc"),就会在栈中分配一块内存存放'abc'

[2]使用上面的宏之前都要使用USES_CONVERSION宏

*unicode下CString与char*的转换:

CString转换为char*:使用wcstombs()函数

例子:

CString str;

str="你好,hello";

char ch[50];

wcstombs(ch,str,siezof(ch));

这样的转换会出现问题,原因是str带有中文,如果带有中文还在之前使用setlocale(LC_ALL,""),要包含头文件;设置一下默认语言。

char*转换为CString:使用A2T()函数:

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

例子:

USES_CONVERSION;

char ch[5]="what";

CString str;

str=A2T(ch);

~~~end~~~

这些是C/C++能做的

服务器开发工程师、人工智能、云计算工程师、信息安全(黑客反黑客)、大数据 、数据平台、嵌入式工程师、流媒体服务器、数据控解、图像处理、音频视频开发工程师、游戏服务器、分布式系统、游戏辅助等

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180406A0O2PC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券