wchar_t*,wchar_t,wchat_t数组,char,char*,char数组,std::string,std::wstring,CString 以及system("command")

关于wchar_t

在C++标准中,wchar_t是宽字符类型,每个wchar_t类型占2个字节,16位宽。汉字的表示就要用到wchar_t 。char,我们都知道,占一个字节,8位宽。

标准C++中的wprintf()函数以及iostream类库中的类和对象能提供wchar_t宽字符类型的相关操作。

locale loc( "chs" );//定义“区域设置”为中文方式 wcout.imbue( loc );//载入中文字符输入方式 wchar_t str[]=L"中国";//定义宽字符数组,注意L是大写 wcout<<str<<endl;//显示宽字符数组,下同 wprintf(str);

system("pause");

wchar_t 转换为char 的代码如下:

有如下的wchar_t和char变量

wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;

char *C2W(wchar_t w_cn , char c_cn[2])

{

//following code convert wchar to char c_cn[0] = w_cn >> 8 ; c_cn[1] = w_cn ; c_cn[2] = '\0';

return c_cn ;

}

其中需要注意的是一个16位的wchar_t需要用两个8位的char来存储之。我们可以发现另外一个问题,wchar_t的高位字节应该存储在char数组的低位字节。

wchar_t *类型 转为char *类型

 CString strName("listen");  char *pcstr = (char *)new char[2 * strName.GetLength()+1] ;

 WideCharToMultiByte(   CP_ACP,     0,     strName,     //   要转换的wchar_t*     -1,     pcstr,   //   接收char*的缓冲区指针     2 * strName.GetLength()+1,         //   pcstr的缓冲区的大小     NULL,     NULL   );

关于system("command")

system("command")是执行一个dos命令。system("pause")就是执行Dos命令pause,等待用户输入。 system("pause") 与getchar()区别

system("pause") 是调用WINDOWS CONSOLE APP下的命令 PAUSE的。 system("const char*")就是调用WINDOWS CONSOLE APP下的命令。 比如system("exit"); system("ping 192.168.0.1")等等

而getchar()只是C标准库里等待一个字符的函数,两者区别很大。

/*---------------------------------------------------*/ 如何使system("pause") 不弹出“按任意键继续”这几个字呢? 用system("pause>nul")  就可以了

wchar_t*,wchar_t,wchat_t数组,char,char*,char数组,std::string,std::wstring,CString

#include <string> // 使用CString必须使用MFC,并且不可包含<windows.h> #define _AFXDLL #include <afx.h> using namespace std; //---------------------------------------------------------------------------------- //将 单字节char* 转换为 宽字节 wchar* inline wchar_t* AnsiToUnicode( const char* szStr ) { int nLen = MultiByteToWideChar( CP_ACP, MB_PRECOMPOSED, szStr, -1, NULL, 0 ); if (nLen == 0) {    return NULL; } wchar_t* pResult = new wchar_t[nLen]; MultiByteToWideChar( CP_ACP, MB_PRECOMPOSED, szStr, -1, pResult, nLen ); return pResult; } //---------------------------------------------------------------------------------- // 将 宽字节wchar_t* 转换 单字节char* inline char* UnicodeToAnsi( const wchar_t* szStr ) { int nLen = WideCharToMultiByte( CP_ACP, 0, szStr, -1, NULL, 0, NULL, NULL ); if (nLen == 0) {    return NULL; } char* pResult = new char[nLen]; WideCharToMultiByte( CP_ACP, 0, szStr, -1, pResult, nLen, NULL, NULL ); return pResult; } //---------------------------------------------------------------------------------- // 将单字符 string 转换为宽字符 wstring inline void Ascii2WideString( const std::string& szStr, std::wstring& wszStr ) { int nLength = MultiByteToWideChar( CP_ACP, 0, szStr.c_str(), -1, NULL, NULL ); wszStr.resize(nLength); LPWSTR lpwszStr = new wchar_t[nLength]; MultiByteToWideChar( CP_ACP, 0, szStr.c_str(), -1, lpwszStr, nLength ); wszStr = lpwszStr; delete [] lpwszStr; } //---------------------------------------------------------------------------------- int _tmain(int argc, _TCHAR* argv[]) { char*   pChar = "我喜欢char"; wchar_t* pWideChar = L"我讨厌wchar_t"; wchar_t   tagWideCharList[100] ; char   ch = 'A'; char   tagChar[100] = {NULL}; CString   cStr; std::string str;

// 注:设置语言环境以便输出WideChar setlocale(LC_ALL,"chs");

// 注: char* 转换 wchar_t* // 注: wchar_t 未重载 << ,所以不可使用 cout << 输出 pWideChar = AnsiToUnicode( pChar ); // 注:printf("%ls") 和 wprintf(L"%s") 一致 printf( "%ls\n", pWideChar );

// 注:wchar_t* 转换 wchar_t[] wcscpy ( tagWideCharList, pWideChar ); wprintf( L"%s\n", tagWideCharList );

// 注:wchar_t[] 转换 wchar_t* pWideChar = tagWideCharList; wprintf( L"%s\n", pWideChar );

// 注:char 转换 string str.insert( str.begin(), ch ); cout << str << endl;

// 注:wchar_t* 转换 string pWideChar = new wchar_t[str.length()]; swprintf( pWideChar, L"%s", str.c_str()); wprintf( L"%s\n", pWideChar );

// 注:string 转换 char* pChar = const_cast<char*>(str.c_str()); cout << pChar << endl;

// 注:char* 转换 string str = std::string(pChar); // 注: cout 的 << 重载了string, 若printf 的话必须 printf("%s", str.c_str()); //   而不可 print( "%s", str ); 因为 str 是个 string 类 cout << str << endl;

// 注:string 转换 char[] str = "无聊啊无聊"; strcpy( tagChar, str.c_str() ); printf( "%s\n", tagChar );

// 注:string 转换 CString; cStr = str.c_str();

// 注:CString 转换 string str = string(cStr.GetBuffer(cStr.GetLength()));

// 注:char* 转换 CString cStr = pChar;

// 注:CString 转换 char* pChar = cStr.GetBuffer( cStr.GetLength() );

// 注:CString 转换 char[] strncpy( tagChar, (LPCTSTR)CString, sizeof(tagChar));

// 注:CString 转换 wchar_t* pWideChar = cStr.AllocSysString(); printf( "%ls\n", pWideChar ); }

WideCharToMultiByte()函数

  函数功能:该函数映射一个unicode字符串到一个多字节字符串。

  函数原型:int WideCharToMultiByte(UINT CodePage, DWORD dwFlags, LPWSTR lpWideCharStr, int cchWideChar, LPCSTR lpMultiByteStr, int cchMultiByte, LPCSTR lpDefaultChar, PBOOL pfUsedDefaultChar );

  参数:

  CodePage:指定执行转换的代码页,这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的任意一值:

  CP_ACP:ANSI代码页;CP_MACCP:Macintosh代码页;CP_OEMCP:OEM代码页;

  CP_SYMBOL:符号代码页(42);CP_THREAD_ACP:当前线索ANSI代码页;

  CP_UTF7:使用UTF-7转换;CP_UTF8:使用UTF-8转换。

  dwFlags:一组位标记用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:

  MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与

  MB_COMPOSITE值一起使用。

  MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。这是缺省的转换选择。不能与MB_PRECOMPOSED值一起使用。

  MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。

  MB_USEGLYPHCHARS:使用象形文字替代控制字符。

  组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。

  函数的缺省动作是转换成预作的形式。如果预作的形式不存在,函数将尝试转换成组合形式。

  标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。

  lpWideCharStr:指向将被转换的unicode字符串。

  cchWideChar:指定由参数lpWideCharStr指向的缓冲区的字符个数。如果这个值为-1,字符串将被设定为以NULL为结束符的字符串,并且自动计算长度。

  lpMultiByteStr:指向接收被转换字符串的缓冲区。

  cchMultiByte:指定由参数lpMultiByteStr指向的缓冲区最大值(用字节来计量)。若此值为零,函数返回lpMultiByteStr指向的目标缓冲区所必需的字节数,在这种情况下,lpMultiByteStr参数通常为NULL。

  lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。

  返回值:如果函数运行成功,并且cchMultiByte不为零,返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数;如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所必需的字节数。如果函数运行失败,返回值为零。若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:

  ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;

  ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。

  注意:指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样,函数将失败,GetLastError将返回ERROR_INVALID_PARAMETER的值。

ANSI和UNICODE编码

二者都是字符代码的一种表示形式

ANSI编码用0x88~0xFF范围的2个字节来表示1个字符。

Unicode编码是国际组织指定的可以容纳世界上所有文字和服的字符的字符编码方案。用数字0~0x10FFFF来映射这些字符。

我的理解:说白了,ANSI编码是单字节,Unicode编码是宽字符。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏mukekeheart的iOS之旅

No.008 String to Integer (atoi)

8. String to Integer (atoi) Total Accepted: 112863 Total Submissions: 825433 Dif...

2277
来自专栏Code_iOS

Objective-c 知识总结 -- @property

@property 只是一个编译器指令,意思是告诉编译器要干嘛,当然它的意思就是要求 Xcode 做属性声明了。

692
来自专栏noteless

[四] java8 函数式编程 收集器浅析 收集器Collector常用方法 运行原理 内部实现

收集器是由四个函数约定构成,它们一起工作,将条目汇集到一个可变的结果容器中,并可选择性地对结果执行最终转换。

902
来自专栏菜鸟前端工程师

JavaScript学习笔记008-this0arguments0箭头函数

741
来自专栏逆向技术

16位汇编第八讲指令第四讲

        16位汇编第八讲指令第四讲 一丶串操作类指令 1.什么是串操作?   1.串操作指令是8086指令系统中比较独特的一类指令,采用比较特殊的数据串...

1846
来自专栏iOS 开发杂谈

浅谈 AutoreleasePool 的实现原理

在 MRC 的环境下,可以通过调用 [obj autorelease] 将对象添加到当前的 autoreleasepool 中,来延迟释放内存;

512
来自专栏Java编程

Java反射机制详解

动态语言,是指程序在运行时可以改变其结构:新的函数可以被引进,已有的函数可以被删除等在结构上的变化。比如众所周知的ECMAScript(JavaScript)便...

5881
来自专栏Android开发指南

16.IO之其他流

34614
来自专栏Ryan Miao

java枚举类型学习

用的不多,但用的时候仅仅简单的使用,不太明白原理,今天就系统的学一下枚举。参考:java编程思想。 Update: 枚举可以当做数据字典来存储,通常只要一个字段...

2959
来自专栏恰同学骚年

C#基础与常用数据结构学习笔记

  接口相当于没有方法实现的抽象类,接口方法不要加各种访问级别:例如public,private等。

813

扫码关注云+社区