CString 在_UNICODE宏定义下和普通ASCII编码下的不同

CString在普通ASCII编码情况下,系统默认是跟char*差不多的方式来存储(个人觉得)。

例如,声明和赋值一个CString可以这样:

char* charStr = "Kenko";

CString cstr =  charStr;

因为在ASCII编码下,CString会把后边这个指针的内存位置,作为输入流,逐个字符的读入到CString中。

但在_UNICODE宏定义下,默认都变为宽字节。那么CString存储方式将以宽字节的形式。

所以此时要CString变为wchar_t*只要如下:

CString变wchar*: wchar_t unicodeStr[255]; wcscpy(unicodeStr, cstr);

这时要赋值给CString,就注意一定要以宽字节的形式赋值(当然直接用char*赋值给CString,系统会自动转化)。

但例如截取网页之类的,输入的字节流还是ASCII,所以会出现问题。

我在编程过程中,就以ASCII编码字节流赋值,导致在后续查找字符串的时候总是找不到。后边找到问题根源后,就把从CString得到的wchar_t*强制转化为char*。具体问题根源在代码注释中有写。

代码如下,是关于用CInternetSession,截取网页内容的。

 1     //建立连接,发送请求,接收数据
 2      CInternetSession httpsession;
 3     CString Line;
 4     CString result;
 5     
 6     CInternetFile* webfile=NULL;
 7     
 8     if(url==NULL) return false;
 9     try
10     {
11         wchar_t unicodeStr[255];
12         wcscpy(unicodeStr, CComBSTR(url));
13         webfile=(CInternetFile*)httpsession.OpenURL(unicodeStr);
14         if(webfile)
15         {
16             int i=0;
17             while(webfile->ReadString(Line)&&i<300)
18             {
19                 result=result+Line;
20                 i++;
21             }
22         }
23         delete webfile;
24         httpsession.Close();
25         wchar_t unicodeStr2[3000];
26         wcscpy(unicodeStr2, result);
27         /*因为CString在读取网页时输入的是ASCII编码字节流,
28         但系统默认是接受宽字节的,所以把网页的GB2312 ASCII编码字节流每两字节读取
29         例如网页本来有1000个字符,按上边代码得到的CString GetLength只有500
30         所以这里转化为wchar_t*后,做一个强制转化就行了*/
31         char* charresult = (char*)unicodeStr2;    
32         string strresult(charresult);  //char* 转 string 
33         
34         //从html文件中得到具体信息
35          int begin=strresult.find("<body>")+6;    
36         int end=strresult.find("</body>");
37         strresult=strresult.substr(begin, end-begin);
38         strcpy(resultString,strresult.c_str());
39         
40         return true;

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Golang语言社区

Go Channel 应用模式(二)

eapache/channels提供了一些channel应用模式的方法,比如上面的扇入扇出模式等。

1043
来自专栏偏前端工程师的驿站

意译:《JVM Internals》

译者语                                  为加深对JVM的了解和日后查阅时更方便,于是对原文进行翻译。内容是建立在我对JVM的认...

2247
来自专栏木木玲

JVM中 对象的内存布局 以及 实例分析

1968
来自专栏屈定‘s Blog

并行设计模式--immutable模式

线程不安全的原因是共享了变量且对该共享变量的操作存在原子性、可见性等问题,因此一种解决思路就是构造不可变的对象,没有修改操作也就不存在并发竞争,自然也不需要额外...

1636
来自专栏崔庆才的专栏

Python操作MongoDB看这一篇就够了

3.2K4
来自专栏佳爷的后花媛

java基础知识

Vector、Stack、HashTable、ConcurrentHashMap、Properties

2365
来自专栏Golang语言社区

Go Channel 应用模式(二)

eapache/channels提供了一些channel应用模式的方法,比如上面的扇入扇出模式等。

1373
来自专栏博岩Java大讲堂

Java虚拟机--线程上下文类加载器

2154
来自专栏恰同学骚年

《C#图解教程》读书笔记之二:存储、类型和变量

  (1)C程序是一组函数和数据类型,C++程序是一组函数和类,而C#程序是一组类型声明;

743
来自专栏大神带我来搬砖

锱铢必较:编写政治正确的代码——来聊聊java8的Optional

1878

扫码关注云+社区