首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >涉及const_cast的意外行为

涉及const_cast的意外行为
EN

Stack Overflow用户
提问于 2019-05-29 05:58:36
回答 1查看 134关注 0票数 3

我想出了下面的例子,它暴露了一些意外的行为。我期望在push_back之后,向量中的任何东西都在那里。看起来编译器不知何故决定重用str使用的内存。

有人能解释一下这个例子中发生了什么吗?这是有效的c++代码吗?

最初的问题源于负责序列化/反序列化消息的代码,它使用const_cast删除常量。在注意到该代码中的一些意外行为之后,我创建了这个简化的示例,它试图演示这个问题。

代码语言:javascript
复制
#include <vector>
#include <iostream>
#include <string>
using namespace std;
int main()
{
    auto str = std::string("XYZ"); // mutable string
    const auto& cstr(str);         // const ref to it

    vector<string> v;
    v.push_back(cstr);

    cout << v.front() << endl;  // XYZ is printed as expected

    *const_cast<char*>(&cstr[0])='*'; // this will modify the first element in the VECTOR (is this expected?)
    str[1]='#';  //

    cout << str << endl;  // prints *#Z as expected
    cout << cstr << endl; // prints *#Z as expected
    cout << v.front() << endl; // Why *YZ is printed, not XYZ and not *#Z ?

    return 0;
}
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-29 06:35:49

理解这个bug

由于使用写时复制语义的旧版本的std::string**.** 实现std::string的折旧实现中的怪癖,导致了意外行为的发生。这是一个聪明的想法,但它会导致像您所看到的那样的错误。这意味着,GCC试图定义std::string,以便只有在修改新的std::string时才会复制内部字符串缓冲区。例如:

代码语言:javascript
复制
std::string A = "Hello, world";
std::string B = A; // No copy occurs (yet)
A[3] = '*'; // Copy occurs now because A got modified.

但是,当您采用常量指针时,不会发生复制,因为库假定字符串不会通过该指针进行修改:

代码语言:javascript
复制
std::string A = "Hello, world"; 
std::string B = A;
std::string const& A_ref = A;

const_cast<char&>(A_ref[3]) = '*'; // No copy occurs (your bug)

正如您已经注意到的,写入时复制语义往往会导致错误。正因为如此,并且因为复制字符串非常便宜(考虑所有因素),std::string的写入时复制实现在GCC 5中被降级并删除了。

那么,如果你使用的是GCC 5,为什么你会看到这个错误呢?很可能你正在编译和链接一个旧版本的C++标准库(在这个库中,写时复制仍然是std::string的实现)。这就是导致你的bug的原因。

检查您正在编译的C++标准库的版本,如果可能,请更新您的编译器。

我怎样才能知道我的编译器使用的是哪种std::string实现?

  • 新的GCC实现:sizeof(std::string) == 32 ( 64位编译时)
  • 旧的GCC实现:sizeof(std::string) == 8 ( 64位编译时)

如果您的编译器使用的是std::string的旧实现,那么sizeof(std::string)sizeof(char*)相同,因为std::string是作为指向内存块的指针实现的。内存块实际上包含字符串的大小和容量等内容。

代码语言:javascript
复制
struct string { //Old data layout
    size_t* _data; 
    size_t size() const {
        return *(data - SIZE_OFFSET); 
    }
    size_t capacity() const {
        return *(data - CAPACITY_OFFSET); 
    }
    char const* data() const {
        return (char const*)_data; 
    }
};

另一方面,如果您使用的是较新的std::string实现,那么sizeof(std::string)应该是32字节(在64位系统上)。这是因为新的实现将字符串的大小和容量存储在std::string本身中,而不是存储在它所指向的数据中:

代码语言:javascript
复制
struct string { // New data layout
    char* _data;
    size_t _size;
    size_t _capacity; 
    size_t _padding; 
    // ...
}; 

新实现有什么好处?新实现有很多好处:

可以更快地完成对大小和容量的访问(因为优化器更可能将它们存储在寄存器中,或者至少它们可能存储在32字节的cache)

  • Because

  • 中,所以我们可以利用小字符串优化。小字符串优化允许在通常由_capacity_padding占用的空间内存储长度小于16个字符的字符串。这避免了堆分配,并且在大多数用例中速度更快。

下面我们可以看到,GDB使用了旧的std::string实现,因为sizeof(std::string)返回8个字节:

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56350549

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档