我正在寻找一个支持频繁添加/删除的容器。我不知道容器可能会增长到多大,但我不想因为巨大的重新分配而停滞不前。我需要在性能和一致的行为之间取得良好的平衡。
最初,我考虑使用std::tr1::unordered_map,但由于我不知道数据集的上限,冲突可能会降低unordered的性能。这不是一个好的散列函数的问题,因为无论它有多好,如果map的占用率超过存储桶计数的一半,冲突可能会成为一个问题。
现在我考虑std::map,因为它没有冲突的问题,但它只有log(n)性能。
当您不知道unordered_map的目标大小时,是否有一种方法可以智能地处理冲突?有没有其他想法来处理这种情况,我想这并不少见?
谢谢
发布于 2011-12-17 04:18:25
这是一个运行时容器,对吗?
您是在末尾(如在push_back中)还是在前面或中间添加?您是在随机位置删除,还是其他什么?
你是如何在其中引用信息的?随机的,或者从前面或者后面,或者别的什么?
如果你需要随机访问,基于数组或散列的东西是最好的。
如果重新分配是一个大问题,你想要更像树或列表的东西。
即便如此,如果您经常对放入容器中的对象执行new-ing (和delete-ing),那么仅此一项就可能消耗大量时间,在这种情况下,您可能会发现将使用过的对象保存在垃圾列表中是有意义的,这样您就可以回收它们。
我的建议是,与其为容器的选择而烦恼,不如选择一个,编写程序,然后。无论您选择什么,您都可能想要更改它,可能不止一次。我在这个例子中发现,任何预先存在的容器类都是通过简化编程来证明其存在的合理性,而不是通过最快的速度。
我知道这是违反直觉的,但除非你的程序中的其他活动最终成为主要的成本,而且你不能缩小它,否则你最终的速度爆发将需要手工编码数据结构。
发布于 2011-12-17 04:36:34
您需要什么样的访问权限?顺序访问、随机访问、按键查找?此外,您可以手动重新散列无序映射(rehash方法),并设置其负载因子。在任何情况下,当链变得太长时(即,当超过负载因子时),散列将自我重建。此外,哈希表的减速点是在它满的时候~80%,而不是50%。
您真的应该已经阅读了文档,例如here。
https://stackoverflow.com/questions/8539078
复制相似问题