我正在用C语言编写哈希表,我正在测试字符串的哈希函数。
我尝试的第一个函数是添加ascii代码并使用模数(%100),但我在第一次数据测试中得到了很差的结果: 130个单词发生40次冲突。
最终的输入数据将包含8000个单词(它是一个存储在文件中的字典)。哈希表被声明为int table10000,并且包含单词在txt文件中的位置。
第一个问题是,对字符串进行散列的最佳算法是什么?如何确定哈希表的大小?
提前感谢!
:-)
发布于 2011-10-06 03:26:03
我用Dan Bernstein的djb2得到了很好的结果。
unsigned long
hash(unsigned char *str)
{
unsigned long hash = 5381;
int c;
while (c = *str++)
hash = ((hash << 5) + hash) + c; /* hash * 33 + c */
return hash;
}https://stackoverflow.com/questions/7666509
复制相似问题