前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >区块链前置知识之 hash (一)

区块链前置知识之 hash (一)

作者头像
用户6901603
发布2023-02-24 10:49:48
3480
发布2023-02-24 10:49:48
举报
文章被收录于专栏:不知非攻
可翻译成散列函数,也可以音译为哈希

1

定义

hash 是一种把任意长度输入变换成固定长度输出的一种算法。

假设我们已经定义了一个 hash 函数名为 H,输入内容为 message,输出内容为 x,那么就有如下公式

代码语言:javascript
复制
H(message) = x

这是一个压缩的过程,通常情况下,我们会把输出值称之为 hash 值

接下来通过一个具体的案例来了解 hash 的过程

我们定义这样一个场景,约定任意正整数,要存放在长度为 6 的数组中,那么此时,我们可以利用 hash 的思想设计什么样的方案来做到这个事情呢?

数组的具体位置我们可以用下标来表示 0, 1, 2, 3, 4, 5。想要将任意正整数放入到数组中,那么我们只需要设计一个函数,输入值为任意正整数,输出值为该数组下标中的任意一个即可,得到了输出值,我们就相当于知道应该把输入值放到数组中的某个位置了

我们可以使用求余法来定义这个 hash 函数

代码语言:javascript
复制
function suplus(number) {
  return number % 6
}

于是,随便取几个数,得到 hash 值之后就能存入数组对应的位置

代码语言:javascript
复制
// 输入值:61
suplus(61) = 1
代码语言:javascript
复制
// 输入值:101
suplus(101) = 5

此时的哈希值表示的是数组的下标,因此在很多应用场景,输出结果哈希值也被称为哈希地址

2

哈希碰撞

在上面的例子中,输入值的范围一定大于输出值的范围,这是 hash 的重要特性之一。因此在某些情况下,不同的输入会得到相同的输出结果

代码语言:javascript
复制
// 不同的输入,得到了相同的输出,哈希地址相同
suplus(7)  = 1
suplus(61) = 1

此时哈希地址相同,按照规则,我们不得不把不同的值,存入相同的位置,这种情况就被称之为哈希碰撞(collision)

解决哈希碰撞的方法很多,这里介绍一个比较常见的方法:以数组的每个地址为根节点,构建一个新的链表

例如当输入数字分别为 7, 61 时

但是当数据量庞大时,链表的查询速度比较低效,因此我们在实践中,会将链表替换成红黑树等操作效率更高的数据结构

当然,最理想的情况是输出范围足够广,不出现 hash 碰撞。因此我们实践中使用的 hash 函数,输出值的范围都非常庞大,例如早期用得比较多的 md5,现在使用比较多的sha256:比特币中使用的哈希算法。但是由于输入值范围一定大输出值范围,因此理论上哈希碰撞一定会存在

现在 md5 已经可以人为制造 hash 碰撞,因此实用性大大降低

接下来的一章,跟大家介绍哈希的特性与应用

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 这波能反杀 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1
  • 2
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档