MD5 到底是不是加密?

最近在做线上教学,感触很多。比如,备课比我想象的累多了,超级累,总想做得更好,一天到晚就是备呀备;比如,直播讲课和现场演讲的感觉很不一样,我第一次带着 100 个学员直播上课的时候,比站在北航的阶梯教室面对几百个人做演讲还紧张得多(其实吧,现场演讲一点也不紧张)。很多有意思的事,有机会分享一下,但今天我想说技术。

前几天在讲网络的时候,讲到了编码和加密,末尾讲到 MD5 的时候我先问了一下大家:「MD5 是加密吗?」

MD5 是程序开发中非常常用的一种算法,很多人都用过。提到 MD5,大多数人的反应都是「这是一种加密算法」,懂得多点的人还会说「可以用于给密码加密」,再懂点的还知道「MD5 已经有被破解的可能性了」。但 MD5 到底是加密吗?所谓的加密到底是什么意思?MD5 的破解又是指的什么?

MD5:一种哈希算法

实质上,MD5 只是一种哈希算法。

哈希算法,即 hash,又叫散列算法,是一类把任意数据转换为定长(或限制长度)数据的算法统称。例如我叫张三,你叫李四,那么「人 -> 人名」的算法就叫属于一种哈希算法。哈希算法通常用于制作数字指纹,数字指纹的意思就是「你看到这个东西就像看到原数据一样」,例如我们在一些网站下载大文件的时候,网站提供给我们验证文件完整性的 MD5 或者 SHA1 码,就是原文件的哈希值。哈希算法有很多种,MD5 是其中的一种,这就是 MD5。所以,优秀的哈希算法通常需要具有低碰撞概率(即不同数据的哈希值通常也不一样)。

加密是什么?

加密,指的是对数据进行转换以后,数据变成了另一种格式,并且除了拿到解密方法的人,没人能把数据转换回来。因此,加密通常用于网络通信。因为网络上的通信数据,任何人都有可能会拿到,把数据加密后再传送,送达以后由对方解密后再查看,就可以防止网络上的偷窥。例如大家都知道「安全」但很少人知道「为什么安全」的 HTTPS,就是通过加密算法来保障的网络安全性。

所以,MD5 是加密吗?

加密算法的目的,在于别人无法成功查看加密后的数据,并且在需要的时候还可以对数据进行解密来重新查看数据。而 MD5 算法是一种哈希算法,哈希算法的设计目标本身就决定了,它在大多数时候都是不可逆的,即你经过哈希算法得出的数据,无法再经过任何算法还原回去。所以,既然不能将数据还原,也就不能称之为可以解密;既然不能解密,那么哈希的过程自然也就不能称作是「加密」了。

「不可逆加密」?

你如果试试去查询百度百科,会发现有一个「MD5 加密」的词条:

甚至还有一个词条叫做「不可逆加密算法」:

在「不可逆加密算法」词条下,MD5 赫然在列。

然而,他们都是错的。甚至,「不可逆加密算法」这个词,也是人造的。你甚至可以在网上搜索到一些博客,将加密算法归类为「可逆加密」和「不可逆加密」两类。这其实不能怪百度百科,也不能怪这些归类的人,要怪只能怪,关于数据转换相关的内容太多、太杂,导致大家用着用着就混淆了。

这些小知识有什么用?

在开发中,经常会遇到 RSA、AES、BASE64、MD5、SHA1、SHA256、GZIP 这些词,他们的意义和使用场景都是各不相同的。在刚入行的时候,作为一个底层小码农,只要按照同事的指示,让我 BASE64 我就 BASE64,让我 MD5 我就 MD5,不用问为什么。但是当你有了一定工作经验之后,就应该慢慢开始对这些内容有所了解了,不然不仅在开发中会遇到各种障碍,而且在项目出了相关问题的时候,你甚至不知道是你的问题还是同事的问题。做开发,谁都想往高处走,但你在往高处走之前,需要先建立起自己的优势。

所以如果你只是把这当做一个「小知识」,用「MD5 是不是加密」来跟朋友炫技或者用来在面试时提问求职者,这可能确实没有什么用。但你如果把它的本质了解清楚,它到底是什么、有什么用、怎么用,以及它的相关知识都有哪些,它们各自的含义、用法和区别是什么,这样的体系化的知识,以及这种不断把自己的知识向体系化转换的意识,将会对你非常有用。

要知道,有用的不是小知识,而是在你能够对这些小知识轻松回答时,所体现出的完整知识体系。小知识太多了,没人能学的完。

比如我再问一个问题:「用 BASE64 来传数据更加安全和稳定」这个说法,正确吗?

原文发布于微信公众号 - HenCoder(hencoder)

原文发表时间:2018-07-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

黑匣子开启:iOS Secure Enclave 固件解密密钥首度“被”公开

8 月 17 日某黑客发布消息称自己破译出了苹果 iOS 中 Secure Enclave 固件解密密钥。苹果系统向来在安全性上以封闭著称,大家并不能深入地了解...

3766
来自专栏java思维导图

一个女程序媛征男友的需求说明书

java思维导图 xmind导图配合精美文章,可视化学习,让java不再难懂。 前 言 常听人说程序员的生活枯燥为人刻板,其实这是你不懂程序员。代码之外,生活...

2805
来自专栏一英里广度一英寸深度的学习

对话机器人ChatBot综述

网址:http://www.tuling123.com/ 特点:提供场景服务

5481
来自专栏FreeBuf

代码签名证书买卖黑市的真实情况

代码签名证书 根据研究人员的调查发现,目前地下网络犯罪市场买卖代码签名证书的情况越来越频繁了,而这些伪造的代码签名证书可以帮助攻击者让自己的恶意软件绕过安全防护...

4067
来自专栏深度学习与数据挖掘实战

行业|我用Python爬了12万条影评,告诉你《战狼Ⅱ》都在说些啥

截止到 8 月 20 日,《战狼Ⅱ》上映的第 25 天,它的票房已超 50 亿人民币,真正成为唯一一部挺进世界影史票房前 100 名的亚洲电影。

1254
来自专栏用户增长策略

巧用indiegogo的秘密链接“secret perk”的5大方法

indiegogo推出的秘密支持链接“secret perk”,这是indiegogo后台生成的一种专属的链接,发给特定人打开后能看到不一样的支持项目。

2224
来自专栏菜鸟程序员

维基解密发布CIA网络武器库Vault8 今天发布蜂巢Hive工具箱

1534
来自专栏noteless

1.计算机发展阶段 计算机发展历史 机械式计算机 机电式计算机 电子计算机 逻辑电路与计算机 二极管 电子管 晶体管 硅 门电路 计算机 电磁学计算机二进制

再后来有了一些数学理论的发展,纳皮尔棒/计算尺则是借助了一定的数学理论,可以理解为是一种查表计算法.

1493
来自专栏知晓程序

太多剧集追不过来?这个小程序,让你 5 分钟看完一部片

1412
来自专栏腾讯数据中心

浅谈数据中心油罐清洗

一、油罐清洗必要性 机房柴油发电机所用油一般为柴油。柴油除了在柴发的日用油箱储存,供本油机使用外,机房的备用柴油一般都储存在几十立方的油罐中。油罐中的柴油包含一...

3065

扫码关注云+社区