前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >五分钟知识小科普:什么是 Base64编码

五分钟知识小科普:什么是 Base64编码

作者头像
五分钟学算法
发布2019-07-31 15:30:33
9030
发布2019-07-31 15:30:33
举报
文章被收录于专栏:五分钟学算法五分钟学算法

定义

Base64编码 是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。

为什么会有 Base64 编码呢?因为有些网络传送渠道并不支持所有的字节,例如:传统的邮件只支持可见字符的传送,像 ASCII 码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制。

图片的二进制流的每个字节不可能全部是可见字符,这就导致图片的二进制流无法传送。最好的解决方式就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。即把不可打印的字符也能用可打印字符来表示,问题就解决了。

Base64 编码就是为了实现这一方案而设计的编码格式。

Base64 就是一种基于 64 个可打印字符来表示二进制数据的表示方法

它的编码过程如下:

  • 将待转换的字符串每三个字节分为一组,每个字节占 8 个二进制位,那么共有 24 个二进制位。
  • 将第(1)步得到的每 24 个二进制位分为每 6 个一组,则每 3 个字节可分为 4 组。
  • 在每组前面添加两个 0 ,每组由 6 个二进制位变为 8 个二进制位,总共 32 个二进制位,即四个字节。
  • 根据 Base64编码对照表(见下表)获得对应的值。

大多数编码都是由字符串转化成二进制的过程,而 Base64 的编码则是从二进制转换为字符串。与常规恰恰相反,Base64 编码主要用在传输、存储、表示二进制领域,不能算得上加密,只是无法直接看到明文。也可以通过打乱Base64 编码来进行加密。中文有多种编码(比如:utf-8、gb2312、gbk等),不同编码对应Base64编码结果都不一样。

补充

挺多人会误以为 Base64 是加密算法,喜欢在数据传输不安全的时候来一句:使用 Base64 加密一下呗。

我们先来看一下加密的定义:在密码学中,加密(英语:Encryption)是将明文信息改变为难以读取的密文内容,使之不可读的过程。只有拥有解密方法的对象,经由解密过程,才能将密文还原为正常可读的内容。

所谓加密算法就是加密的方法。

如果你使用 Base64 进行 "加密" ,第三方拿到数据可以瞬间解密,根本无法实现你想要的 加密 效果。因此,Base64 不能说是 加密算法,只能说是 编码

Tips

如果你需要在网络上留下你的 微信号、邮箱、QQ 、手机号等具有隐私信息的时候,你不妨留下它们对应的 Base64 编码信息。一方面,想要联系你的人需要进行解码操作,可以过滤一部分需求没那么强烈的人;另外一方面也可以形成 简单的反爬虫 操作,不容易被爬虫收集到你的隐私信息。


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 五分钟学算法 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 定义
  • 补充
  • Tips
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档