前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用位运算为你的程序加速

用位运算为你的程序加速

作者头像
crossoverJie
发布2022-10-27 13:26:43
3200
发布2022-10-27 13:26:43
举报
文章被收录于专栏:crossoverJie

前言

最近在持续优化之前编写的 JSON 解析库 xjson,主要是两个方面的优化。

第一个是支持将一个 JSONObject 对象输出为 JSON 字符串。

这点在上个版本中只是利用自带的 Print 函数打印数据:

代码语言:javascript
复制
func TestJson4(t *testing.T)  {
 str := `{"people":{"name":{"first":"bob"}}}`
 first := xjson.Get(str, "people.name.first")
 assert.Equal(t, first.String(), "bob")
 get := xjson.Get(str, "people")
 fmt.Println(get.String())
 //assert.Equal(t, get.String(),`{"name":{"first":"bob"}}`)
}

Output:

代码语言:javascript
复制
map[name:map[first:bob]]

本次优化之后便能直接输出 JSON 字符串了:

实现过程也很简单,只需要递归遍历 object 中的数据,然后拼接字符串即可,核心代码如下:

代码语言:javascript
复制
func (r Result) String() string {
 switch r.Token {
 case String:
  return fmt.Sprint(r.object)
 case Bool:
  return fmt.Sprint(r.object)
 case Number:
  i, _ := strconv.Atoi(fmt.Sprint(r.object))
  return fmt.Sprintf("%d", i)
 case Float:
  i, _ := strconv.ParseFloat(fmt.Sprint(r.object), 64)
  return fmt.Sprintf("%f", i)
 case JSONObject:
  return object2JSONString(r.object)
 case ArrayObject:
  return object2JSONString(r.Array())
 default:
  return ""
 }
}

用位运算优化

第二个优化主要是提高了性能,查询一个复杂 JSON 数据的时候性能提高了大约 ⏫16%.

代码语言:javascript
复制
# 优化前
BenchmarkDecode-12         90013             66905 ns/op           42512 B/op       1446 allocs/op

# 优化后
BenchmarkDecode-12        104746             59766 ns/op           37749 B/op       1141 allocs/op

这里截取了一些重点改动的部分:

在 JSON 解析过程中会有一个有限状态机状态迁移的过程,而迁移的时候可能会出现多个状态。

比如当前解析到的 token 值为 {,那它接下来的 token 可能会为 ObjectKey:"name",也可能会是 BeginObject:{,当然也可能会是 EndObject:}, 所以在优化之前我是将状态全部存放在一个集合中的,在解析过程中如果发现状态不满足预期的列表时则会抛出语法异常的错误。

所以优化之前是遍历这个集合来进行判断的,这样的时间复杂度为 O(N),但当我们换成位运算就不一样了,时间复杂度直接就变为O(1)了,同时还节省了一个切片的存储空间。

我们简单来分析下这个位运算为什么会达到判断一个数据是否在一个集合中同样的效果。

首先以这两个状态为例:

代码语言:javascript
复制
 StatusObjectKey   status = 0x0002
 StatusColon       status = 0x0004

他们分别对应的二进制数据为:

代码语言:javascript
复制
 StatusObjectKey   status = 0x0002 //0010
 StatusColon       status = 0x0004 //0100

当我们对这两个数据求 | 运算得到的数据是 0110

代码语言:javascript
复制
A:0010
B:0100

C:0110

这时候如何我们如果用这两个原始数据与 C:0110& 运算时就会还原为刚才的两个数据。

代码语言:javascript
复制
// input:
A:0010
C:0110

// output:
A:0010

----------
// input:
B:0100
C:0110

// output:
B:0100

但我们换一个 D 与 C 求 & 时:

代码语言:javascript
复制
D: 1000 // 0x0008 对应的二进制为 1000
C: 0110
D':0000

将会得到一个 0 值,只要得出的数据大于 0 我们就能判断一个数据是否在给定的集合中了。

当然这里有一个前提条件就是,我们输入的数据高位永远都是是 1 才行,也就是2的幂。

同样的优化在解析查询语法时也有使用:

其他奇淫巧技

当然位运算还有一些其他技巧,比如判断奇偶数:

代码语言:javascript
复制
// 偶数
a & 1 == 0

// 奇数
a & 1 == 1

乘法和除法,右移1一位是除以2,左移一位是乘以2.

代码语言:javascript
复制
x := 2
fmt.Println(x>>1) //1
fmt.Println(x<<1) //4

总结

位运算在带来程序性能提升的同时也降低代码可读性,所以我们得按需选择是否使用;

再一些底层库、框架代码对性能有极致追求的场景推荐使用,但在业务代码中对数据做加减乘除就没必要用位运算了,只会让后续的维护者一脸懵逼。

相关代码:https://github.com/crossoverJie/xjson

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 crossoverJie 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 用位运算优化
  • 其他奇淫巧技
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档