当JavaScript遇上UINT64

导语:写下这篇文章的缘由是因为在项目过程中,碰到了一个使用JavaScript处理 UINT64 类型数字的坑。

与大部分现代编程语言(包括几乎所有的脚本语言)一样,JavaScript中的数字类型是基于 IEEE 754 标准来实现的,该标准通常也被称为“浮点数”。JavaScript使用的是“双精度”格式(即64位二进制)。

较小的数值

不仅仅是JavaScript,所有遵循 IEEE 754 规范的语言都会碰到如下问题:

0.1 + 0.2 === 0.3; // false

从数学角度来说,上面的条件判断结果应该是true,可实际上却为false。

这是因为,二进制浮点数中的 0.1 和 0.2 并不是十分精确,它们相加的结果并非刚好等于 0.3 ,而是一个比较接近的数字 0.30000000000000004, 所以条件判断的结果为false。

那么该如何处理这种语言上的缺陷呢?

最常见的方法是设置一个误差范围,通常称为“机器精度”(machine epsilon),对JavaScript的数字类型来说,这个值通常是2^-52(2.220446049250313e-16)。

从 ES6 开始,该值定义在Number.EPSILON中,我们可以直接拿来用,也可以为 ES6 之前的版本写polyfill:

if (!Number.EPSILON) {
    Number.EPSILON = Math.pow(2, -52);
}

可以使用Number.EPSILON来比较两个数字是否相等(在指定的误差范围内):

function numbersCloseEnoughToEqual(n1, n2) {
    return Math.abs(n1 - n2) < Number.EPSILON;
}

let a = 0.1 + 0.2;
let b = 0.3;

numbersCloseEnoughToEqual(a, b); // true
numbersCloseEnoughToEqual(0.0000001, 0.0000002); // false

JavaScript中能够呈现的最大浮点数大约是 1.798e+308(这是一个相当大的数字),它定义在 Number.MAX_VALUE中。最小浮点数定义在 Number.MIN_VALUE中,大约是5e-324,它不是负数,但无限接近于0!

JavaScript中整数的安全范围

上述JavaScript数字的呈现方式决定了“整数”的安全范围远远小于 Number.MAX_VALUE。

能够被“安全”呈现的最大整数是2^53 - 1,即 9007199254740991,在 ES6 中被定义为Number.MAX_SAFE_INTEGER。最小整数是 -9007199254740991,在 ES6 中被定义为Number.MIN_SAFE_INTEGER。

实际上,在前端的应用场景中正负 2^52 - 1 是一个绝对够用的安全整数范围,然而在NodeJS的服务端开发中就不一定了,如数据库中的64位ID(现在QQ号已经需要用UINT64来存储了)。由于JavaScript的数字类型无法精确呈现64位的数值,所以比较将它们保存(转换)为字符串。

我遇到的坑

上个项目,在使用Protocol Buffer协议(下文简称PB协议)与其他语言的后台服务通信的过程中(关于Protocol Buffer协议的介绍可以参考本人的这篇文章),需要将从A服务拿到一个UINT64类型(用户帐号)的整数透传给B服务。

其实之前也在PB协议中遇到过UINT64类型定义的字段,但是当这个UINT64整型小于Number.MAX_SAFE_INTEGER时,我们将它当作正常的Number类型处理是完全没有问题的。不过,这次我遇到的UINT64字段的值全都大于Number.MAX_SAFE_INTEGER,这时我还将它当作Number类型来处理,导致B服务中根本查询不到我传过去的用户帐号。

例如,我从A服务拿到的实际用户帐号是144115197458450067,当我将它转换成Number后,变成了144115197458450080,传给B服务后,B服务告诉我系统中没有这个用户。。。没有debug之前我还以为是B服务出了bug,因为我啥都没做,就是数据透传而已啊!

解决方案

当我们确实需要在JavaScript中对大数值进行处理时,目前还是需要借助相关的工具库。

实际上在使用JavaScript进行PB通信时,我会使用ProtoBuf.js这个库帮我处理pb到json的类型转换,而ProtoBuf.js本身是依赖了一个工具库 long.js 来对 int64uint64 进行处理,long.js 会将上述两种类型转换成long类型对象实例。long.js提供了很多API供我们操作,比如将long类型对象实例转换成其他类型(Number,String,Buffer),或者将一个其它类型转换成long类型对象实例,具体的API可参考 Long.js API

例如,当我从A服务拿到一个UINT64类型的值longValueFromA,此时并需要进行处理时

const Long = require('long'),

function longHandleToString(v) {
    if(Long.isLong(v)) {
        return v.toString(); // 正确
    }
    return v;
}

function longHandleToNumber(v) {
    if(Long.isLong(v)) {
        return v.toNumber(); // 错误!v很可能大于Number.MAX_SAFE_INTEGER,转换成Number后会不精确。
    }
    return v;
}

// longValueFromA已经是一个long类型对象实例:Long { low: 2056032594, high: 33554434, unsigned: true}
longValue = longHandleToString(longValueFromA); // '144115198721823058' 正确!
// longValue = longHandleToNumber(longValueFromA); // 144115197458450080 错误!

然后再将longValue通过PB协议传给B服务时,要做一次类型转换,将string类型转换成long类型对象实例。

longValueToB = Long.fromString(longValue, true);

参考资料

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏逍遥剑客的游戏开发

在C#中派生C++的抽象类

2074
来自专栏屈定‘s Blog

Java8 Lambda(二)-Stream原理

推荐一篇博文,很好的介绍了Stream的原理.本文对其进行一些补充更加详细的讲解.

1722
来自专栏圣杰的专栏

线程安全知多少

1. 如何定义线程安全 线程安全,拆开来看: 线程:指多线程的应用场景下。 安全:指数据安全。 多线程就不用过多介绍了,相关类型集中在System.Thread...

3315
来自专栏大内老A

WCF技术剖析之十二:数据契约(Data Contract)和数据契约序列化器(DataContractSerializer)

大部分的系统都是以数据为中心的(Data Central),功能的实现表现在对相关数据的正确处理。而数据本身,是有效信息的载体,在不同的环境具有不同的表示。一个...

3468
来自专栏程序员宝库

JDK 源码中的一些“小技巧”

均摘选自JDK源码 1 i++ vs i-- String源码的第985行,equals方法中: while (n--!= 0) { if...

3425
来自专栏Golang语言社区

动手实现一个JSON验证器(上)

分析 既然要验证JSON的有效性,那么必然需要清楚的知道JSON格式,这个在JSON官网已经给我们画出来了: ? ? ? ? ? 从官方的图上面可以看出,JSO...

4537
来自专栏difcareer的技术笔记

JNI实现源码分析【四 函数调用】正文0x01:dvmCallMethodV0x02:nativeFunc0x03: 何时赋值

有了前面的铺垫,终于可以说说虚拟机是如何调用JNI方法的了。JNI方法,对应Java中的native方法,所以我们跟踪对Native方法的处理即可。

864
来自专栏偏前端工程师的驿站

编译期类型检查 in ClojureScript

962
来自专栏進无尽的文章

编码篇-低耦合代码注入

我下面要将的内容也许网上已经有很多相关的介绍了,但是我还是会写出这篇文章,一来是对自己学习的总结,虽然总结的有些晚,如果你仔细看,会发现我的文章有别处没有的内容...

942
来自专栏程序员的SOD蜜

在C++中反射调用.NET(一) 反射调用第一个.NET类的方法

为什么要在C++中调用.NET 一般情况下,我们常常会在.NET程序中调用C/C++的程序,使用P/Invoke方式进行调用,在编写代码代码的时候,首先要导入D...

24110

扫码关注云+社区