专栏首页Web行业观察0.30000000000000004

0.30000000000000004

0.30000000000000004问题是计算机科学领域的经典BUG, 由比尔盖茨那一代人标准化的浮点数表示法造福了一代人也祸害了一代人, 由此引出了不少的坑, 比如大多数编程语言中0.1+0.2==0.30000000000000004.遇到这个问题不要担心, 你的编译环境没有坏, 只是计算机在做进制转换的时候需要绕一些丸子, 本文来具体分析一下这个bug背后的秘密, 也可以访问它的官解: http://0.30000000000000004.com/

众所周知JS仅有Number这个数值类型,而Number采用的时IEEE 754 64位双精度浮点数编码。而浮点数表示方式具有以下特点:

1. 浮点数可表示的值范围比同等位数的整数表示方式的值范围要大得多;

2. 浮点数无法精确表示其值范围内的所有数值,而有符号和无符号整数则是精确表示其值范围内的每个数值;

3. 浮点数只能精确表示m*2e的数值;

4. 当biased-exponent为2e-1-1时,浮点数能精确表示该范围内的各整数值;

5. 当biased-exponent不为2e-1-1时,浮点数不能精确表示该范围内的各整数值。

由于部分数值无法精确表示(存储),于是在运算统计后偏差会愈见明显。

不仅是JavaScript会产生这种问题,只要是采用IEEE 754 Floating-point的浮点数编码方式来表示浮点数时,则会产生这类问题。绝对完美的数值编码方案是不存在的,为了处理方便,这个标准引入了大量的折衷和妥协,建立在这种表达方式上的算法(例如除法运算)也一样。由于数值表达方式存在“缺陷”,运算结果不可避免地堆聚起越来越多的误差, 补丁越来越多, 浮点算法就成了和路由协议一样的筛子。下面我们来分析整个运算过程。

1. 0.1 的二进制表示为 1.1001100110011001100110011001100110011001100110011001 1(0011)+ * 2^-4;

2. 当64bit的存储空间无法存储完整的无限循环小数,而IEEE 754 Floating-point采用round to nearest, tie to even的舍入模式,因此0.1实际存储时的位模式是0-01111111011-1001100110011001100110011001100110011001100110011010;

3. 0.2 的二进制表示为 1.1001100110011001100110011001100110011001100110011001 1(0011)+ * 2^-3;

4. 当64bit的存储空间无法存储完整的无限循环小数,而IEEE 754 Floating-point采用round to nearest, tie to even的舍入模式,因此0.2实际存储时的位模式是0-01111111100-1001100110011001100110011001100110011001100110011010;

5. 实际存储的位模式作为操作数进行浮点数加法,得到 0-01111111101-0011001100110011001100110011001100110011001100110100。转换为十进制即为0.30000000000000004。

扩展一下, 就有了多种类似的产生式:

Why 0.7 * 180===125.99999999998?     

1. 0.7实际存储时的位模式是0-01111111110-0110011001100110011001100110011001100110011001100110;

2. 180实际存储时的位模式是0-10000000110-0110100000000000000000000000000000000000000000000000;

3. 实际存储的位模式作为操作数进行浮点数乘法,得到0-10000000101-1111011111111111111111111111111111111111101010000001。转换为十进制即为125.99999999998。

Why 1000000000000000128 === 1000000000000000129 ?

1. 1000000000000000128实际存储时的位模式是0-10000111010-1011110000010110110101100111010011101100100000000001;

2. 1000000000000000129实际存储时的位模式是0-10000111010-1011110000010110110101100111010011101100100000000001;

3. 因此1000000000000000128和1000000000000000129的实际存储的位模式是一样的。

日常开发规范


■ 大多数Web页面不需要小数 避免使用小数,尽量设法使用整数。确保数组的索引都是整数。按分(而不是元)计算金额。百分比放大100倍计算以避免出现小数。尽可能不用除法(/)和模(%)运算,因为大多数情况下它们直接导致出现浮点数。如果必须使用除法,立即用Math.round方法回归整数运算。

■ 如果必须使用浮点数,则尽可能引入冗余小数位——即在程序要求的运算精度之外,再增加小数位 如果程序需要5位数字的小数精度,则在运算中至少保留6位的小数,8位更好。冗余位越多,累计误差的影响越小。

■ 避免在同一个表达式中使用相差太大或太小的数值 对两个非常接近的数值执行减法或比较操作很容易出错。将很小的数值和很大数值相加无异于浪费时间,小的数值很可能被当作0。不过,很小的数值乘以很大的数值一般不会出现问题,例如2 * 12345678会得到正确的结果24691356。但是,0.1 - 0.09的结果是0.010000000000000009。

■ 用isFinite()和isNaN()检查运算结果 通过表单提交任何数值运算结果之前,一定要先检查数据的合法性。

■ 慎用数值运算 程序涉及的数值运算越少,引入误差的可能就越小。视浮点数为贵客,不可任意驱使。

本文分享自微信公众号 - WebHub(myWebHub),作者:金恒昱

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-07-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 原创反转精度算法:小数的终极编码

    上期带大家尝鲜了Zipack格式的“多快好省”:“多”指功能多;“快”指解析快;“省”指体积小。不过用户最好奇的一定是Zipack的底层原理,毕竟它“嚣张”地宣...

    Jean
  • Zipack初体验:我的开源标准!

    当今最流行的序列化格式无疑是JSON,但是基于文本的JSON有许多缺点,比如解析速度慢,体积较大。根本原因在于,JSON是基于文本的,只要是文本就离不开编译,只...

    Jean
  • IEEE浮点数的设计缺陷

    在生物化学中,“信息”是研究物质的2个基本视角之一,另外一个是“能量”。因为信息和能量都是抽象出来的东西,以它们为视角研究现实世界的成本非常低,比如计算机专业的...

    Jean
  • 5.22 VR扫描:京东天工计划3.0:强调未来零售革命的核心——无界零售

    VRPinea
  • 匿名助手Tor-Router:Tor网关及流量配置工具使用全教程

    今天给大家介绍的是一款名叫Tor-Router的实用工具,这款工具可以帮助我们将Tor设置为默认网关,并将所有的网络流量通过Tor来发送,整个过程不需要用户手动...

    FB客服
  • Hadoop MapReduce新一代架构MRv2

    MapReduce在hadoop-0.23中经历了彻底的改变,现在我们称之为MapReduce 2.0(MRv2)或者YARN。

    smartsi
  • Elasticsearch 6.x版本全文检索学习之数据建模

      答:数据建模,英文为Data Modeling,为创建数据模型的过程。数据模型Data Mdel,对现实世界进行抽象描述的一种工具和方法,通过抽象的实体及实...

    别先生
  • 【安装教程】win10中安装TensorFlow Objection Detection API

    该博客主要记录了TensorFlow Object Detection API的安装流程。默认读者已经安装好了TensorFlow

    AI那点小事
  • 磁盘文件读性能测试

     Timing buffered disk reads: 2454 MB in  3.00 seconds = 817.84 MB/sec

    一见
  • 测试开发进阶(二十六)

    如果在创建序列化器对象时候,只给data传参,那么调用save()方法实际调用的就是序列化器对象的 create()方法 在创建序列化器对象时,同时给ins...

    zx钟

扫码关注云+社区

领取腾讯云代金券