这一节详细说明 “0.1” 示例,教你怎样自己去精确的分析此类案例。假设这里你已经对浮点数表示有基本的了解。
_Representation error_ 提及事实上有些(实际是大多数)十进制小数不能精确的表示为二进制小数。这是 Python (或 Perl,C,C++,Java,Fortran 以及其它很多)语言往往不能按你期待的样子显示十进制数值的根本原因:
~~~
>>> 0.1 + 0.2
0.30000000000000004
~~~
这是为什么? 1/10 不能精确的表示为二进制小数。大多数今天的机器(2000年十一月)使用 IEEE-754 浮点数算法,大多数平台上 Python 将浮点数映射为 IEEE-754 “双精度浮点数”。754 双精度包含 53 位精度,所以计算机努力将输入的 0.1 转为 J/2**N 最接近的二进制小数。_J_ 是一个 53 位的整数。改写:
1 / 10 ~= J / (2**N)
为:
J ~= 2**N / 10
J 重现时正是 53 位(是 >= 2**52 而非 < 2**53 ), N 的最佳值是 56:
~~~
>>> 2**52
4503599627370496
>>> 2**53
9007199254740992
>>> 2**56/10
7205759403792793
~~~
因此,56 是保持 J 精度的唯一 N 值。J 最好的近似值是整除的商:
~~~
>>> q, r = divmod(2**56, 10)
>>> r
6
~~~
因为余数大于 10 的一半,最好的近似是取上界:
~~~
>>> q+1
7205759403792794
~~~
因此在 754 双精度中 1/10 最好的近似值是是 2**56,或:
7205759403792794 / 72057594037927936
要注意因为我们向上舍入,它其实比 1/10 稍大一点点。如果我们没有向上舍入,它会比 1/10 稍小一点。但是没办法让它 恰好 是 1/10!
所以计算机永远也不 “知道” 1/10:它遇到上面这个小数,给出它所能得到的最佳的 754 双精度实数:
~~~
>>> .1 * 2**55
7205759403792794.0
~~~
如果我们把这小数乘以 10**55,我们可以看到其55位十进制数的值:
~~~
>>> 3602879701896397 * 10 ** 55 // 2 ** 55
1000000000000000055511151231257827021181583404541015625
~~~
这表示存储在计算机中的实际值近似等于十进制值 0.1000000000000000055511151231257827021181583404541015625。许多语言(包括旧版本的Python)会把结果舍入到17位有效数字,而不是显示全部的十进制值:
~~~
>>> format(0.1, '.17f')
'0.10000000000000001'
~~~
fractions 和 decimal 模块使得这些计算很简单:
~~~
>>> from decimal import Decimal
>>> from fractions import Fraction
>>> Fraction.from_float(0.1)
Fraction(3602879701896397, 36028797018963968)
>>> (0.1).as_integer_ratio()
(3602879701896397, 36028797018963968)
>>> Decimal.from_float(0.1)
Decimal('0.1000000000000000055511151231257827021181583404541015625')
>>> format(Decimal.from_float(0.1), '.17')
'0.10000000000000001'
~~~
- Python 入门指南
- 1. 开胃菜
- 2. 使用 Python 解释器
- 2.1. 调用 Python 解释器
- 2.2. 解释器及其环境
- 3. Python 简介
- 3.1. 将 Python 当做计算器
- 3.2. 编程的第一步
- 4. 深入 Python 流程控制
- 4.1. if 语句
- 4.2. for 语句
- 4.3. range() 函数
- 4.4. break 和 continue 语句, 以及循环中的 else 子句
- 4.5. pass 语句
- 4.6. 定义函数
- 4.7. 深入 Python 函数定义
- 4.8. 插曲:编码风格
- 5. 数据结构
- 5.1. 关于列表更多的内容
- 5.2. del 语句
- 5.3. 元组和序列
- 5.4. 集合
- 5.5. 字典
- 5.6. 循环技巧
- 5.7. 深入条件控制
- 5.8. 比较序列和其它类型
- 6. 模块
- 6.1. 深入模块
- 6.2. 标准模块
- 6.3. dir() 函数
- 6.4. 包
- 7. 输入和输出
- 7.1. 格式化输出
- 7.2. 文件读写
- 8. 错误和异常
- 8.1. 语法错误
- 8.2. 异常
- 8.3. 异常处理
- 8.4. 抛出异常
- 8.5. 用户自定义异常
- 8.6. 定义清理行为
- 8.7. 预定义清理行为
- 9. 类
- 9.1. 术语相关
- 9.2. Python 作用域和命名空间
- 9.3. 初识类
- 9.4. 一些说明
- 9.5. 继承
- 9.6. 私有变量
- 9.7. 补充
- 9.8. 异常也是类
- 9.9. 迭代器
- 9.10. 生成器
- 9.11. 生成器表达式
- 10. Python 标准库概览
- 10.1. 操作系统接口
- 10.2. 文件通配符
- 10.3. 命令行参数
- 10.4. 错误输出重定向和程序终止
- 10.5. 字符串正则匹配
- 10.6. 数学
- 10.7. 互联网访问
- 10.8. 日期和时间
- 10.9. 数据压缩
- 10.10. 性能度量
- 10.11. 质量控制
- 10.12. “瑞士军刀”
- 11. 标准库浏览 – Part II
- 11.1. 输出格式
- 11.2. 模板
- 11.3. 使用二进制数据记录布局
- 11.4. 多线程
- 11.5. 日志
- 11.6. 弱引用
- 11.7. 列表工具
- 11.8. 十进制浮点数算法
- 12. 接下来?
- 13. 交互式输入行编辑历史回溯
- 13.1. 行编辑
- 13.2. 历史回溯
- 13.3. 快捷键绑定
- 13.4. 其它交互式解释器
- 14. 浮点数算法:争议和限制
- 14.1. 表达错误
- 15. 附录
- 15.1. 交互模式