企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
# 7.12。哈希 的注意事项 > 原文: [http://numba.pydata.org/numba-doc/latest/developer/hashing.html](http://numba.pydata.org/numba-doc/latest/developer/hashing.html) Numba 支持内置 [`hash()`](https://docs.python.org/3/library/functions.html#hash "(in Python v3.7)") ,只需在提供的参数上调用`__hash__()`成员函数即可。这使得为​​新类型添加哈希支持变得微不足道,因为所需要的是应用扩展 API `overload_method()`装饰器来重载函数以计算注册到类型的`__hash__()`方法的新类型的哈希值。例如: ```py from numba.extending import overload_method @overload_method(myType, '__hash__') def myType_hash_overload(obj): # implementation details ``` ## 7.12.1。实施 Numba 散列函数的实现严格遵循 Python 3 的实现。唯一的例外是对于散列 Unicode 和字节(对于长于`sys.hash_info.cutoff`的内容),唯一支持的算法是`siphash24`(CPython 3 中的默认值)。因此,Numba 将在所描述的默认条件下匹配所有支持类型的 Python 3 哈希值。 Python 2 散列支持设置为遵循 Python 3,类似的默认值是为此目的进行硬编码的,包括,或许最明显的是,`sys.hash_info.cutoff`设置为零。 ### 7.12.1.1。 Unicode 哈希缓存差异 Numba 和 CPython Unicode 字符串内部表示都有一个`hash`成员用于缓存字符串的哈希值。在计算哈希值之前总是检查该成员,只需从缓存中提供值,因为这样做要便宜得多。 Numba Unicode 字符串哈希缓存实现的行为方式与 CPython 的相似。唯一值得注意的行为改变(其唯一影响是性能的微小潜在变化)是 Numba 总是计算并缓存在`nopython mode`中创建的 Unicode 字符串的哈希值,这些字符串在盒装时可以在 Python 中重用,这太过于渴望在某些情况下,与 CPython 相比,它可能会延迟根据创建方法散列新的 Unicode 字符串。还应该注意的是,当 Numba 将它们拆分为自己的表示时,Numba 会在 CPython 内部表示的`hash`成员中复制它们,以便不重新计算已经具有与之关联的散列值的字符串的散列。 ### 7.12.1.2。 `PYTHONHASHSEED` 的住宿 `PYTHONHASHSEED`环境变量可用于为例如 CPython 散列算法设定种子。重现性的目的。 Numba 哈希实现直接读取 CPython 哈希算法的内部状态,因此`PYTHONHASHSEED`的影响在 Numba 的哈希实现中被复制。