# 2.2。即时编译
> 原文: [http://numba.pydata.org/numba-doc/latest/reference/jit-compilation.html](http://numba.pydata.org/numba-doc/latest/reference/jit-compilation.html)
## 2.2.1。 JIT 函数
```py
@numba.jit(signature=None, nopython=False, nogil=False, cache=False, forceobj=False, parallel=False, error_model='python', fastmath=False, locals={})
```
即时编译修饰函数以生成高效的机器代码。所有参数都是可选的。
如果存在,_ 签名 _ 是单个签名或表示函数参数和返回值的预期[类型和签名](types.html#numba-types)的签名列表。每个签名可以以多种形式给出:
* [类型和签名](types.html#numba-types)参数(例如`(numba.int32, numba.double)`)的元组,表示函数参数的类型;然后,Numba 将从参数中推断出适当的返回类型。
* 使用[类型和签名](types.html#numba-types)的呼叫签名,指定返回类型和参数类型。这可以以直观的形式给出(例如`numba.void(numba.int32, numba.double)`)。
* 上述之一的字符串表示,例如`"void(int32, double)"`。假定在`numba.types`模块中定义字符串中使用的所有类型名称。
_nopython_ 和 _nogil_ 是布尔标志。 _locals_ 是局部变量名称到[类型和签名](types.html#numba-types)的映射。
这个装饰器有几种操作模式:
* 如果在 _ 签名 _ 中给出一个或多个签名,则为它们中的每一个编译专门化。然后调用修饰函数将尝试选择最佳匹配签名,如果函数参数没有适当的转换,则引发 [`TypeError`](https://docs.python.org/3/library/exceptions.html#TypeError "(in Python v3.7)") 。如果转换成功,则使用转换的参数执行编译的机器代码,并根据签名转换返回值。
* 如果没有给出 _ 签名 _,则修饰函数实现延迟编译。每次对装饰函数的调用都会尝试重用现有的特化(如果存在)(例如,带有两个整数参数的调用可能会重用参数类型`(numba.int64, numba.int64)`的特化)。如果不存在合适的特化,则会即时编译新的特化,存储以供以后使用,并使用转换的参数执行。
如果为 true, _nopython_ 强制在 [nopython 模式](../glossary.html#term-nopython-mode)中编译该函数。如果不可能,编译将引发错误。
如果为真, _forceobj_ 强制在[对象模式](../glossary.html#term-object-mode)中编译该函数。由于对象模式比 nopython 模式慢,因此这对于测试目的非常有用。
如果为 true, _nogil_ 会尝试在编译函数内释放[全局解释器锁](https://docs.python.org/3/glossary.html#term-global-interpreter-lock "(in Python v3.7)")。只有当 Numba 能够在 [nopython 模式](../glossary.html#term-nopython-mode)中编译函数时才会释放 GIL,否则将打印编译警告。
如果为 true,则 _cache_ 允许基于文件的缓存在前一次调用中编译该函数时缩短编译时间。缓存保存在包含源文件的目录的`__pycache__`子目录中;但是,如果不允许当前用户写入它,则它会回退到特定于平台的用户范围的缓存目录(例如 Unix 平台上的`$HOME/.cache/numba`)。
如果为真,则 _parallel_ 启用多个常见 Numpy 构造的自动并行化以及相邻并行操作的融合,以最大化缓存局部性。
_error_model_ 选项控制被零除的行为。将它设置为'python'会导致被零除以引发像 CPython 这样的异常。将其设置为'numpy'会导致被零除以将结果设置为 _+/- inf_ 或 _nan_ 。
并非所有函数都可以缓存,因为某些功能无法始终保留到磁盘。当无法缓存函数时,会发出警告;使用 [`NUMBA_WARNINGS`](envvars.html#envvar-NUMBA_WARNINGS) 查看。
如果为真, _fastmath_ 允许使用 [LLVM 文档](https://llvm.org/docs/LangRef.html#fast-math-flags)中描述的其他不安全的浮点变换。此外,如果[英特尔 SVML](../user/performance-tips.html#intel-svml) 的安装速度更快,但使用的数学内在函数的版本不太准确(`4 ULP`内的答案)。
_locals_ 字典可用于强制特定局部变量的[类型和签名](types.html#numba-types),例如,如果您想在某个时刻强制使用单精度浮点数。通常,我们建议您让 Numba 的编译器自己推断局部变量的类型。
以下是两个签名的示例:
```py
@jit(["int32(int32)", "float32(float32)"], nopython=True)
def f(x): ...
```
在装饰器之后没有放任何括号等同于在没有任何参数的情况下调用装饰器,即:
```py
@jit
def f(x): ...
```
相当于:
```py
@jit()
def f(x): ...
```
装饰器返回 [`Dispatcher`](#Dispatcher "Dispatcher") 对象。
注意
如果没有给出 _ 签名 _,则在实际编译发生时,即首次使用某些给定的参数类型调用函数时,将引发编译错误。
注意
编译可能受某些专用[环境变量](envvars.html#numba-envvars)的影响。
## 2.2.2。生成的 JIT 函数
```py
@numba.generated_jit(nopython=False, nogil=False, cache=False, forceobj=False, locals={})
```
像 [`jit()`](#numba.jit "numba.jit") 装饰器一样,但是在编译时调用装饰函数,传递函数参数的 _ 类型 _。修饰函数必须返回一个可调用函数,该函数将被编译为函数对这些类型的实现,允许灵活的专业化类型。
[`generated_jit()`](#numba.generated_jit "numba.generated_jit") 装饰器返回 [`Dispatcher`](#Dispatcher "Dispatcher") 对象。
## 2.2.3。调度程序对象
```py
class Dispatcher
```
通过调用 [`jit()`](#numba.jit "numba.jit") 或 [`generated_jit()`](#numba.generated_jit "numba.generated_jit") 创建的对象类。您不应该尝试以任何其他方式创建此类对象。调用 Dispatcher 对象会为调用它的参数调用已编译的特化,使其充当已编译的 Python 函数的加速替换。
此外,Dispatcher 对象具有以下方法和属性:
```py
py_func
```
编译的纯 Python 函数。
```py
inspect_types(file=None, pretty=False)
```
打印出与相应的 Numba IR 一起逐行注释的函数源代码列表,以及各种变量的推断类型。如果指定了 _ 文件 _,则对该文件对象进行打印,否则对 sys.stdout 进行打印。如果 _ 漂亮 _ 设置为 True,那么将在终端和笔记本中的 HTML 中生成彩色 ANSI。
也可以看看
[Numba 架构](../developer/architecture.html#architecture)
```py
inspect_llvm(signature=None)
```
返回将编译的函数签名键入到为函数生成的人类可读 LLVM IR 的字典。如果指定了签名关键字,则返回与该单个签名对应的字符串。
```py
inspect_asm(signature=None)
```
返回将编译的函数签名键入到该函数的人类可读的本机汇编程序代码的字典。如果指定了签名关键字,则返回与该单个签名对应的字符串。
```py
inspect_cfg(signature=None, show_wrapped)
```
返回将编译的函数签名键入到函数的控制流图形对象的字典。如果指定了签名关键字,则返回与该单个签名对应的字符串。
可以对控制流图形对象进行字符串化(`str`或`repr`)以获得 DOT 格式的图形的文本表示。或者,使用其`.display(filename=None, view=False)`方法绘制图形。可以将 _ 文件名 _ 选项设置为要写入的呈现输出的特定路径。如果 _ 视图 _ 选项为 True,则图形格式(PDF)的系统默认应用程序将打开该图。在 IPython 笔记本中,返回的对象可以是内联图。
用法:
```py
@jit
def foo():
...
# opens the CFG in system default application
foo.inspect_cfg(foo.signatures[0]).display(view=True)
```
```py
recompile()
```
重新编译所有现有签名。这可能很有用,例如,如果函数冻结了全局变量或闭包变量,并且 Python 中的值已更改。由于编译并不便宜,因此主要用于测试和交互式使用。
```py
parallel_diagnostics(signature=None, level=1)
```
打印给定签名的并行诊断信息。如果没有签名,则打印所有已知签名。 `level`用于调整详细程度,`level=1`(默认值)是最小详细程度,2,3 和 4 级提供更高级别的详细程度。
```py
get_metadata(signature=None)
```
获取给定签名的编译元数据。这对于 Numba 和 Numba 扩展的开发人员非常有用。
## 2.2.4。矢量化函数(ufuncs 和 DUFuncs)
```py
@numba.vectorize(*, signatures=[], identity=None, nopython=True, target='cpu', forceobj=False, cache=False, locals={})
```
编译装饰函数并将其包装为 [Numpy ufunc](http://docs.scipy.org/doc/numpy/reference/ufuncs.html) 或 Numba [`DUFunc`](#numba.DUFunc "numba.DUFunc") 。可选的 _nopython_ , _forceobj_ 和 _locals_ 参数具有与 [`numba.jit()`](#numba.jit "numba.jit") 相同的含义。
_ 签名 _ 是一个可选的签名列表,以与 [`numba.jit()`](#numba.jit "numba.jit") _ 签名 _ 参数相同的形式表示。如果 _ 签名 _ 非空,那么装饰器会将用户 Python 函数编译为 Numpy ufunc。如果没有给出 _ 签名 _,那么装饰器会将用户 Python 函数包装在 [`DUFunc`](#numba.DUFunc "numba.DUFunc") 实例中,只要 Numpy 找不到匹配项,它就会在调用时编译用户函数循环输入参数。如果 _ 目标 _ 是`"parallel"`,则需要 _ 签名 _。
_ 标识 _ 是正在实现的函数的标识(或单位)值。可能的值为 0,1,None 和字符串`"reorderable"`。默认值为 None。 None 和`"reorderable"`均表示该函数没有标识值; `"reorderable"`另外指定沿多个轴的减少可以重新排序。
如果有多个 _ 签名 _,则必须从更具体到最不具体的顺序进行排序。否则,Numpy 基于类型的调度可能无法按预期工作。例如,以下是错误的:
```py
@vectorize(["float64(float64)", "float32(float32)"])
def f(x): ...
```
因为在单精度数组上运行它将选择编译函数的`float64`版本,导致执行效率低得多。正确的调用是:
```py
@vectorize(["float32(float32)", "float64(float64)"])
def f(x): ...
```
_target_ 是后端目标的字符串;可用值为“cpu”,“parallel”和“cuda”。要使用多线程版本,请将目标更改为“parallel”(这需要指定签名):
```py
@vectorize(["float64(float64)", "float32(float32)"], target='parallel')
def f(x): ...
```
对于 CUDA 目标,请使用“cuda”:
```py
@vectorize(["float64(float64)", "float32(float32)"], target='cuda')
def f(x): ...
```
可以缓存已编译的函数以减少将来的编译时间。通过将 _ 缓存 _ 设置为 True 来启用它。只有“cpu”和“parallel”目标支持缓存。
```py
@numba.guvectorize(signatures, layout, *, identity=None, nopython=True, target='cpu', forceobj=False, cache=False, locals={})
```
[`numba.vectorize()`](#numba.vectorize "numba.vectorize") 的广义版本。虽然 [`numba.vectorize()`](#numba.vectorize "numba.vectorize") 将产生一个简单的 ufunc,其核心功能(你正在装饰的功能)在标量操作数上运行并返回一个标量值, [`numba.guvectorize()`](#numba.guvectorize "numba.guvectorize") 允许你创建一个 [Numpy ufunc](http://docs.scipy.org/doc/numpy/reference/ufuncs.html) ,其核心功能采用各种维度的数组参数。
附加参数 _layout_ 是一个字符串,以符号形式指定参数类型和返回类型的维度和大小关系。例如,矩阵乘法的布局字符串为`"(m,n),(n,p)->(m,p)"`。它的定义可能是(函数体省略):
```py
@guvectorize(["void(float64[:,:], float64[:,:], float64[:,:])"],
"(m,n),(n,p)->(m,p)")
def f(a, b, result):
"""Fill-in *result* matrix such as result := a * b"""
...
```
如果其中一个参数应该是标量,则相应的布局规范是`()`,并且该参数将真正作为零维数组给出(您必须取消引用它才能获得标量值)。例如,具有可参数窗口宽度的[一维移动平均值](../user/examples.html#example-movemean)可以具有`"(n),()->(n)"`的布局串。
请注意,任何输出都将作为附加函数参数预先分配给您:您的代码必须使用您正在实现的函数的适当值填充它。
如果您的函数没有输出数组,则应省略布局字符串中的“箭头”(例如`"(n),(n)"`)。
也可以看看
Numpy 支持的[布局字符串](http://docs.scipy.org/doc/numpy/reference/c-api.generalized-ufuncs.html#details-of-signature)的规范。请注意,Numpy 使用术语“签名”,我们不幸地将其用于其他内容。
可以缓存已编译的函数以减少将来的编译时间。通过将 _ 缓存 _ 设置为 True 来启用它。只有“cpu”和“parallel”目标支持缓存。
```py
class numba.DUFunc
```
通过调用没有签名的 [`numba.vectorize()`](#numba.vectorize "numba.vectorize") 创建的对象类。
DUFunc 实例应该与 Numpy `ufunc`对象的行为类似,但有一个重要区别:调用时循环生成。当调用 ufunc 时,Numpy 会查看为该 ufunc 注册的现有循环,并且如果找不到一个无法安全地投射输入以适应的循环,则会引发`TypeError`。当呼叫 DUFunc 时,Numba 将呼叫委托给 Numpy。如果 Numpy ufunc 调用失败,那么 Numba 会尝试为给定的输入类型构建一个新循环,并再次调用 ufunc。如果第二次调用尝试失败或发生编译错误,则 DUFunc 将异常传递给调用者。
也可以看看
用户指南中的“[动态通用函数](../user/vectorize.html#dynamic-universal-functions)”部分演示了 [`DUFunc`](#numba.DUFunc "numba.DUFunc") 的调用时间行为,并讨论了调用顺序对 Numba 如何生成基础`ufunc`的影响。
```py
ufunc
```
实际的 Numpy `ufunc`对象由 [`DUFunc`](#numba.DUFunc "numba.DUFunc") 实例构建。请注意, [`DUFunc`](#numba.DUFunc "numba.DUFunc") 对象维护了正确的 ufunc 功能所需的几个重要数据结构(特别是动态编译的循环)。用户不应传递`ufunc`值而不确保底层 [`DUFunc`](#numba.DUFunc "numba.DUFunc") 不会被垃圾收集。
```py
nin
```
DUFunc(ufunc)输入的数量。见 [ufunc.nin](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.nin.html#numpy.ufunc.nin) 。
```py
nout
```
DUFunc 输出的数量。见 [ufunc.nout](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.nout.html#numpy.ufunc.nout) 。
```py
nargs
```
可能的 DUFunc 参数总数(应为 [`nin`](#numba.DUFunc.nin "numba.DUFunc.nin") + [`nout`](#numba.DUFunc.nout "numba.DUFunc.nout") )。见 [ufunc.nargs](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.nargs.html#numpy.ufunc.nargs) 。
```py
ntypes
```
DUFunc 支持的输入类型数。见 [ufunc.ntypes](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.ntypes.html#numpy.ufunc.ntypes) 。
```py
types
```
以字符串形式提供的受支持类型的列表。见 [ufunc.types](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.types.html#numpy.ufunc.types) 。
```py
identity
```
使用 ufunc 作为缩减时的标识值。见 [ufunc.identity](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.identity.html#numpy.ufunc.identity) 。
```py
reduce(A, *, axis, dtype, out, keepdims)
```
通过沿一个轴应用 DUFunc,将 _A_ 的尺寸减一。见 [ufunc.reduce](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.reduce.html#numpy.ufunc.reduce) 。
```py
accumulate(A, *, axis, dtype, out)
```
累积将运算符应用于所有元素的结果。见 [ufunc.accumulate](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.accumulate.html#numpy.ufunc.accumulate) 。
```py
reduceat(A, indices, *, axis, dtype, out)
```
在单个轴上使用指定切片执行(局部)缩减。见 [ufunc.reduceat](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.reduceat.html#numpy.ufunc.reduceat) 。
```py
outer(A, B)
```
将 ufunc 应用于所有对( _a_ , _b_ )与 _a_ 在 _A_ 和 _b_ 中 _B_ 。见 [ufunc.outer](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.outer.html#numpy.ufunc.outer) 。
```py
at(A, indices, *, B)
```
对 _ 索引 _ 指定的元素在操作数 _A_ 上执行无缓冲就位操作。如果您使用的是 Numpy 1.7 或更早版本,则此方法将不存在。见 [ufunc.at](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ufunc.at.html#numpy.ufunc.at) 。
注意
在极少数情况下,矢量化函数可能会显示[意外警告或错误](fpsemantics.html#ufunc-fpu-errors)。
## 2.2.5。 C 回调
```py
@numba.cfunc(signature, nopython=False, cache=False, locals={})
```
即时编译修饰函数以生成高效的机器代码。编译后的代码包含在一个瘦 C 回调中,使得它可以使用自然的 C ABI 进行调用。
_ 签名 _ 是表示 C 回调签名的单个签名。它必须与 [`jit()`](#numba.jit "numba.jit") 中的形式相同。装饰器不会检查签名中的类型是否在 C 中具有明确定义的表示。
_nopython_ 和 _ 缓存 _ 是布尔标志。 _locals_ 是局部变量名称到[类型和签名](types.html#numba-types)的映射。它们都与 [`jit()`](#numba.jit "numba.jit") 中的含义相同。
装饰器返回 [`CFunc`](#CFunc "CFunc") 对象。
注意
C 回调目前不支持[对象模式](../glossary.html#term-object-mode)。
```py
class CFunc
```
由 [`cfunc()`](#numba.cfunc "numba.cfunc") 创建的对象类。 [`CFunc`](#CFunc "CFunc") 对象公开以下属性和方法:
```py
address
```
已编译的 C 回调的地址,为整数。
```py
cffi
```
一个 [cffi](https://cffi.readthedocs.org/) 函数指针实例,作为参数传递给 [cffi](https://cffi.readthedocs.org/) - 包装函数。指针的类型是`void *`,因此只有在将其传递给 [cffi](https://cffi.readthedocs.org/) 时才会进行最小类型检查。
```py
ctypes
```
一个 [`ctypes`](https://docs.python.org/3/library/ctypes.html#module-ctypes "(in Python v3.7)") 回调实例,好像它是使用 [`ctypes.CFUNCTYPE()`](https://docs.python.org/3/library/ctypes.html#ctypes.CFUNCTYPE "(in Python v3.7)") 创建的。
```py
native_name
```
已编译的 C 回调的名称。
```py
inspect_llvm()
```
返回为 C 回调生成的人类可读的 LLVM IR。 [`native_name`](#CFunc.native_name "CFunc.native_name") 是在 IR 中定义此回调的名称。
- 1. 用户手册
- 1.1。 Numba 的约 5 分钟指南
- 1.2。概述
- 1.3。安装
- 1.4。使用@jit 编译 Python 代码
- 1.5。使用@generated_jit 进行灵活的专业化
- 1.6。创建 Numpy 通用函数
- 1.7。用@jitclass 编译 python 类
- 1.8。使用@cfunc 创建 C 回调
- 1.9。提前编译代码
- 1.10。使用@jit 自动并行化
- 1.11。使用@stencil装饰器
- 1.12。从 JIT 代码 中回调到 Python 解释器
- 1.13。性能提示
- 1.14。线程层
- 1.15。故障排除和提示
- 1.16。常见问题
- 1.17。示例
- 1.18。会谈和教程
- 2. 参考手册
- 2.1。类型和签名
- 2.2。即时编译
- 2.3。提前编译
- 2.4。公用事业
- 2.5。环境变量
- 2.6。支持的 Python 功能
- 2.7。支持的 NumPy 功能
- 2.8。与 Python 语义的偏差
- 2.9。浮点陷阱
- 2.10。 Python 2.7 寿命终止计划
- 3. 用于 CUDA GPU 的 Numba
- 3.1。概述
- 3.2。编写 CUDA 内核
- 3.3。内存管理
- 3.4。编写设备功能
- 3.5。 CUDA Python 中支持的 Python 功能
- 3.6。支持的原子操作
- 3.7。随机数生成
- 3.8。设备管理
- 3.10。示例
- 3.11。使用 CUDA 模拟器 调试 CUDA Python
- 3.12。 GPU 减少
- 3.13。 CUDA Ufuncs 和广义 Ufuncs
- 3.14。共享 CUDA 内存
- 3.15。 CUDA 阵列接口
- 3.16。 CUDA 常见问题
- 4. CUDA Python 参考
- 4.1。 CUDA 主机 API
- 4.2。 CUDA 内核 API
- 4.3。内存管理
- 5. 用于 AMD ROC GPU 的 Numba
- 5.1。概述
- 5.2。编写 HSA 内核
- 5.3。内存管理
- 5.4。编写设备功能
- 5.5。支持的原子操作
- 5.6。代理商
- 5.7。 ROC Ufuncs 和广义 Ufuncs
- 5.8。示例
- 6. 扩展 Numba
- 6.1。高级扩展 API
- 6.2。低级扩展 API
- 6.3。示例:间隔类型
- 7. 开发者手册
- 7.1。贡献给 Numba
- 7.2。 Numba 建筑
- 7.3。多态调度
- 7.4。关于发电机的注意事项
- 7.5。关于 Numba Runtime 的注意事项
- 7.6。使用 Numba Rewrite Pass 获得乐趣和优化
- 7.7。实时变量分析
- 7.8。上市
- 7.9。模板注释
- 7.10。关于自定义管道的注意事项
- 7.11。环境对象
- 7.12。哈希 的注意事项
- 7.13。 Numba 项目路线图
- 8. Numba 增强建议
- 9. 术语表