如何扩展NumPy

That which is static and repetitive is boring. That which is dynamic and random is confusing. In between lies art.
— John A. Locke

Science is a differential equation. Religion is a boundary condition.
— Alan Turing

编写扩展模块

虽然ndarray对象旨在允许在Python中进行快速计算，但它也被设计为通用的并且满足各种各样的计算需求。因此，如果绝对速度是必不可少的，那么就不能替换特定于您的应用程序和硬件的精心编制的循环。这是numpy包含f2py的原因之一，因此可以使用易于使用的机制将（简单的）C / C ++和（任意）Fortran代码直接链接到Python中。我们鼓励您使用和改进此机制。本节的目的不是记录此工具，而是记录编写此工具所依赖的扩展模块的更基本步骤。

当扩展模块被编写，编译并安装到Python路径（sys.path）中的某个位置时，可以将代码导入到Python中，就好像它是标准的python文件一样。它将包含已在C代码中定义和编译的对象和方法。在Python中执行此操作的基本步骤已有详细记录，您可以在www.python.orgopen in new window上的在线文档中找到更多信息。

除了Python C-API之外，NumPy还有一个完整而丰富的C-API，允许在C级上进行复杂的操作。但是，对于大多数应用程序，通常只使用少量API调用。如果你需要做的就是提取一个指向内存的指针以及一些形状信息以传递给另一个计算例程，那么你将使用非常不同的调用，然后如果你试图创建一个类似于数组的新类型或添加一个新数据ndarrays的类型。本章介绍了最常用的API调用和宏。

必需的子程序

必须在C代码中定义一个函数才能使Python将其用作扩展模块。该函数必须被称为init {name}，其中{name}是Python中模块的名称。必须声明此函数，以便对例程外部的代码可见。除了添加您想要的方法和常量之外，此子例程还必须包含调用import_array() 和/或import_ufunc()取决于需要哪个C-API。只要实际调用任何C-API子例程，忘记放置这些命令就会将自身显示为一个丑陋的分段错误（崩溃）。实际上，在单个文件中可以有多个init {name}函数，在这种情况下，该文件将定义多个模块。但是，有一些技巧可以让它正常工作，这里没有涉及。

一个最小的init{name}方法看起来像：

PyMODINIT_FUNC
init{name}(void)
{
   (void)Py_InitModule({name}, mymethods);
   import_array();
}

mymethods必须是PyMethodDef结构的数组（通常是静态声明的），它包含方法名，实际的C函数，指示方法是否使用关键字参数的变量，以及docstrings。这些将在下一节中介绍。如果要向模块添加常量，则存储Py_InitModule的返回值，Py_InitModule是一个模块对象。向模块添加项目的最常用方法是使用PyModule_GetDict（模块）获取模块字典。使用模块字典，您可以手动将任何您喜欢的内容添加到模块中。向模块添加对象的更简单方法是使用三个额外的Python C-API调用之一，这些调用不需要单独提取模块字典。这些内容记录在Python文档中，但为方便起见，在此处重复：

int PyModule_AddObject（PyObjectopen in new window * module ，char * name ，PyObjectopen in new window * value ）¶

int PyModule_AddIntConstant（PyObjectopen in new window * module ，char * name ，long value ）¶

int PyModule_AddStringConstant（PyObjectopen in new window * module ，char * name ，char * value ）¶

所有这三个函数都需要模块对象（Py_InitModule的返回值）。该名称是标签模块中的值的字符串。根据调用的函数， value 参数是一般对象（PyModule_AddObject窃取对它的引用），整数常量或字符串常量。

定义函数

传递给Py_InitModule函数的第二个参数是一个结构，可以很容易地在模块中定义函数。在上面给出的示例中，mymethods结构将在文件的早期（通常在init {name}子例程之前）定义为：

static PyMethodDef mymethods[] = {
    { nokeywordfunc,nokeyword_cfunc,
      METH_VARARGS,
      Doc string},
    { keywordfunc, keyword_cfunc,
      METH_VARARGS|METH_KEYWORDS,
      Doc string},
    {NULL, NULL, 0, NULL} /* Sentinel */
}

mymethods数组中的每个条目都是一个PyMethodDefopen in new window结构，包含1）Python名称，2）实现函数的C函数，3）指示是否接受此函数的关键字的标志，以及4）函数的文档字符串。通过向该表添加更多条目，可以为单个模块定义任意数量的功能。最后一个条目必须全部为NULL，如图所示充当哨兵。Python查找此条目以了解已定义模块的所有函数。

完成扩展模块必须做的最后一件事是实际编写执行所需功能的代码。有两种函数：不接受关键字参数的函数和那些函数。

没有关键字参数的函数

不接受关键字参数的函数应写为：

static PyObject*
nokeyword_cfunc (PyObject *dummy, PyObject *args)
{
    /* convert Python arguments */
    /* do function */
    /* return something */
}

伪参数不在此上下文中使用，可以安全地忽略。该 ARGS 参数包含所有的传递给函数作为一个元组的参数。此时您可以执行任何操作，但通常管理输入参数的最简单方法是调用PyArg_ParseTupleopen in new window（args，format_string，addresses_to_C_variables ...）或PyArg_UnpackTupleopen in new window（元组，“名称”，分钟，最大，......）。有关如何使用第一个函数的详细说明，请参见Python C-API参考手册第5.5节（解析参数和构建值）。您应该特别注意使用转换器函数在Python对象和C对象之间进行的“O＆”格式。所有其他格式函数都可以（大部分）被认为是这个一般规则的特殊情况。NumPy C-API中定义了几种可能有用的转换器功能。特别是，该PyArray_DescrConverteropen in new window 函数对于支持任意数据类型规范非常有用。此函数将任何有效的数据类型Python对象转换为对象。请记住传入应填写的C变量的地址。PyArray_Descr *open in new window

有很多关于如何在PyArg_ParseTupleopen in new window 整个NumPy源代码中使用的示例。标准用法是这样的：

PyObject *input;
PyArray_Descr *dtype;
if (!PyArg_ParseTuple(args, "OO&", &input,
                      PyArray_DescrConverter,
                      &dtype)) return NULL;

请务必记住，在使用“O”格式字符串时，您会获得对该对象的借用引用。但是，转换器功能通常需要某种形式的内存处理。在此示例中，如果转换成功，则 dtype 将保持对对象的新引用，而输入将保留借用的引用。因此，如果此转换与另一个转换（比如整数）混合并且数据类型转换成功但整数转换失败，那么您需要在返回之前将引用计数释放到数据类型对象。一种典型的方法是在调用之前将 dtype 设置为，然后在 dtype上 使用PyArray_Descr *open in new window ** ** NULLPyArg_ParseTupleopen in new window Py_XDECREFopen in new window ** 回来之前。

处理完输入参数后，将编写实际完成工作的代码（可能会根据需要调用其他函数）。C函数的最后一步是返回一些东西。如果遇到错误，NULL则应返回（确保实际设置了错误）。如果不应返回任何内容，则递增 Py_Noneopen in new window并返回它。如果应该返回单个对象，则返回它（确保您首先拥有对它的引用）。如果应该返回多个对象，那么您需要返回一个元组。该Py_BuildValueopen in new window（format_string，c_variables ...）函数可以很容易地从C变量构建Python对象的元组。请特别注意格式字符串中“N”和“O”之间的区别，否则您可能很容易造成内存泄漏。'O'格式字符串增加它对应的C变量的引用计数，而'N'格式字符串窃取对相应C变量的引用。如果已经为对象创建了引用并且只想对元组进行引用，则应使用“N”。如果您只有一个对象的借用引用并且需要创建一个来提供元组，则应该使用“O”。PyObject *open in new window PyObject *open in new window

带关键字参数的函数

这些函数与没有关键字参数的函数非常相似。唯一的区别是函数签名是：

static PyObject*
keyword_cfunc (PyObject *dummy, PyObject *args, PyObject *kwds)
{
...
}

kwds参数包含一个Python字典，其键是关键字参数的名称，其值是相应的关键字参数值。无论你认为合适，都可以处理这本字典。然而，处理它的最简单方法是PyArg_ParseTupleopen in new window用PyArg_ParseTupleAndKeywordsopen in new window（args，kwds，format_string，char * kwlist []，地址......）调用替换（args，format_string，addresses ...）函数。此函数的kwlist参数是一个NULL字符串数组，提供了预期的关键字参数。format_string中的每个条目都应该有一个字符串。如果传入无效的关键字参数，则使用此函数将引发TypeError。

有关此功能的更多帮助，请参阅Python文档中的扩展和嵌入教程的第1.8节（扩展函数的关键字参数）。

引用计数

编写扩展模块时最大的困难是引用计数。这是f2py，weave，Cython，ctypes等受欢迎的重要原因。如果您错误处理引用计数，则可能会出现从内存泄漏到分段错误的问题。我知道处理参考计数的唯一策略是血液，汗水和眼泪。首先，你强迫每个Python变量都有一个引用计数。然后，您可以准确了解每个函数对对象的引用计数的作用，以便在需要时可以正确使用DECREF和INCREF。引用计数可以真正测试您对编程工艺的耐心和勤奋程度。尽管形象严峻，大多数引用计数的情况非常简单，最常见的困难是由于某些错误而在从例程退出之前不在对象上使用DECREF。第二，是不会在传递给将要窃取引用的函数或宏的对象上拥有引用的常见错误（例如 PyTuple_SET_ITEMopen in new window，和大多数采取PyArray_Descropen in new window对象的功能）。

通常，在创建变量时会获得对变量的新引用，或者是某个函数的返回值（但是有一些突出的例外 - 例如从元组或字典中获取项目）。当您拥有引用时，您有责任确保Py_DECREFopen in new window在不再需要该变量时调用（var）（并且没有其他函数“窃取”其引用）。此外，如果您将Python对象传递给将“窃取”引用的函数，那么您需要确保拥有它（或用于Py_INCREFopen in new window获取自己的引用）。您还将遇到借用参考的概念。借用引用的函数不会改变对象的引用计数，也不会期望“保持”引用。它只是暂时使用该对象。当你使用PyArg_ParseTupleopen in new window或者 PyArg_UnpackTupleopen in new window您收到对元组中对象的借用引用，不应更改其函数内的引用计数。通过练习，您可以学会正确引用计数，但一开始可能会令人沮丧。

引用计数错误的一个常见来源是Py_BuildValueopen in new window 函数。请特别注意'N'格式字符和'O'格式字符之间的区别。如果在子例程中创建一个新对象（例如输出数组），并且在返回值的元组中将其传回，则最应该使用“N”格式字符。Py_BuildValueopen in new window。“O”字符将引用计数增加1。这将为调用者提供一个全新数组的两个引用计数。删除变量并且引用计数减1时，仍会有额外的引用计数，并且永远不会释放该数组。您将有一个引用计数引起的内存泄漏。使用'N'字符将避免这种情况，因为它将使用单个引用计数返回给调用者一个对象（在元组内）。

处理数组对象

NumPy的大多数扩展模块都需要访问ndarray对象（或其中一个子类）的内存。最简单的方法不需要您了解NumPy的内部结构。方法是

确保处理的是行为良好的数组(按机器字节顺序和单段对齐)，具有正确的维数类型和数量。
1. 通过使用PyArray_FromAny或在其上构建的宏将其从某个Python对象转换。
2. 通过使用PyArray_NewFromDescr或基于它的更简单的宏或函数构建所需形状和类型的新ndarray。
获取数组的形状和指向其实际数据的指针。
将数据和形状信息传递给子例程或实际执行计算的其他代码部分。
如果您正在编写算法，那么我建议您使用数组中包含的步幅信息来访问数组的元素(PyArray_GetPtr宏使这一过程变得轻松)。然后，您可以放松您的要求，这样就不会强制使用单段数组和可能导致的数据复制。

这些子主题中的每一个都会在下面的小节中介绍。

转换任意序列对象

从任何可以转换为数组的Python对象获取数组的主程序是PyArray_FromAnyopen in new window。这个函数非常灵活，有许多输入参数。几个宏使它更容易使用基本功能。PyArray_FROM_OTFopen in new window可以说是最常用的这些宏中最有用的。它允许您将任意Python对象转换为特定内置数据类型（例如 float）的数组，同时指定一组特定的需求（ 例如， 连续，对齐和可写）。语法是

PyArray_FROM_OTFopen in new window
从任何可以转换为数组的 Python 对象 obj 返回 ndarray。返回数组中的维数由对象确定。返回数组的所需数据类型在 typenum 中提供，它应该是枚举类型之一。对返回数组的*要求（requirements）*可以是标准数组标志的任意组合。下面将更详细地解释这些论点中的每一个。成功后，您将收到对数组的新引用。如果失败，则返回 NULL 并设置异常。
- obj
  该对象可以是任何可转换为ndarray的Python对象。如果对象已经是满足要求的ndarray的子类，则返回一个新的引用。否则，构造一个新的数组。除非使用数组接口，否则将obj的内容复制到新数组，以便不必复制数据。可以转换为数组的对象包括： 1)任何嵌套的Sequence对象， 2)暴露数组接口的任何对象， 3)具有数组方法的任何对象(应该返回ndarray)，以及4)任何标量对象(变成零维数组)。否则符合要求的ndarray的子类将被传递。如果要确保基类ndarray，则在Requirements标志中使用 NPY_ARRAY_ENSUREARRAYopen in new window。只有在必要时才会制作副本。如果要保证复制，则将 NPY_ARRAY_ENSURECOPYopen in new window 传递给Requirements标志。
- typenum
  枚举类型之一或NPY_NOTYPEopen in new window(如果数据类型应从对象本身确定)。可以使用基于C的名称：
  NPY_BOOLopen in new window, NPY_BYTEopen in new window, NPY_UBYTEopen in new window, NPY_SHORTopen in new window, NPY_USHORTopen in new window, NPY_INTopen in new window, NPY_UINTopen in new window, NPY_LONGopen in new window, NPY_ULONGopen in new window, NPY_LONGLONGopen in new window, NPY_ULONGLONGopen in new window, NPY_DOUBLEopen in new window, NPY_LONGDOUBLEopen in new window, NPY_CFLOATopen in new window, NPY_CDOUBLEopen in new window, NPY_CLONGDOUBLEopen in new window, NPY_OBJECTopen in new window.
  或者，可以使用平台上支持的位宽名称。例如：
  NPY_INT8open in new window, NPY_INT16open in new window, NPY_INT32open in new window, NPY_INT64open in new window, NPY_UINT8open in new window, NPY_UINT16open in new window, NPY_UINT32open in new window, NPY_UINT64open in new window, NPY_FLOAT32open in new window, NPY_FLOAT64open in new window, NPY_COMPLEX64open in new window, NPY_COMPLEX128open in new window.
  仅当可以在不丢失精度的情况下完成时，对象才会转换为所需的类型。否则将返回 NULL 并引发错误。在Requirements标志中使用 NPY_ARRAY_FORCECASTopen in new window 覆盖此行为。
- requirements
  ndarray的存储器模型允许每个维度上的任意步幅前进到数组的下一个元素。然而，通常需要与需要C连续或Fortran连续内存布局的代码进行接口。此外，ndarray可能未对齐(元素的地址不是元素大小的整数倍)，如果您尝试将指针取消引用到数组数据，这可能会导致程序崩溃(或至少工作速度更慢)。这两个问题都可以通过将Python对象转换为一个数组来解决，该数组对于您的特定用法来说更“表现良好”。
  Requirements标志允许指定哪种类型的数组是可接受的。如果传入的对象不满足此要求，则创建一个副本，以便返回的对象将满足这些要求。这些ndarray可以使用非常通用的内存指针。此标志允许指定返回的数组对象的所需属性。在详细的API一章中解释了所有的标志。最常用的标志是 NPY_ARRAY_IN_ARRAYopen in new window、NPY_OUT_ARRAYopen in new window、and NPY_ARRAY_INOUT_ARRAYopen in new window:
  NPY_ARRAY_IN_ARRAYopen in new window
  此标志对于必须按C连续顺序和对齐的数组非常有用。这些类型的数组通常是某些算法的输入数组。
  NPY_ARRAY_OUT_ARRAYopen in new window
  此标志用于指定C连续顺序的数组，该数组是对齐的，并且也可以写入。这样的数组通常作为输出返回(尽管通常这样的输出数组是从头开始创建的)。
  NPY_ARRAY_INOUT_ARRAYopen in new window
  此标志用于指定将用于输入和输出的数组。必须在接口例程末尾的 Py_DECREFopen in new window 之前调用 PyArray_ResolveWritebackIfCopyopen in new window ，以将临时数据写回传入的原始数组。使用 NPY_ARRAY_WRITEBACKIFCOPYopen in new window 或 NPY_ARRAY_UPDATEIFCOPYopen in new window 标志要求输入对象已经是数组(因为其他对象不能以这种方式自动更新)。如果发生错误，请在设置了这些标志的数组上使用 PyArray_DiscardWritebackIfCopyopen in new window(obj)。这将设置底层基本数组可写，而不会导致内容复制回原始数组。
  可以作为附加要求进行OR运算的其他有用标志包括：
  NPY_ARRAY_FORCECASTopen in new window
  强制转换为所需的类型，即使在不丢失信息的情况下也是如此。
  NPY_ARRAY_ENSURECOPYopen in new window
  确保生成的数组是原始数组的副本。
  NPY_ARRAY_ENSUREARRAYopen in new window
  确保生成的对象是实际的ndarray，而不是子类。

注意

数组是否进行字节交换取决于数组的数据类型。始终请求本机字节顺序数组PyArray_FROM_OTFopen in new window，因此NPY_ARRAY_NOTSWAPPEDopen in new windowrequire参数中不需要标志。也无法从此例程中获取字节交换数组。

创建一个全新的ndarray

通常，必须在扩展模块代码中创建新数组。也许需要输出数组，并且您不希望调用者必须提供它。也许只需要一个临时数组来进行中间计算。无论需要什么，都需要简单的方法来获得任何数据类型的ndarray对象。这样做最常见的功能是PyArray_NewFromDescropen in new window。所有数组创建函数都经过这个重复使用的代码。由于其灵活性，使用起来可能有点混乱。结果，存在更易于使用的更简单的形式。这些表单是PyArray_SimpleNewopen in new window函数族的一部分，它通过为常见用例提供默认值来简化界面。

获取ndarray内存并访问ndarray的元素

如果obj是一个 ndarray()，那么ndarray 的数据区域由void 指针（obj）或char 指针（obj）指向。请记住（通常）此数据区域可能未根据数据类型对齐，它可能表示字节交换数据，和/或可能无法写入。如果数据区域是对齐的并且是以本机字节顺序排列的，那么如何获取数组的特定元素只能由npy_intp变量数组（obj）确定。特别是，这个整数的c数组显示了必须向当前元素指针添加多少字节才能到达每个维度中的下一个元素。对于小于4维的数组，有PyArrayObject *open in new window PyArray_DATAopen in new window PyArray_BYTESopen in new window PyArray_STRIDESopen in new window**PyArray_GETPTR{k} （obj，...）宏，其中{k}是整数1,2,3或4，这使得使用数组步幅更容易。争论...... 将{k}非负整数索引表示到数组中。例如，假设E是一个三维的ndarray。E[i,j,k] 获得元素的（void *）指针作为PyArray_GETPTR3open in new window（E，i，j，k）。

如前所述，C风格的连续数组和Fortran风格的连续数组具有特定的跨步模式。两个数组标志（NPY_ARRAY_C_CONTIGUOUSopen in new window和NPY_ARRAY_F_CONTIGUOUSopen in new window）表示特定数组的跨步模式是否与C风格的连续或Fortran风格的连续匹配或两者都不匹配。可以使用PyArray_IS_C_CONTIGUOUSopen in new window（obj）和() 来测试跨步模式是否匹配标准C或FortranPyArray_ISFORTRANopen in new window（obj）分别。大多数第三方库都期望连续的数组。但是，通常支持通用跨越并不困难。我鼓励您尽可能在自己的代码中使用跨步信息，并保留包裹第三方代码的单段要求。使用与ndarray一起提供的跨步信息而不是需要连续的跨步减少了必须进行的复制。

示例

以下示例显示了如何编写一个包含两个输入参数（将转换为数组）和输出参数（必须是数组）的包装器。该函数返回None并更新输出数组。请注意NumPy v1.14及更高版本的WRITEBACKIFCOPY语义的更新使用

static PyObject *
example_wrapper(PyObject *dummy, PyObject *args)
{
    PyObject *arg1=NULL, *arg2=NULL, *out=NULL;
    PyObject *arr1=NULL, *arr2=NULL, *oarr=NULL;

    if (!PyArg_ParseTuple(args, "OOO!", &arg1, &arg2,
        &PyArray_Type, &out)) return NULL;

    arr1 = PyArray_FROM_OTF(arg1, NPY_DOUBLE, NPY_ARRAY_IN_ARRAY);
    if (arr1 == NULL) return NULL;
    arr2 = PyArray_FROM_OTF(arg2, NPY_DOUBLE, NPY_ARRAY_IN_ARRAY);
    if (arr2 == NULL) goto fail;
#if NPY_API_VERSION >= 0x0000000c
    oarr = PyArray_FROM_OTF(out, NPY_DOUBLE, NPY_ARRAY_INOUT_ARRAY2);
#else
    oarr = PyArray_FROM_OTF(out, NPY_DOUBLE, NPY_ARRAY_INOUT_ARRAY);
#endif
    if (oarr == NULL) goto fail;

    /* code that makes use of arguments */
    /* You will probably need at least
       nd = PyArray_NDIM(<..>)    -- number of dimensions
       dims = PyArray_DIMS(<..>)  -- npy_intp array of length nd
                                     showing length in each dim.
       dptr = (double *)PyArray_DATA(<..>) -- pointer to data.

       If an error occurs goto fail.
     */

    Py_DECREF(arr1);
    Py_DECREF(arr2);
#if NPY_API_VERSION >= 0x0000000c
    PyArray_ResolveWritebackIfCopy(oarr);
#endif
    Py_DECREF(oarr);
    Py_INCREF(Py_None);
    return Py_None;

 fail:
    Py_XDECREF(arr1);
    Py_XDECREF(arr2);
#if NPY_API_VERSION >= 0x0000000c
    PyArray_DiscardWritebackIfCopy(oarr);
#endif
    Py_XDECREF(oarr);
    return NULL;
}

# 如何扩展NumPy

# 编写扩展模块

# 必需的子程序

# 定义函数

# 没有关键字参数的函数

# 带关键字参数的函数

# 引用计数

# 处理数组对象

# 转换任意序列对象

# 创建一个全新的ndarray

# 获取ndarray内存并访问ndarray的元素

# 示例