NumPy

✍ dations ◷ 2025-07-04 09:03:31 #NumPy

NumPy是Python语言的一个扩展程序库。支持高阶大规模的多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

尽管很早就受到了科学界和工业界的关注,但Python最初并不是为数值计算设计的。1995年,特殊兴趣小组(Special Interest Group,SIG)Matrix-sig成立,其目的是设计一个数组计算包。Matrix-sig的成员中有Python的设计者和维护者吉多·范罗苏姆,他扩展了Python的语法(特别是索引语法),使数组计算更容易。

矩阵包Numeric由Jim Fulton实现,并由Jim Hugunin推广, (也称Numerical Python extensions或 NumPy)。Jim Hugunin 是麻省理工学院的研究生,:10 于1997年加入国家研究计划公司(英语:Corporation_for_National_Research_Initiatives)从事JPython的研发,劳伦斯利弗莫尔国家实验室的Paul Dubois接任维护者。:10其他早期贡献者包括David Ascher, Konrad Hinsen和Travis Oliphant。:10

Numarray是作为Numeric的替代品被开发出来的,现已废弃。相比于Numeric,Numarray处理大数组速度较快,然而处理小数组速度较慢,因此有一段时间这两个包被并行使用于不同情况。Numeric的最后一个版本(v24.2)于2005年11月11日发布;Numarray的最后一个版本(v1.5.2)于2006年8月24日发布。

有人希望将Numeric纳入Python标准库,但吉多·范罗苏姆认为,在当时的情况下,代码难以维护。

2005年初,NumPy的开发者Travis Oliphant希望社区的不同数组包可以统一。他将Numarray的功能移植到Numeric上,并于2006将结果作为NumPy 1.0发布。这个新项目是SciPy的一部分。为了避免在只需数组计算的情况下安装庞大的SciPy包,新包以NumPy的名义被分离出来。2011年,NumPy的1.5.0版本加入了对Python 3的支持。

2011年,PyPy开始开发NumPy API,但它尚未与NumPy完全兼容。

NumPy参考CPython(一个使用字节码的解释器),而在这个Python实现解释器上所写的数学算法代码通常远比编译过的相同代码要来得慢。为了解决这个难题,NumPy引入了多维数组以及可以直接有效率地操作多维数组的函数与运算符。因此在NumPy上只要能被表示为针对数组或矩阵运算的算法,其执行效率几乎都可以与编译过的等效C语言代码一样快。

NumPy提供了与MATLAB相似的功能与操作方式,因为两者皆为解释型语言,并且都可以让用户在针对数组或矩阵运算时提供较标量运算更快的性能。两者相较之下,MATLAB提供了大量的扩展工具箱(例如Simulink);而NumPy则是根基于Python这个更现代、完整并且开放源代码的编程语言之上。此外NumPy也可以结合其它的Python扩展库。例如SciPy,这个库提供了更多与MATLAB相似的功能;以及Matplotlib,这是一个与MATLAB内置绘图功能类似的库。而从本质上来说,NumPy与MATLAB同样是利用BLAS与LAPACK来提供高效率的线性代数运算。

NumPy的核心功能是ndarray(即-dimensional array,多维数组)数据结构。这是一个表示多维度、同质并且固定大小的数组对象。而由一个与此数组相关系的资料类型对象来描述其数组元素的资料格式(例如其字符组顺序、在存储器中占用的字符组数量、整数或者浮点数等等)。

在数组中插入或追加元素并不像Python的list一样简单。np.pad(...)实际上创建了新的具有目标形状和填充值的数组,将给定数组的值复制到新数组中并返回新数组。np.concatenate()并没有直接连接两个数组,而是返回新的数组,该数组填充了两个原数组的值。用np.reshape(...)改变量组的维度只有在数组中元素数量不变的情况下才能实现。造成以上情况的原因是NumPy的数组必须占用连续的内存空间。Blaze包尝试克服这个限制。

未经矢量化的算法通常运行缓慢,因为它们必须用纯Python方法实现;由于需要创建和输入等大的临时数组,部分操作的矢量化可能会增长其空间复杂度(例如由常数增长到线性)。部分小组通过运行时编译(Runtime compilation of numerical code)避免这一问题。可与NumPy集成的开源解决方案包括 numexpr和Numba。Cython和Pythran是静态编译的解决方案。

许多现代大型科学计算应用的要求超出了NumPy数组的能能力。例如,NumPu数组通常加载到计算机的内存中,然而内存可能没有足够的容量;此外,NumPy仅在单个CPU上进行操作,而许多线性代数算子可以通过CPU的集群和其它特殊硬件(例如GPU、TPU,部分深度学习应用也依赖于这些特殊硬件)来加速。因此,近期在Python的生态中出现了许多其它工具,例如用于分布式数组的Dask(英语:Dask)、用于GPU计算的TensorFlow和JAX等。这些库通常实现或模仿NumPy的部分API,因此用户不需大量改动就可以部署原先使用NumPy的程序。近期出现的由Nuidia的CUDA架构加速的CuPy(英语:CuPy)库展示了快速计算的潜力,是NumPy的直接替代品。

相关

  • 广场恐怖症广场恐怖症是一种焦虑症,其特征是人们认为环境不安全并且不容易逃离而产生焦虑症状。 这些情况可能包括开放空间、公共交通、商场,或仅仅是在自家外 ,在这些情况下可能会导致恐
  • 联邦内务部俄罗斯联邦内务部(俄罗斯文:Министерство внутренних дел,缩写:МВД),俄罗斯联邦政府组成部门之一。为负责维持俄罗斯国内治安的执法机关,俄罗斯联邦内
  • 一夫一妻制单配偶制包含一夫一妻制,是指一种两两配对,每个个体只拥有单一配偶的关系,关系中两者一生中,或在生命中任何一个时间,只会与对方维持关系。单配偶制有别于多配偶制。单配偶制在动
  • 圣名大学圣名大学(Holy Names University)是位于美国加利福尼亚州奥克兰的一所私立大学,2015年《美国新闻与世界报道》 “西部地区大学”排名中排在第68位。其历史可追溯到1868年来自魁
  • 苏联民航3352号班机空难苏联民航3352号班机是一班由苏联克拉斯诺达尔飞往新西伯利亚,中停鄂木斯克的国内航班。1984年10月11日,一架编号为CCCP-85243的图-154客机执行由克拉斯诺达尔至鄂木斯克航段时
  • 上维勒峰坐标:47°06′29″N 11°10′24″E / 47.10806°N 11.17333°E / 47.10806; 11.17333上维勒峰(德语:Hohe Villerspitze),是奥地利的山峰,位于该国西部,由蒂罗尔州负责管辖,属于斯图
  • 夏达河夏达河(英语:Sharda River;印地语:शारदा नदी, ),又名马哈卡里河(英语:Mahakali River;尼泊尔语:महाकाली नदी, ),是恒河支流加格拉河的支流,其中、上游河段为印度、尼泊
  • 巴里州巴里州(索马里语:Bari)是索马里东北部的一个州,北临亚丁湾,东临印度洋。哈丰角是非洲的最东端。面积70,088平方公里。首府博萨索。目前由邦特兰所控制。
  • 乌尔金乌尔金·加尔玛耶维奇·加尔玛耶夫 (蒙古语: ᠭᠠᠷᠮ᠎ᠠ ᠶᠢᠨ ᠥᠷᠵᠢᠨ,汉字: 乌尔金 , 俄语:Уржин Гармаевич Гармаев,1880年代1888年/1889年-1
  • UiO-67UiO-67是一种金属有机框架材料,化学式为C84H52O32Zr6,它由4,4'-联苯二甲酸的有机骨架链接锆结点而成。UiO为奥斯陆大学挪威语(Universitetet i Oslo)的缩写。它可由4,4'-联苯二甲酸和四氯化锆在,-二甲基甲酰胺溶剂中于120°C反应得到。UiO-67的热分解产物是ZrO2。它可用于催化、光催化等领域。