NumPy

✍ dations ◷ 2025-11-03 20:39:19 #NumPy

NumPy是Python语言的一个扩展程序库。支持高阶大规模的多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

尽管很早就受到了科学界和工业界的关注,但Python最初并不是为数值计算设计的。1995年,特殊兴趣小组(Special Interest Group,SIG)Matrix-sig成立,其目的是设计一个数组计算包。Matrix-sig的成员中有Python的设计者和维护者吉多·范罗苏姆,他扩展了Python的语法(特别是索引语法),使数组计算更容易。

矩阵包Numeric由Jim Fulton实现,并由Jim Hugunin推广, (也称Numerical Python extensions或 NumPy)。Jim Hugunin 是麻省理工学院的研究生,:10 于1997年加入国家研究计划公司(英语:Corporation_for_National_Research_Initiatives)从事JPython的研发,劳伦斯利弗莫尔国家实验室的Paul Dubois接任维护者。:10其他早期贡献者包括David Ascher, Konrad Hinsen和Travis Oliphant。:10

Numarray是作为Numeric的替代品被开发出来的,现已废弃。相比于Numeric,Numarray处理大数组速度较快,然而处理小数组速度较慢,因此有一段时间这两个包被并行使用于不同情况。Numeric的最后一个版本(v24.2)于2005年11月11日发布;Numarray的最后一个版本(v1.5.2)于2006年8月24日发布。

有人希望将Numeric纳入Python标准库,但吉多·范罗苏姆认为,在当时的情况下,代码难以维护。

2005年初,NumPy的开发者Travis Oliphant希望社区的不同数组包可以统一。他将Numarray的功能移植到Numeric上,并于2006将结果作为NumPy 1.0发布。这个新项目是SciPy的一部分。为了避免在只需数组计算的情况下安装庞大的SciPy包,新包以NumPy的名义被分离出来。2011年,NumPy的1.5.0版本加入了对Python 3的支持。

2011年,PyPy开始开发NumPy API,但它尚未与NumPy完全兼容。

NumPy参考CPython(一个使用字节码的解释器),而在这个Python实现解释器上所写的数学算法代码通常远比编译过的相同代码要来得慢。为了解决这个难题,NumPy引入了多维数组以及可以直接有效率地操作多维数组的函数与运算符。因此在NumPy上只要能被表示为针对数组或矩阵运算的算法,其执行效率几乎都可以与编译过的等效C语言代码一样快。

NumPy提供了与MATLAB相似的功能与操作方式,因为两者皆为解释型语言,并且都可以让用户在针对数组或矩阵运算时提供较标量运算更快的性能。两者相较之下,MATLAB提供了大量的扩展工具箱(例如Simulink);而NumPy则是根基于Python这个更现代、完整并且开放源代码的编程语言之上。此外NumPy也可以结合其它的Python扩展库。例如SciPy,这个库提供了更多与MATLAB相似的功能;以及Matplotlib,这是一个与MATLAB内置绘图功能类似的库。而从本质上来说,NumPy与MATLAB同样是利用BLAS与LAPACK来提供高效率的线性代数运算。

NumPy的核心功能是ndarray(即-dimensional array,多维数组)数据结构。这是一个表示多维度、同质并且固定大小的数组对象。而由一个与此数组相关系的资料类型对象来描述其数组元素的资料格式(例如其字符组顺序、在存储器中占用的字符组数量、整数或者浮点数等等)。

在数组中插入或追加元素并不像Python的list一样简单。np.pad(...)实际上创建了新的具有目标形状和填充值的数组,将给定数组的值复制到新数组中并返回新数组。np.concatenate()并没有直接连接两个数组,而是返回新的数组,该数组填充了两个原数组的值。用np.reshape(...)改变量组的维度只有在数组中元素数量不变的情况下才能实现。造成以上情况的原因是NumPy的数组必须占用连续的内存空间。Blaze包尝试克服这个限制。

未经矢量化的算法通常运行缓慢,因为它们必须用纯Python方法实现;由于需要创建和输入等大的临时数组,部分操作的矢量化可能会增长其空间复杂度(例如由常数增长到线性)。部分小组通过运行时编译(Runtime compilation of numerical code)避免这一问题。可与NumPy集成的开源解决方案包括 numexpr和Numba。Cython和Pythran是静态编译的解决方案。

许多现代大型科学计算应用的要求超出了NumPy数组的能能力。例如,NumPu数组通常加载到计算机的内存中,然而内存可能没有足够的容量;此外,NumPy仅在单个CPU上进行操作,而许多线性代数算子可以通过CPU的集群和其它特殊硬件(例如GPU、TPU,部分深度学习应用也依赖于这些特殊硬件)来加速。因此,近期在Python的生态中出现了许多其它工具,例如用于分布式数组的Dask(英语:Dask)、用于GPU计算的TensorFlow和JAX等。这些库通常实现或模仿NumPy的部分API,因此用户不需大量改动就可以部署原先使用NumPy的程序。近期出现的由Nuidia的CUDA架构加速的CuPy(英语:CuPy)库展示了快速计算的潜力,是NumPy的直接替代品。

相关

  • 杜尚别杜尚别(塔吉克斯坦语:Душанбе / Duşanbe)是中亚国家塔吉克斯坦的首都,位于北纬38.5度、东经68.8度,人口在2000年统计约有53万6千人。又译做杜桑贝、杜夏贝、杜山比、杜尚
  • 报复报复,一般来说与复仇、报仇同义。报仇是一种道德或伦理方面的核心价值。在报复的过程中,报复者会产生一种罪恶的快感。有句话说道:有仇必报,是报复者的心态。而被报复人会遭到一
  • 王蓝王蓝(1922年9月3日-2003年10月9日),笔名果之,知名作家及艺术家,曾在原籍河北省阜城县当选为第一届国民大会代表。他的小说蓝与黑,描写抗战时期感人的烽火恋情,被誉为四大抗战小说之
  • 奥兰群岛面积以下资讯是以2017年估计国家领袖立国历史奥兰(瑞典语:Åland),又称阿赫韦南马(芬兰语:Ahvenanmaa),是位于波罗的海、波的尼亚湾入口处的一个群岛,也是芬兰的一个自治区,通用瑞典语
  • 吉多·巴达拉吉多·纳乌阿尔·巴达拉(西班牙语:Guido Nahuel Vadalá)(罗萨里奥,桑塔费省,阿根廷,1997年2月8日)是一名阿根廷足球运动员,现在效力于意大利足球甲级联赛球队尤文图斯。本页人名或地
  • 超自然9人组《超自然9人组》(日语:Occultic;Nine -オカルティック・ナイン-)是由志仓千代丸主创的多媒体作品,“超常科学NVL”企划的第一作,以超自然现象为主题。轻小说版由OVERLAP文库于201
  • 大坝河 (英罗港)大坝河,又称卖皂河,位于中华人民共和国华南地区,发源于广西壮族自治区博白县南部沙陂镇径口(老虎尾),西南流经荣飘村、飞洋村、大坝镇诸岭村、镇治、广东省廉江市高桥镇平山岗村、
  • 2000年乌兹别克斯坦总统选举伊斯拉木·卡里莫夫伊斯拉木·卡里莫夫乌兹别克斯坦政府与政治系列条目2000年乌兹别克斯坦总统选举于2000年1月9日在乌兹别克斯坦全国举行。时任总统伊斯拉木·卡里莫夫以95.7%的得票率获得连任。这次选举的投票率为95.1%。这次选举,乌兹别克斯坦将全国分为14个选区,设立投票站共计7721个。参与监督大选的有美国、俄罗斯、德国、日本等国的55名观察员及百名左右的外国记者。乌兹别克斯坦各党派、非政府组织也派出了1.5万名代表对大选进行监督。选前各媒体普遍看好卡里莫夫高票连任。民意调查也显示卡里莫夫胜选在望
  • 薄荷鼠尾草薄荷鼠尾草是唇形科的一种多年生灌木,原生于美国西部及亚利桑那州西北部等地,主要集中于大盆地南延至莫哈韦沙漠一带,生长在干燥、排水良好的土地上。
  • 布奇·哈蒙小克劳德·“布奇”·哈蒙(英语:Claude "Butch" Harmon Jr.,1943年8月24日-),美国高尔夫球教练、前职业球员,其父亲老克劳德·哈蒙(英语:Claude Harmon)是1948年美国名人赛冠军。布奇自1965年已经入行,他在2003年被《高尔夫文摘》评为美国最好的高尔夫球教练,多位高尔夫球界的明星,包括老虎伍兹、菲尔·米克森、格雷格·诺曼、里奇·福勒等都曾经向他拜师学艺。