NumPy

✍ dations ◷ 2025-09-19 02:58:23 #NumPy

NumPy是Python语言的一个扩展程序库。支持高阶大规模的多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

尽管很早就受到了科学界和工业界的关注,但Python最初并不是为数值计算设计的。1995年,特殊兴趣小组(Special Interest Group,SIG)Matrix-sig成立,其目的是设计一个数组计算包。Matrix-sig的成员中有Python的设计者和维护者吉多·范罗苏姆,他扩展了Python的语法(特别是索引语法),使数组计算更容易。

矩阵包Numeric由Jim Fulton实现,并由Jim Hugunin推广, (也称Numerical Python extensions或 NumPy)。Jim Hugunin 是麻省理工学院的研究生,:10 于1997年加入国家研究计划公司(英语:Corporation_for_National_Research_Initiatives)从事JPython的研发,劳伦斯利弗莫尔国家实验室的Paul Dubois接任维护者。:10其他早期贡献者包括David Ascher, Konrad Hinsen和Travis Oliphant。:10

Numarray是作为Numeric的替代品被开发出来的,现已废弃。相比于Numeric,Numarray处理大数组速度较快,然而处理小数组速度较慢,因此有一段时间这两个包被并行使用于不同情况。Numeric的最后一个版本(v24.2)于2005年11月11日发布;Numarray的最后一个版本(v1.5.2)于2006年8月24日发布。

有人希望将Numeric纳入Python标准库,但吉多·范罗苏姆认为,在当时的情况下,代码难以维护。

2005年初,NumPy的开发者Travis Oliphant希望社区的不同数组包可以统一。他将Numarray的功能移植到Numeric上,并于2006将结果作为NumPy 1.0发布。这个新项目是SciPy的一部分。为了避免在只需数组计算的情况下安装庞大的SciPy包,新包以NumPy的名义被分离出来。2011年,NumPy的1.5.0版本加入了对Python 3的支持。

2011年,PyPy开始开发NumPy API,但它尚未与NumPy完全兼容。

NumPy参考CPython(一个使用字节码的解释器),而在这个Python实现解释器上所写的数学算法代码通常远比编译过的相同代码要来得慢。为了解决这个难题,NumPy引入了多维数组以及可以直接有效率地操作多维数组的函数与运算符。因此在NumPy上只要能被表示为针对数组或矩阵运算的算法,其执行效率几乎都可以与编译过的等效C语言代码一样快。

NumPy提供了与MATLAB相似的功能与操作方式,因为两者皆为解释型语言,并且都可以让用户在针对数组或矩阵运算时提供较标量运算更快的性能。两者相较之下,MATLAB提供了大量的扩展工具箱(例如Simulink);而NumPy则是根基于Python这个更现代、完整并且开放源代码的编程语言之上。此外NumPy也可以结合其它的Python扩展库。例如SciPy,这个库提供了更多与MATLAB相似的功能;以及Matplotlib,这是一个与MATLAB内置绘图功能类似的库。而从本质上来说,NumPy与MATLAB同样是利用BLAS与LAPACK来提供高效率的线性代数运算。

NumPy的核心功能是ndarray(即-dimensional array,多维数组)数据结构。这是一个表示多维度、同质并且固定大小的数组对象。而由一个与此数组相关系的资料类型对象来描述其数组元素的资料格式(例如其字符组顺序、在存储器中占用的字符组数量、整数或者浮点数等等)。

在数组中插入或追加元素并不像Python的list一样简单。np.pad(...)实际上创建了新的具有目标形状和填充值的数组,将给定数组的值复制到新数组中并返回新数组。np.concatenate()并没有直接连接两个数组,而是返回新的数组,该数组填充了两个原数组的值。用np.reshape(...)改变量组的维度只有在数组中元素数量不变的情况下才能实现。造成以上情况的原因是NumPy的数组必须占用连续的内存空间。Blaze包尝试克服这个限制。

未经矢量化的算法通常运行缓慢,因为它们必须用纯Python方法实现;由于需要创建和输入等大的临时数组,部分操作的矢量化可能会增长其空间复杂度(例如由常数增长到线性)。部分小组通过运行时编译(Runtime compilation of numerical code)避免这一问题。可与NumPy集成的开源解决方案包括 numexpr和Numba。Cython和Pythran是静态编译的解决方案。

许多现代大型科学计算应用的要求超出了NumPy数组的能能力。例如,NumPu数组通常加载到计算机的内存中,然而内存可能没有足够的容量;此外,NumPy仅在单个CPU上进行操作,而许多线性代数算子可以通过CPU的集群和其它特殊硬件(例如GPU、TPU,部分深度学习应用也依赖于这些特殊硬件)来加速。因此,近期在Python的生态中出现了许多其它工具,例如用于分布式数组的Dask(英语:Dask)、用于GPU计算的TensorFlow和JAX等。这些库通常实现或模仿NumPy的部分API,因此用户不需大量改动就可以部署原先使用NumPy的程序。近期出现的由Nuidia的CUDA架构加速的CuPy(英语:CuPy)库展示了快速计算的潜力,是NumPy的直接替代品。

相关

  • 马达加斯加远征第二次马达加斯加战争,亦称第二次马达加斯加远征、第二次法兰西-马尔加什战争(法语: L'Expédition de Madagascar/Campagne de Madagascar),是一场法国企图封锁并征服马达加
  • В̌В̌ в̌(带抑扬符的Ve;斜体:)是一个西里尔字母,由字母В в与抑扬符组成。这个字母被用于瓦罕语与舒格南语。Template:Alphabet sgh
  • 2,5-二甲基苯胺2,5-二甲基苯胺是一种有机化合物,化学式为C6H3(CH3)2NH2,它是二甲基苯胺同分异构体之一,为无色的粘稠液体。它可用于制备溶剂黄30、溶剂红22、酸性红65和溶剂红26。和其它二甲
  • 12次列车《12次列车》(英语:The twelfth train)或称第12次列车,是1960年上映于中国大陆的故事片,导演郝光、张岚,主演刘秀杰、李明启、张英敏、金兰英、陈秀英。1959年7月,一列由沈阳开往北
  • 世铎宗室世铎(满语:ᡠᡴᠰᡠᠨ ᡧᡳᡩᠣ,穆麟德:,1843年7月27日(道光二十三年七月初一)-1914年1月8日(民国二年十二月十三)),爱新觉罗氏,礼亲王代善九世孙,祜塞八世孙,全龄第三子。道光三十年(1
  • 席酉民席酉民,中国西交利物浦大学执行校长、英国利物浦大学副校长。曾任西安交通大学党委常委、副校长(1998年6月至2009年1月)。
  • 高千穗大学高千穗大学(日语汉字:高千穂大学;英语:Takachiho University)位于日本东京都杉并区大宫2-19-1,为日本私立大学,1950年设置,大学简称高千穂大。
  • 异诺弄蝶属共5种,详阅正文。异诺弄蝶属(属名:)是弄蝶亚科刺胫弄蝶族里的一个属,共有5个物种,分布于东洋界。中国分布2种。物种曾经都归入孔弄蝶属。属名源于齐诺弄蝶属的学名“”,因为这个新
  • 希尔布罗塔希尔布罗塔(南非语:Hillbrow-toring,英语:Hillbrow Tower,前称约翰内斯·格哈杜斯·斯揣敦塔)是一座位于南非约翰内斯堡希尔布罗郊区的高塔。其高269米(883英尺),是非洲最高的建筑和塔式建筑,已有45年的历史,该塔还曾经是南半球最高的建筑,直到1978年被澳大利亚昆士兰州超过270米的伊萨山烟囱打破纪录。该塔于1968年6月开始建造,并于三年后的1971年4月完成。建设成本为200万兰特(即当时的280万美元)。该塔最初称为约翰内斯·格哈杜斯·斯揣敦塔,他于1954年至195
  • 歌厅 (音乐剧)《歌厅》(英语:)是一部音乐剧,改编自约翰·范·德鲁顿(John Van Druten)的1951年话剧《我是一个相机》(),该话剧改编自克里斯多福·伊舍伍的1939年的小说《柏林故事》()。这部音乐剧由弗里德·埃布(Fred Ebb)作词,约翰·坎德(John Kander)作曲,于1966年11月在纽约百老汇首演。剧中故事以1931年魏玛共和国时期的柏林为背景,围绕着美国小说作家克里夫·布莱德肖和19岁的英国卡巴莱歌手萨利·鲍尔斯之间的恋情展开。克里夫的房东施奈德小姐和她的追求者舒尔茨先生(一位卖水果