NumPy

✍ dations ◷ 2025-12-04 15:39:27 #NumPy

NumPy是Python语言的一个扩展程序库。支持高阶大规模的多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

尽管很早就受到了科学界和工业界的关注,但Python最初并不是为数值计算设计的。1995年,特殊兴趣小组(Special Interest Group,SIG)Matrix-sig成立,其目的是设计一个数组计算包。Matrix-sig的成员中有Python的设计者和维护者吉多·范罗苏姆,他扩展了Python的语法(特别是索引语法),使数组计算更容易。

矩阵包Numeric由Jim Fulton实现,并由Jim Hugunin推广, (也称Numerical Python extensions或 NumPy)。Jim Hugunin 是麻省理工学院的研究生,:10 于1997年加入国家研究计划公司(英语:Corporation_for_National_Research_Initiatives)从事JPython的研发,劳伦斯利弗莫尔国家实验室的Paul Dubois接任维护者。:10其他早期贡献者包括David Ascher, Konrad Hinsen和Travis Oliphant。:10

Numarray是作为Numeric的替代品被开发出来的,现已废弃。相比于Numeric,Numarray处理大数组速度较快,然而处理小数组速度较慢,因此有一段时间这两个包被并行使用于不同情况。Numeric的最后一个版本(v24.2)于2005年11月11日发布;Numarray的最后一个版本(v1.5.2)于2006年8月24日发布。

有人希望将Numeric纳入Python标准库,但吉多·范罗苏姆认为,在当时的情况下,代码难以维护。

2005年初,NumPy的开发者Travis Oliphant希望社区的不同数组包可以统一。他将Numarray的功能移植到Numeric上,并于2006将结果作为NumPy 1.0发布。这个新项目是SciPy的一部分。为了避免在只需数组计算的情况下安装庞大的SciPy包,新包以NumPy的名义被分离出来。2011年,NumPy的1.5.0版本加入了对Python 3的支持。

2011年,PyPy开始开发NumPy API,但它尚未与NumPy完全兼容。

NumPy参考CPython(一个使用字节码的解释器),而在这个Python实现解释器上所写的数学算法代码通常远比编译过的相同代码要来得慢。为了解决这个难题,NumPy引入了多维数组以及可以直接有效率地操作多维数组的函数与运算符。因此在NumPy上只要能被表示为针对数组或矩阵运算的算法,其执行效率几乎都可以与编译过的等效C语言代码一样快。

NumPy提供了与MATLAB相似的功能与操作方式,因为两者皆为解释型语言,并且都可以让用户在针对数组或矩阵运算时提供较标量运算更快的性能。两者相较之下,MATLAB提供了大量的扩展工具箱(例如Simulink);而NumPy则是根基于Python这个更现代、完整并且开放源代码的编程语言之上。此外NumPy也可以结合其它的Python扩展库。例如SciPy,这个库提供了更多与MATLAB相似的功能;以及Matplotlib,这是一个与MATLAB内置绘图功能类似的库。而从本质上来说,NumPy与MATLAB同样是利用BLAS与LAPACK来提供高效率的线性代数运算。

NumPy的核心功能是ndarray(即-dimensional array,多维数组)数据结构。这是一个表示多维度、同质并且固定大小的数组对象。而由一个与此数组相关系的资料类型对象来描述其数组元素的资料格式(例如其字符组顺序、在存储器中占用的字符组数量、整数或者浮点数等等)。

在数组中插入或追加元素并不像Python的list一样简单。np.pad(...)实际上创建了新的具有目标形状和填充值的数组,将给定数组的值复制到新数组中并返回新数组。np.concatenate()并没有直接连接两个数组,而是返回新的数组,该数组填充了两个原数组的值。用np.reshape(...)改变量组的维度只有在数组中元素数量不变的情况下才能实现。造成以上情况的原因是NumPy的数组必须占用连续的内存空间。Blaze包尝试克服这个限制。

未经矢量化的算法通常运行缓慢,因为它们必须用纯Python方法实现;由于需要创建和输入等大的临时数组,部分操作的矢量化可能会增长其空间复杂度(例如由常数增长到线性)。部分小组通过运行时编译(Runtime compilation of numerical code)避免这一问题。可与NumPy集成的开源解决方案包括 numexpr和Numba。Cython和Pythran是静态编译的解决方案。

许多现代大型科学计算应用的要求超出了NumPy数组的能能力。例如,NumPu数组通常加载到计算机的内存中,然而内存可能没有足够的容量;此外,NumPy仅在单个CPU上进行操作,而许多线性代数算子可以通过CPU的集群和其它特殊硬件(例如GPU、TPU,部分深度学习应用也依赖于这些特殊硬件)来加速。因此,近期在Python的生态中出现了许多其它工具,例如用于分布式数组的Dask(英语:Dask)、用于GPU计算的TensorFlow和JAX等。这些库通常实现或模仿NumPy的部分API,因此用户不需大量改动就可以部署原先使用NumPy的程序。近期出现的由Nuidia的CUDA架构加速的CuPy(英语:CuPy)库展示了快速计算的潜力,是NumPy的直接替代品。

相关

  • 宣和遗事《大宋宣和遗事》,简称《宣和遗事》,是知名的话本,是成书于南宋的笔记小说辑录,结合了多个类型的笔记小说并以说书的方式连贯而成,作者不详。现今流传为后人所著,已非宋代原本。宣
  • τ中微子τ中微子(Tau neutrino)是基本粒子中微子的一类,不带电荷,符号为ν τ;与τ子一起共同组成了第三代轻子,因此称作τ中微子。马丁·佩尔与其同事在1974年到1977年间于SLAC 国家加速
  • 阿臣·艾丁阿臣·艾丁(泰语:อาเชน ไอย์ดึน,皇家转写:Archen Aydin,汉文名:锺阿晨,2001年3月10日-),又名Joong(จุง),是一名泰国演员、歌手及舞者,是泰国男子音乐组合OXQ成员,队内职务
  • 方医良方医良(1937年3月5日-),中国国民党籍台南县政治人物,曾任台南县议员、台湾省议员、立法委员,但于2001年底竞选连任时失利。
  • 上海交通大学卢湾校区坐标:31°12′42″N 121°28′12″E / 31.2117°N 121.4700°E / 31.2117; 121.4700 (上海交通大学卢湾校区)上海交通大学卢湾校区,又称重庆南路校区,是上海交通大学的一个校区
  • 古华民古华民(1940年-),广东梅县人,中华人民共和国政治人物,中国致公党党员、中央常委,曾任中国侨联副主席,广东省侨联主席。
  • 郭赫轩郭赫轩(2013年4月23日-)是中国内地的儿童演员,因在电影《流浪地球》中出演儿童时代的刘启而闻名。
  • 亚伦·布朗亚伦·布朗(英语:Aaron Brown,1992年5月27日-)是一名参加100米赛跑和200米赛跑的加拿大短跑运动员。他曾代表加拿大在巴西里约热内卢进行的2016年夏季奥林匹克运动会和日本东京进行的2020年夏季奥林匹克运动会上获得男子4×100米接力铜牌。他也在2013年和2015年世界田径锦标赛上各获得一枚铜牌。
  • 施恩座施恩座(希伯来语:,,意为“遮罪盖”)是圣经中记载,放置在圣殿至圣所中约柜上的物体,与赎罪日仪式有关;这个术语也出现在保罗书信中,在基督教神学中有其特别的意义。英文“施恩座”一词()并非翻译自马所拉本中的希伯来语词汇,也不是翻译自七十士译本中的希腊语词汇,而是由廷岱勒翻译自马丁·路德的德语译本中使用的德语词汇,其字面意义为“恩典的座位”,“恩典的地方”。
  • 枕外侧沟枕外侧沟(英文:Lateral occipital sulcus)是位于大脑枕叶的一条脑沟,将枕回分隔为上部和下部,二者分别延伸至顶叶和颞叶。枕外侧沟的前端常不完整,但在某些人的大脑中可与颞上沟或枕横沟相交,而枕外侧沟的后端发源自月状沟中部。枕外侧沟与脑部的物体识别功能相关。