NumPy

✍ dations ◷ 2024-12-24 03:15:28 #NumPy

NumPy是Python语言的一个扩展程序库。支持高阶大规模的多维数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

尽管很早就受到了科学界和工业界的关注,但Python最初并不是为数值计算设计的。1995年,特殊兴趣小组(Special Interest Group,SIG)Matrix-sig成立,其目的是设计一个数组计算包。Matrix-sig的成员中有Python的设计者和维护者吉多·范罗苏姆,他扩展了Python的语法(特别是索引语法),使数组计算更容易。

矩阵包Numeric由Jim Fulton实现,并由Jim Hugunin推广, (也称Numerical Python extensions或 NumPy)。Jim Hugunin 是麻省理工学院的研究生,:10 于1997年加入国家研究计划公司(英语:Corporation_for_National_Research_Initiatives)从事JPython的研发,劳伦斯利弗莫尔国家实验室的Paul Dubois接任维护者。:10其他早期贡献者包括David Ascher, Konrad Hinsen和Travis Oliphant。:10

Numarray是作为Numeric的替代品被开发出来的,现已废弃。相比于Numeric,Numarray处理大数组速度较快,然而处理小数组速度较慢,因此有一段时间这两个包被并行使用于不同情况。Numeric的最后一个版本(v24.2)于2005年11月11日发布;Numarray的最后一个版本(v1.5.2)于2006年8月24日发布。

有人希望将Numeric纳入Python标准库,但吉多·范罗苏姆认为,在当时的情况下,代码难以维护。

2005年初,NumPy的开发者Travis Oliphant希望社区的不同数组包可以统一。他将Numarray的功能移植到Numeric上,并于2006将结果作为NumPy 1.0发布。这个新项目是SciPy的一部分。为了避免在只需数组计算的情况下安装庞大的SciPy包,新包以NumPy的名义被分离出来。2011年,NumPy的1.5.0版本加入了对Python 3的支持。

2011年,PyPy开始开发NumPy API,但它尚未与NumPy完全兼容。

NumPy参考CPython(一个使用字节码的解释器),而在这个Python实现解释器上所写的数学算法代码通常远比编译过的相同代码要来得慢。为了解决这个难题,NumPy引入了多维数组以及可以直接有效率地操作多维数组的函数与运算符。因此在NumPy上只要能被表示为针对数组或矩阵运算的算法,其执行效率几乎都可以与编译过的等效C语言代码一样快。

NumPy提供了与MATLAB相似的功能与操作方式,因为两者皆为解释型语言,并且都可以让用户在针对数组或矩阵运算时提供较标量运算更快的性能。两者相较之下,MATLAB提供了大量的扩展工具箱(例如Simulink);而NumPy则是根基于Python这个更现代、完整并且开放源代码的编程语言之上。此外NumPy也可以结合其它的Python扩展库。例如SciPy,这个库提供了更多与MATLAB相似的功能;以及Matplotlib,这是一个与MATLAB内置绘图功能类似的库。而从本质上来说,NumPy与MATLAB同样是利用BLAS与LAPACK来提供高效率的线性代数运算。

NumPy的核心功能是ndarray(即-dimensional array,多维数组)数据结构。这是一个表示多维度、同质并且固定大小的数组对象。而由一个与此数组相关系的资料类型对象来描述其数组元素的资料格式(例如其字符组顺序、在存储器中占用的字符组数量、整数或者浮点数等等)。

在数组中插入或追加元素并不像Python的list一样简单。np.pad(...)实际上创建了新的具有目标形状和填充值的数组,将给定数组的值复制到新数组中并返回新数组。np.concatenate()并没有直接连接两个数组,而是返回新的数组,该数组填充了两个原数组的值。用np.reshape(...)改变量组的维度只有在数组中元素数量不变的情况下才能实现。造成以上情况的原因是NumPy的数组必须占用连续的内存空间。Blaze包尝试克服这个限制。

未经矢量化的算法通常运行缓慢,因为它们必须用纯Python方法实现;由于需要创建和输入等大的临时数组,部分操作的矢量化可能会增长其空间复杂度(例如由常数增长到线性)。部分小组通过运行时编译(Runtime compilation of numerical code)避免这一问题。可与NumPy集成的开源解决方案包括 numexpr和Numba。Cython和Pythran是静态编译的解决方案。

许多现代大型科学计算应用的要求超出了NumPy数组的能能力。例如,NumPu数组通常加载到计算机的内存中,然而内存可能没有足够的容量;此外,NumPy仅在单个CPU上进行操作,而许多线性代数算子可以通过CPU的集群和其它特殊硬件(例如GPU、TPU,部分深度学习应用也依赖于这些特殊硬件)来加速。因此,近期在Python的生态中出现了许多其它工具,例如用于分布式数组的Dask(英语:Dask)、用于GPU计算的TensorFlow和JAX等。这些库通常实现或模仿NumPy的部分API,因此用户不需大量改动就可以部署原先使用NumPy的程序。近期出现的由Nuidia的CUDA架构加速的CuPy(英语:CuPy)库展示了快速计算的潜力,是NumPy的直接替代品。

相关

  • 皮聪达皮聪达(格鲁吉亚语:ბიჭვინთა;阿布哈兹语:Пиҵунда;俄语:Пицунда),是格鲁吉亚的城镇,位于该国西部的黑海沿岸,由阿布哈兹负责管辖,每年平均降雨量1,460毫米,受亚热
  • 原专卖局台北后站仓库台北北站,位于台湾台北市大同区、台北车站特定专用区交通十号用地,曾为台北市主要的公路长途客运(国道客运)车站之一,今已经停止使用,其路线全数移转至国道客运台北总站。原址位于
  • 各国萤石产量列表这是一个2006年的各国萤石产量列表,主要基于2008年7月 英国地质调查局 的数据。
  • 2016 Re-ALBUM 除特别注明外,本文所有时间均以东九区时间(UTC+9)为准。《2016 Re-ALBUM》是韩国第一代男子音乐组合水晶男孩于2016年5月11日加入YG娱乐重启活动后,于同年12月1日所发行的重新
  • 莫阿纳·卡凯塞斯莫阿纳·卡凯塞斯(Moana Carcassés Kalosil,(1963-01-27)1963年1月27日- ),瓦努阿图政治家。2013年3月23日起就任瓦努阿图总理,他是瓦努阿图历史上出任总理的第一位归化公民。卡
  • 布兰登·亚伦森布兰登·罗素·亚伦森(英语:Brenden Russell Aaronson,2000年10月22日-),是一名美国足球员,司职前腰。现效力美国职业足球大联盟俱乐部费城联,他也代表美国国家足球队参赛。2020年10
  • 刘丰 (北魏)刘丰,字丰生,匈奴裔,灵州普乐郡人,谥号“忠”。先从北魏,后因高澄改成北齐大臣,膝下有儿子刘晔、孙子刘感。死后被追封大司马、司徒。刘丰生于灵州普乐郡,容姿雄壮,刚勇果断,能言善辩
  • 毛利两川毛利元就的次男与三男,毛利隆元的两个亲胞弟吉川元春与小早川隆景,合称毛利两川。元春和隆景分别为藤原氏支系吉川家与安艺国豪族小早川家的养子,继承两家产业,辅佐毛利家家督(
  • 袁俊 (道光九年进士)袁俊(1798年12月14日-1851年6月5日),谱名敬,字素珊(所三),又字叔英,号秋沚,行三,顺天宛平县民籍,由副贡生,嘉庆二十四年己卯科乡试第十七名副榜,充武英殿校录,道光五年乙酉科乡试第五十八名
  • 冈拜冈拜(法语:Gambais,法语:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium Alternative","TITUS Cyberbit Basic","Arial Unicode MS","IPAPANNEW","Chrysanthi Unicode","Gentium