性能分析

✍ dations ◷ 2025-09-08 09:12:03 #软件工程,计算机科学

在软件工程中,性能分析(performance analysis也称为profiling),是以收集程序运行时信息为手段研究程序行为的分析方法,是一种动态程序分析(英语:Dynamic program analysis)的方法。

性能分析量测像是程序的空间或时间复杂度、特定指令的使用情形(英语:instruction set simulator)、函数调用的频率及运行时间等。性能分析的目的在于决定程序的哪个部分应该被优化(英语:Program optimization),从而提高程序的速度或者内存使用效率。

性能分析可以由程序的源代码或是可执行档进行。一般会使用称为性能分析工具(profiler)的工具进行。性能分析工具会使用许多不同的技术,可能是以事件为基础(Event-based)的、统计的、指令导向的、仿真的方法。性能分析工具常用在性能工程(英语:Performance engineering)的过程中使用。

"若要了解程序行为,程序分析工具非常重要。计算机体系结构分析师需要这类工具来评估程序在新的系统结构中运作的情形。软件撰写者需要这类工具来分析程序,并分析出其中关键的区块。编译器撰写者需要这类工具来评估其指令调度或分支预测算法运作的情形"

性能分析工具使用广泛的技术手段收集数据,包括硬件中断、代码指令(英语:Instrumentation (computer programming))、作业系统hooking(英语:hooking)、CPU内置的性能计数寄存器(英语:Hardware performance counter),等等。

性能分析输出会是:

/* ------------ 源代碼------------------------- 發行次數 */            0001             IF X = "A"                     00550002                THEN DO                      0003                  ADD 1 to XCOUNT           00320004                ELSE0005             IF X = "B"                     0055


早在1970年代,IBM System/360及IBM System/370(英语:IBM/370)的平台就有性能分析工具,一般是用计时器中断在固定的时间纪录程序状态字(英语:Program status word)(PSW)来侦测程序运行时的“过热点”(hot spots)。这是早期使用抽样方式进行性能分析的示例之一。在1974年时,指令集仿真器(英语:instruction set simulator)就允许完整的事件踪迹,以及其他性能监控的机能。

以性能分析工具为主的UNIX程序分析至少可以回溯到1979年,当时Unix系统有一个基础工具prof,可以列出每一个函数,也列出此函数总共花了多少时间。1982年时gprof工具延伸此概念,可以列出完整的函数调用图(英语:Call graph)。

1994年时,迪吉多的Amitabh Srivastava和Alan Eustace提出了描述ATOM的论文。ATOM是一个平台,可以将程序配合其性能分析工具调整,在编译期间,ATOM会在要分析的程序中加入代码,而加入的代码会输出分析数据,这种修改程序,输出自身份析数据的技术,称为逻辑注入(英语:Instrumentation (computer programming))。

2004年时,gprof和ATOM论文都出现在前50个最具影响力的编程语言设计和实现会议(英语:Conference on Programming Language Design and Implementation)(PLDI)论文中。

一般性能分析器(flat profiler)根据函数调用计算平均的函数调用次数,而且不会根据被调用函数或是运行脉络(context)细分函数调用次数。

函数调用图(英语:Call graph)会显示函数被调用的次数及频率,也会列出函数调用链(call-chains),有些软件会列完整的调用链,有些不会。

性能分析器本身也是程序,可以在被分析程序运行时收集相关信息,来分析该程序。根据收集到信息的细微度,以及收集信息的方式,可以分为事件为基础的性能分析器,或是统计式的性能分析器。有些性能分析器为了收集信息,会中断程序的运行,因此在时间量测上有一定的分辨率限制。

以下列出的编程语言有事件为基础的性能分析器:

有些性能分析器是用取样的方式运作。取様式的性能分析器利用操作系统的中断,在固定时间取様目的程序的程序计数器。取様式的性能分析器在数值上较不精准,但对目的程序运行时间的影响最小,允许目的程序可以在接近全速的速度下运作。

所得到的数据不是精准值,只是统计上的近似值而已。“实际误差的量一般会大于一个取样时间。若某一数值是取様时间的n倍,其误差约为n倍取样时间的平方根。”

在实务上统计式的性能分析器会比其他的分析方式更能知道目的程序各部分占的比例,而且相较之下有较少的边际效应(例如存储器缓存或是指令解码的管道线等),由于统计式的性能分析器对程序运行速度的影响较小。因此可以侦测到一些其他方式侦测不到的问题。这种方式可以看出用户模式及可中断系统模式(例如系统调用)分别占的时间。

不过由于系统程序需处理中断,仍然会花一些CPU的运行周期,分散缓存的读取,而且无法分辨在不可中断核心模式下的行为。

有些特制的硬件可以克服这类的问题:有些最近MIPS微理器中,JTAG接口有一个PCSAMPLE寄存器,可以用一种无法侦测到的方式来取様程序计数器。

最常用的统计式的性能分析器包括AMD的CodeAnalyst、苹果公司的Shark(OSX)、oprofile(Linux)、Intel的VTune(英语:VTune)及Parallel Amplifier(Intel Parallel Studio(英语:Intel Parallel Studio)的一部分)。

有些性能分析可以用插装(英语:instrumenting)(也称为逻辑注入)的方式处理目的程序,也就是在目的程序中加入额外指令来收集需要的信息。

程序的插装会影响程序的性能,可能会出现不精确的结果及 heisenbug(捉摸不定,不易重现的bug)。插装一定会对程序运行有些影响,常见的情形是使程序变慢。不过插装可以特定只针对部分程序,而且可以小心控制以使影响降到最低。其对于特定程序的影响是看插装放置的位置,以及捕捉踪迹(trace)的机制。有些处理器有硬件支持可以捕捉踪迹,插装可以只占一个机器语言周期的时间。一般可以从结果中移除插装的影响。

gprof是一个同时用插装及取様的性能分析器的例子。插装用来获取被调用函数的信息,而实际花的时间则是由取様方式来获得。

插装是决定性能分析器可控制程度及时间分辨率的关键。以下是一些方式的分类。

相关

  • 本列表仅列出现存种类,关系为并列 详见鱼类分类表鱼类属于脊索动物门中的脊椎动物亚门,人类的日常语言中,鱼类被用于指脊椎动物中除去四足动物后剩下的一部分生物。鱼这个词是
  • 巴黎大师赛巴黎大师赛(法语:Masters de Paris-Bercy,英语:BNP Paribas Masters),现名法国巴黎银行大师赛(BNP Paribas Masters),是每年在法国首都巴黎举办的网球赛事。为ATP大师赛的赛事之一(通
  • 太阳历阳历(又称太阳历,英语:Solar Calendar),起源于6000多年前的古埃及。为据地球围绕太阳公转轨道位置,或地球上所呈现出太阳直射点的周期性变化,所制定的历法;不据月亮的月相周期,岁实为
  • 信度信度(英语:Reliability),指的是测量方法的品质,即对同一现象进行重复观察之后是否可以得到相同资料值。科学研究者试图使用一系列的指标来测量个人或社会现象。可信度概念是研究
  • 锯齿锯齿国家森林(英语:Sawtooth National Forest)是一座美国国家森林,占地面积2,110,408英亩(8,540.52平方千米),其中有约96%位于爱达荷州,4%位于犹他州。森林由美国农业部下属的美国国
  • 对她说《对她说》(西班牙语:Hable con ella)是2002年西班牙导演佩德罗·阿尔莫多瓦尔编导的电影,由哈维耶·卡马拉、达里奥·葛兰帝内提、莲娜·瓦特伶、洁洛汀·卓别林和罗莎莉欧·芙
  • 万汗王台(?-1582年),本名万(满语:ᠸᠠᠨ,转写:Wan),那拉氏,塔山左卫都督克什纳长子彻彻穆之子,哈达部长王忠之侄,又称“万汗”(满语:‍ᠸᠠᠨᡥᠠᠨ,转写:Wanhan)。王台早年居于绥哈城。因王忠部下
  • 阿古拉阿古拉(英语:Agoura)是位于美国加利福尼亚州洛杉矶县的一个非建制地区。该地的面积和人口皆未知。阿古拉的座标为34°08′35″N 118°44′13″W / 34.14306°N 118.73694°W /
  • 抗议涨价大集会抗议涨价大集会(马来语:Himpunan Turun 2013)是由降低生活费运动(Gerakan Turun Kos Sara Hidup,TURUN)、橙色13(Jingga 13)、马来西亚大专生团结阵线(Solidariti Mahasiswa Malaysia
  • 屮部屮部,为汉字索引里为部首之一,康熙字典214个部首中的第四十五个(三划的则为第十六个)。就繁体和简体中文中,屮部归于三划部首。屮部通常是从下方均可为部字,且无其他部首可用者将