性能分析

✍ dations ◷ 2025-06-08 17:18:49 #软件工程,计算机科学

在软件工程中,性能分析(performance analysis也称为profiling),是以收集程序运行时信息为手段研究程序行为的分析方法,是一种动态程序分析(英语:Dynamic program analysis)的方法。

性能分析量测像是程序的空间或时间复杂度、特定指令的使用情形(英语:instruction set simulator)、函数调用的频率及运行时间等。性能分析的目的在于决定程序的哪个部分应该被优化(英语:Program optimization),从而提高程序的速度或者内存使用效率。

性能分析可以由程序的源代码或是可执行档进行。一般会使用称为性能分析工具(profiler)的工具进行。性能分析工具会使用许多不同的技术,可能是以事件为基础(Event-based)的、统计的、指令导向的、仿真的方法。性能分析工具常用在性能工程(英语:Performance engineering)的过程中使用。

"若要了解程序行为,程序分析工具非常重要。计算机体系结构分析师需要这类工具来评估程序在新的系统结构中运作的情形。软件撰写者需要这类工具来分析程序,并分析出其中关键的区块。编译器撰写者需要这类工具来评估其指令调度或分支预测算法运作的情形"

性能分析工具使用广泛的技术手段收集数据,包括硬件中断、代码指令(英语:Instrumentation (computer programming))、作业系统hooking(英语:hooking)、CPU内置的性能计数寄存器(英语:Hardware performance counter),等等。

性能分析输出会是:

/* ------------ 源代碼------------------------- 發行次數 */            0001             IF X = "A"                     00550002                THEN DO                      0003                  ADD 1 to XCOUNT           00320004                ELSE0005             IF X = "B"                     0055


早在1970年代,IBM System/360及IBM System/370(英语:IBM/370)的平台就有性能分析工具,一般是用计时器中断在固定的时间纪录程序状态字(英语:Program status word)(PSW)来侦测程序运行时的“过热点”(hot spots)。这是早期使用抽样方式进行性能分析的示例之一。在1974年时,指令集仿真器(英语:instruction set simulator)就允许完整的事件踪迹,以及其他性能监控的机能。

以性能分析工具为主的UNIX程序分析至少可以回溯到1979年,当时Unix系统有一个基础工具prof,可以列出每一个函数,也列出此函数总共花了多少时间。1982年时gprof工具延伸此概念,可以列出完整的函数调用图(英语:Call graph)。

1994年时,迪吉多的Amitabh Srivastava和Alan Eustace提出了描述ATOM的论文。ATOM是一个平台,可以将程序配合其性能分析工具调整,在编译期间,ATOM会在要分析的程序中加入代码,而加入的代码会输出分析数据,这种修改程序,输出自身份析数据的技术,称为逻辑注入(英语:Instrumentation (computer programming))。

2004年时,gprof和ATOM论文都出现在前50个最具影响力的编程语言设计和实现会议(英语:Conference on Programming Language Design and Implementation)(PLDI)论文中。

一般性能分析器(flat profiler)根据函数调用计算平均的函数调用次数,而且不会根据被调用函数或是运行脉络(context)细分函数调用次数。

函数调用图(英语:Call graph)会显示函数被调用的次数及频率,也会列出函数调用链(call-chains),有些软件会列完整的调用链,有些不会。

性能分析器本身也是程序,可以在被分析程序运行时收集相关信息,来分析该程序。根据收集到信息的细微度,以及收集信息的方式,可以分为事件为基础的性能分析器,或是统计式的性能分析器。有些性能分析器为了收集信息,会中断程序的运行,因此在时间量测上有一定的分辨率限制。

以下列出的编程语言有事件为基础的性能分析器:

有些性能分析器是用取样的方式运作。取様式的性能分析器利用操作系统的中断,在固定时间取様目的程序的程序计数器。取様式的性能分析器在数值上较不精准,但对目的程序运行时间的影响最小,允许目的程序可以在接近全速的速度下运作。

所得到的数据不是精准值,只是统计上的近似值而已。“实际误差的量一般会大于一个取样时间。若某一数值是取様时间的n倍,其误差约为n倍取样时间的平方根。”

在实务上统计式的性能分析器会比其他的分析方式更能知道目的程序各部分占的比例,而且相较之下有较少的边际效应(例如存储器缓存或是指令解码的管道线等),由于统计式的性能分析器对程序运行速度的影响较小。因此可以侦测到一些其他方式侦测不到的问题。这种方式可以看出用户模式及可中断系统模式(例如系统调用)分别占的时间。

不过由于系统程序需处理中断,仍然会花一些CPU的运行周期,分散缓存的读取,而且无法分辨在不可中断核心模式下的行为。

有些特制的硬件可以克服这类的问题:有些最近MIPS微理器中,JTAG接口有一个PCSAMPLE寄存器,可以用一种无法侦测到的方式来取様程序计数器。

最常用的统计式的性能分析器包括AMD的CodeAnalyst、苹果公司的Shark(OSX)、oprofile(Linux)、Intel的VTune(英语:VTune)及Parallel Amplifier(Intel Parallel Studio(英语:Intel Parallel Studio)的一部分)。

有些性能分析可以用插装(英语:instrumenting)(也称为逻辑注入)的方式处理目的程序,也就是在目的程序中加入额外指令来收集需要的信息。

程序的插装会影响程序的性能,可能会出现不精确的结果及 heisenbug(捉摸不定,不易重现的bug)。插装一定会对程序运行有些影响,常见的情形是使程序变慢。不过插装可以特定只针对部分程序,而且可以小心控制以使影响降到最低。其对于特定程序的影响是看插装放置的位置,以及捕捉踪迹(trace)的机制。有些处理器有硬件支持可以捕捉踪迹,插装可以只占一个机器语言周期的时间。一般可以从结果中移除插装的影响。

gprof是一个同时用插装及取様的性能分析器的例子。插装用来获取被调用函数的信息,而实际花的时间则是由取様方式来获得。

插装是决定性能分析器可控制程度及时间分辨率的关键。以下是一些方式的分类。

相关

  • 胡德山胡德山(英语:Mount Hood)是位于美国西北部俄勒冈州的一座山峰。胡德峰标高3,429米,是俄勒冈州最高的山峰,喀斯喀特山脉的第四高峰。山名来自于英国海军将领萨缪尔·胡德。胡德峰
  • 油酸油酸(英语:Oleic acid)是一种单不饱和Omega-9脂肪酸,存在于动植物体内。化学式C18H34O2 ,结构简式 CH3(CH2)7CH = CH(CH2)7COOH。 英文名称“oleic acid”源自“橄榄”(Olive)。油
  • 阿丁顿第一代西德默斯子爵亨利·阿丁顿,PC(Henry Addington, 1st Viscount Sidmouth,1757年5月30日-1844年2月15日),英国托利党政治家,1801年至1804年出任英国首相。1757年,出生于伦敦的医
  • 布疋织物(英语:fabric),俗称布,是由纱线等带有纤维的材料制成的一种织品。可以由棉纱纺成棉布,也可以由人造纤维制成,或者以混合棉纱与人造纤维制成混纺布。布是很多日用品和工业产品的
  • 形式化方法形式化方法,中文也称形式方法、正规方法。在计算机科学和软件工程领域,形式化方法是基于数学的特种技术,适合于软件和硬件系统的描述、开发和验证。将形式化方法用于软件和硬件
  • 埃伦费斯特保罗·埃伦费斯特(德语:Paul Ehrenfest,1880年1月18日-1933年9月25日),奥地利数学家、物理学家,1922年取得荷兰国籍。他的主要贡献是在统计力学的领域及对其与量子力学的关系的研究
  • 总统公民奖章总统公民奖章(英语:Presidential Citizens Medal),是美国第二高的平民奖,仅次于总统自由勋章,每年由美国总统颁发,获奖人数不定。总统公民奖章由美国总统尼克森(Richard M. Nixon)于1
  • 原始共产主义原始共产主义是源于德国哲学家卡尔·马克思与弗里德里希·恩格斯的概念,旨在描述共产主义存在于原始人类社会中的现象;两人认为原始的狩猎采集社会系奠基于平等的社会关系与资
  • 电动机械学电动机械学(Electromechanics)是指从电气工程和机械工程中,结合电气和机械的过程和程序。电气工程在这方面也包括电子工程。继电器起源于电报,是用来再生电报信号的电动机械装置
  • 文森特·佩尔西凯蒂文森特·路德维希·佩尔西凯蒂(英语:Vincent Ludwig Persichetti,1915年6月6日-1987年8月14日),美国作曲家、音乐教育家。生、卒于费城。作品数量巨大,有九部交响曲。长期在茱莉亚