GCC

✍ dations ◷ 2025-05-10 11:55:38 #编译器软件,GNU计划软件,C编译器

GNU编译器套装(英语:GNU Compiler Collection,缩写为GCC),指一套编程语言编译器,以GPL及LGPL许可证所发行的自由软件,也是GNU计划的关键部分,也是GNU工具链的主要组成部分之一。GCC(特别是其中的C语言编译器)也常被认为是跨平台编译器的事实标准。1985年由理查德·马修·斯托曼开始发展,现在由自由软件基金会负责维护工作。

原名为GNU C语言编译器(GNU C Compiler),因为它原本只能处理C语言。GCC在发布后很快地得到扩展,变得可处理C++。之后也变得可处理Fortran、Pascal、Objective-C、Java、Ada,Go与其他语言。

许多操作系统,包括许多类Unix系统,如Linux及BSD家族都采用GCC作为标准编译器。

GCC原本用C开发,后来因为LLVM、Clang的崛起,它更快地将开发语言转换为C++。许多C的爱好者在对C++一知半解的情况下主观认定C++的性能一定会输给C,但是Ian Lance Taylor给出了不同的意见,并表明C++不但性能不输给C,而且能设计出更好,更容易维护的程序。

GCC是由理查德·马修·斯托曼在1985年开始的。他首先扩增一个旧有的编译器,使它能编译C,这个编译器一开始是以Pastel语言所写的。Pastel是一个不可移植的Pascal语言特殊版,这个编译器也只能编译Pastel语言。为了让自由软件有一个编译器,后来此编译器由斯托曼和Len Tower在1987年以C语言重写并成为GNU项目的编译器。GCC的创建者由自由软件基金会直接管理。

在1997年,一群不满GCC缓慢且封闭的创作环境者,组织了一个名为EGCS(Experimental/Enhanced GNU Compiler System)的项目,此项目汇整了数项实验性的分支进入某个GCC项目的分支中。EGCS比起GCC的建构环境更有活力,且EGCS最终也在1999年四月成为GCC的官方版本。

GCC目前由世界各地不同的数个程序员小组维护。它是移植到最多中央处理器架构以及最多操作系统的编译器。

由于GCC已成为GNU系统的官方编译器(包括GNU/Linux家族),在LLVM、Clang崛起之前,它也是编译与创建其他操作系统的主要编译器,包括BSD家族、Mac OS X、NeXTSTEP与BeOS等。

GCC通常是跨平台软件的编译器首选。有别于一般局限于特定系统与运行环境的编译器,GCC在所有平台上都使用同一个前端处理程序,产生一样的中介码,因此此中介码在各个其他平台上使用GCC编译,有很大的机会可得到正确无误的输出程序。

以2011年10月26日发布的4.6.2版为准,本编译器版本可处理下列语言:

先前版本纳入的CHILL(英语:CHILL)前端由于缺乏维护而被废弃。

Fortran前端在4.0版之前是G77,此前端仅支持Fortran 77。在本版本中,G77被废弃而采用更新的GFortran,因为此前端支持Fortran 95。

下列前端依然存在:

OpenMP是一种跨语言的对称多处理机多线程并行程序的编程工具,也非常适合当今越来越流行的单CPU多核硬件环境,因此从gcc4.2开始,OpenMP成为其内嵌支持的并行编程规范,可以直接编译内嵌OpenMP语句的C/C++/Fortran95的源代码。gcc4.2之前如果想在C/C++/Fortran中嵌入OpenMP语句的话,需要额外安装库和预处理器才能识别和正确处理这些语句。现在 GCC GOMP 计划实现了这些支持:

GCC目前支持下列处理器架构(以4.1版为准):

较不知名的处理器架构也在官方发布版本中支持:

由FSF个别维护的GCC处理器架构:

当GCC需要移植到一个新平台上,通常使用此平台固有的语言来撰写其初始阶段。

GCC的外部接口长得像一个标准的Unix编译器。用户在命令行下键入gcc之程序名,以及一些命令参数,以便决定每个输入文件使用的个别语言编译器,并为输出代码使用适合此硬件平台的汇编语言编译器,并且选择性地运行链接器以制造可执行的程序。

每个语言编译器都是独立程序,此程序可处理输入的源代码,并输出汇编语言码。全部的语言编译器都拥有共通的中介架构:一个前端解析符合此语言的源代码,并产生一抽象语法树,以及一翻译此语法树成为GCC的寄存器转换语言的后端。编译器最优化与静态代码解析技术(例如FORTIFY_SOURCE 页面存档备份,存于互联网档案馆,一个试图发现缓存溢出的编译器)在此阶段应用于代码上。最后,适用于此硬件架构的汇编语言代码以杰克·戴维森(英语:Jack Davidson)与克里斯·弗雷泽(英语:Chris Fraser)发明的算法产出。

几乎全部的GCC都由C/C++写成,除了Ada前端大部分以Ada写成。

前端的功能在于产生一个可让后端处理之语法树。此语法解析器是手写之递归语法解析器。

直到最近,程序的语法树结构尚无法与欲产出的处理器架构脱钩。而语法树的规则有时在不同的语言前端也不一样,有些前端会提供它们特别的语法树规则。

在2005年,两种与语言脱钩的新类型语法树纳入GCC中。它们称为GENERIC与GIMPLE。语法解析变成产生与语言相关的暂时语法树,再将它们转成GENERIC。之后再使用“gimplifier”技术降低GENERIC的复杂结构,成为一较简单的静态唯一形式(Static Single Assignment form,SSA)基础的GIMPLE形式。此形式是一个与语言和处理器架构脱钩的全局最优化通用语言,适用于大多数的现代编程语言。

一般编译器作者会将语法树的最优化放在前端,但其实此步骤并不看语言的种类而有不同,且不需要用到语法解析器。因此GCC作者们将此步骤归入通称为中介阶段的部分里。此类的最优化包括消解死码、消解重复运算与全局数值重编码等。许多最优化技巧也正在实现中。

GCC后端的行为因不同的前处理器宏和特定架构的功能而不同,例如不同的字符尺寸、调用方式与大小尾序等。后端接口的前半部利用这些消息决定其RTL的生成形式,因此虽然GCC的RTL理论上不受处理器影响,但在此阶段其抽象指令已被转换成目标架构的格式。

GCC的最优化技巧依其发布版本而有很大不同,但都包含了标准的最优化算法,例如循环最优化、线程跳跃、共通程序子句消减、指令调度等等。而RTL的最优化由于可用的情形较少,且缺乏较高端的信息,因此比较起近来增加的GIMPLE语法树形式,便显得比较不重要。

后端经由一重读取步骤后,利用描述目标处理器的指令集时所获取的信息,将抽象寄存器替换成处理器的真实寄存器。此阶段非常复杂,因为它必须关照所有GCC可移植平台的处理器指令集的规格与技术细节。

后端的最后步骤相当公式化,仅仅将前一阶段得到的汇编语言码借由简单的副函数转换其寄存器与存储器位置成相对应的机器代码。

为GCC调试的首选工具当然是GNU调试器。其他特殊用途的调试工具是Valgrind,用以发现内存泄漏(Memory leak)。而GNU测量器(gprof)可以得知程序中某些函数花费多少时间,以及其调用频率;此功能需要用户在编译时选定测量(profiling)选项。

内嵌汇编也称行内汇编,是把汇编语言代码块插在C语言语句之间。详情参见GCC-Inline-Assembly-HOWTO.html 页面存档备份,存于互联网档案馆

相关

  • 干癣性关节炎干癣性关节炎(英语:psoriatic arthritis 或简称为干癣关节炎 英语:PsA)是一种长期慢性的发炎性关节炎(英语:inflammatory arthritis),发生在患有干癣(一种自身免疫性疾病)的病人身上。
  • 异无腔动物异无腔动物(Xenacoelomorpha)是包括异涡虫和无腔动物的简单生物。这种分类的依据是分子生物学资讯与衍徴。异无腔动物演化枝包含无腔动物与异涡虫,在演化树上的具体位置有多种
  • 车轮战车轮战或车轮战术是一种战术,指多个进攻方轮流攻击同一防御方,使其疲于应付。指棋局或比赛中一人轮流对局多人。这种战术如同车轮不断转动一样,进攻方不断攻击防御方,因此得名车
  • 绍曾德奥克斯千橡市或千橡城(Thousand Oaks),又音译作绍曾德奥克斯,是美国加利福尼亚州文图拉县的一个城市,位于该县东南部,是康谷的人口集中地。当地因为生长有很多橡树而得名。它是1950年代
  • 2018年8月逝世人物列表2018年8月逝世人物列表,是用于汇总2018年8月期间逝世人物的列表。
  • 台湾轨道运输路线列表台湾轨道运输路线列表列举台湾轨道运输系统已营运、兴建中或规划中的路线,以及路线中会行经或停靠的车站。其中规划中的路线除交通主管单位正式规划案外,另列出各级政府机关已
  • 李维桢 (隆庆进士)李维桢(1547年-1626年),字本宁,号翼轩,湖广京山人,明朝文学家、政治人物。隆庆戊辰进士,官至南京礼部尚书。李维桢博闻强记,有文名,为“嘉隆末五子”之一。湖广乡试第四十五名。隆庆二
  • ConvertigoConvertigo为独立软件供应商(ISV),主营业务分布在欧洲和美国,总部设在法国奥赛(Orsay),并在美国旧金山设办事处。公司现有员工25人。 Convertigo致立于开发开放源代码软件(OSS),提供移
  • 第一次勒布尔热战役第一次勒布尔热战役 (法语:Première bataille du Bourget)是1870年10月28日至10月30日的普法战争期间。法国与普鲁士王国在勒布尔热发生的一场战役。自1870年9月19日以来,法国
  • 独立同分布在概率论与统计学中,独立同分布(英语:Independent and identically distributed,缩写为IID)是指一组随机变量中每个变量的概率分布都相同,且这些随机变量互相独立。一组随机变量独