头等函数
✍ dations ◷ 2025-02-24 14:42:36 #数据类型,函数式编程,程序设计语言理论,子程序
头等函数(first-class function)是指在程序设计语言中,函数被当作头等公民。这意味着,函数可以作为别的函数的参数、函数的返回值,赋值给变量或存储在数据结构中。 有人主张应包括支持匿名函数(函数字面量,function literals)。在这样的语言中,函数的名字没有特殊含义,它们被当作具有函数类型的普通的变量对待。1960年代中期,克里斯托弗·斯特雷奇在“functions as first-class citizens”中提出这一概念。
头等函数是函数式程序设计所必须的。通常要使用高阶函数。就是一个高阶函数,其实参是一个函数及一个list,返回结果是把作为参数的函数作用于list的每个元素后的结果形成的list。
把函数作为函数参数与函数返回值会遇到特别的困难。特别是存在非局部变量(英语:non-local variable)与嵌套函数(英语:nested function)、匿名函数。历史上,这被称作函数参数问题(英语:funarg problem)。 早期的命令式编程语言,或者不支持函数作为结果类型(如ALGOL 60, Pascal),或者忽略嵌套函数与非局部变量(如C语言)。早期的函数式语言Lisp采取了动态作用域方法,把非局部变量绑定到函数执行点最近的变量定义。Scheme语言支持词法作用域的头等函数,把对函数的引用绑定到闭包(closure)而不是函数指针,这使得垃圾收集成为必须。
在这一节,比较把函数视作头等公民的典型的函数式语言Haskell与把函数视作二等公民的命令式编程的C语言的有关概念。
具有函数参数的函数,称为高阶函数。函数式语言如Haskell:
map :: (a -> b) -> -> map f = map f (x:xs) = f x : map f xs
函数不是头等公民的程序设计语言可以使用函数指针或delegate,实现函数作为参数。C语言例子:
void map(int (*f)(int), int x, size_t n) { for (int i = 0; i < n; i++) x = f(x);}
匿名与嵌套函数
更多信息:匿名函数和嵌套函数
对于支持匿名函数的语言:
main = map (\x -> 3 * x + 1)
对于不支持匿名函数的语言,必须把函数绑定到一个名字上:
int f(int x) { return 3 * x + 1;}int main() { int list = {1, 2, 3, 4, 5}; map(f, list, 5);}
非局部变量与闭包
更多信息:非局部变量和闭包 (计算机科学)
一旦有了匿名函数与嵌套函数,引用函数体之外的变量(非局部变量)就很自然了:
main = let a = 3 b = 1 in map (\x -> a * x + b)
如果函数只能用函数指针表示,如何把函数体之外的值传递给函数就是个问题。可以手工建立一个闭包,但显然这不能算作头等函数:
typedef struct { int (*f)(int, int, int); int *a; int *b;} closure_t;void map(closure_t *closure, int x, size_t n) { for (int i = 0; i < n; ++i) x = (*closure->f)(*closure->a, *closure->b, x);}int f(int a, int b, int x) { return a * x + b;}void main() { int l = {1, 2, 3, 4, 5}; int a = 3; int b = 1; closure_t closure = {f, &a, &b}; map(&closure, l, 5);}
注意这里的map
是特化为使用当前环境外的两个int
。即使f
是个嵌套函数,仍然要面对同样问题,这也是C语言不支持嵌套函数的理由。
返回结果为函数时,实际上返回的是该函数的闭包。对于C语言,函数退出时其局部变量也退出了各自的作用域,这使得构建闭包变得困难。这被称为向上的函数参数问题(英语:upwards funarg problem)。
把函数赋值给变量面临着把函数当作返回结果一样的困难:构建该函数的闭包:
f :: -> ]f = let a = 3 b = 1 in
函数的相等
判断两个函数是否相等,有不同的判据:
对于类型论,函数类型接受值类型并返回值类型可写为 → 或。根据柯里-霍华德对应,函数类型可对应于逻辑蕴涵,lambda抽象对应于discharging hypothetical assumptions,函数调用对应于肯定前件推理规则。类型论还使用头等函数建模关联数组与类似的数据结构。
对于范畴论,头等函数对应于closed category(英语:closed category)设置。例如,简单类型λ演算 对应于笛卡儿闭范畴(CCC)的内部语言。
函数式程序设计语言,如Scheme、ML、Haskell、F#、Scala,都具有完整的头等函数。Lisp作为最早的函数式语言在当初设计时对头等函数各方面还没有适当的理解,导致了采用动态作用域。后来的Common Lisp已经改为使用词法作用域的头等函数。
许多脚本语言,如Perl、Python、PHP、Lua、Tcl/Tk、JavaScript、Io,有头等函数。
指令式程序设计语言,Algol及Pascal族系、C族系,与现代有垃圾收集的语言非常不同。Algol族系允许嵌套函数与高阶函数作为参数,但不允许函数作为返回值(除了Algol 68)。因为当时还不清楚如何处理内嵌函数作为返回值时的非局部变量问题(Algol 68对此会产生运行期错误)。
C族系允许函数作为参数与函数作为返回值,但由于不支持嵌套函数而避开了相关问题。因为返回嵌套函数并捕获所使用的非局部变量被认为才是真正有用,因此C族系不被认为有头等函数。
现代指令式编程语言由于有垃圾收集功能而使得头等函数成为可能。很多语言的后续版本开始支持头等函数,如C# 2.0,Apple公司的C、C++与Objective-C的Block扩展。C++11开始支持了匿名函数与闭包。
相关
- 拉丁古典学古罗马文学指纪元前后繁荣于古罗马政权(包括罗马共和国和罗马帝国)治下的文学。其主要语言是拉丁语。尽管古罗马共和国诞生于公元前510年(摆脱伊特鲁利亚王朝的统治),但按照惯例,
- 蒂尔堡大学坐标:51°33′46″N 05°02′31″E / 51.56278°N 5.04194°E / 51.56278; 5.04194蒂尔堡大学(荷兰语:Universiteit van Tilburg)亦以“提堡大学”、“提尔堡大学”、“堤堡大学
- 北黎凡特方言黎凡特阿拉伯语(اللهجة الشامية),也叫东部阿拉伯语,是在黎凡特地区广泛使用的一种阿拉伯语变体。它是五种(一说六种)主要的阿拉伯语变体之一。与其他地方的阿拉伯语
- 希利堂希利堂(英语:Healy Hall)是乔治城大学主校区头号历史建筑。希利堂建于1877年至1879年,由知名建筑师保罗·约翰内斯·派尔兹和约翰·史密斯梅尔设计,他们在此之前刚刚建造了美国国
- 凤山溪 (高雄市)凤山溪是高雄市的一条河川,清朝时期因流经凤山县城东门,因此旧称东门溪。凤山溪发源于高雄市大树山区,向西流经大树区、大寮区、鸟松区后,贯穿凤山区中心,向西南流入前镇区后改称
- 麦角酸麦角酸(lysergic acid 亦称:D-lysergic acid 及 (+)-lysergic acid)是寄生于禾本科植物的多种真菌(麦角)所产生的次级代谢产物,属于麦角毒素的一种,是迷幻药麦角二乙胺(LSD)的前趋物
- 波罗的海贵族波罗的海贵族为过去在今日爱沙尼亚和拉脱维亚地区的特权阶级。它存在起始自北方十字军入侵 和以中世纪万福玛利亚的土地(英语:Terra Mariana)的基础。大部分的绅士为波罗的海德
- 徐必达徐必达(1562年-1645年),字立伏,浙江嘉兴县人,明朝政治人物。万历十九年(1591年)中式浙江辛卯科举人。万历二十年(1592年)联捷壬辰科进士。万历三十六年(1608年)任直隶溧水县知县。仕至南
- 瑶涵沂陈靖婕(1986年7月23日-),台湾新生代女演员,2011年3月启用新艺名瑶函沂。2010年为客委会拍摄系打印象广告,以台词很强及其个人气质颇受关注。
- 富山电视台富山电视放送株式会社(日语:富山テレビ放送株式会社、とやまテレビほうそう,英语:Toyama Television Broadcasting Co., Ltd.),通称富山电视台,简称BBT(Best Broadcast Toyama telev