深奥的编程语言(Esoteric programming language,有时简写为Esolang)是一类编程语言,它们的设计被用于测试计算机语言设计的极限,作为一个概念的证明,或仅仅是一个玩笑。将它们与开发人员真正用于编写软件的语言区别开来。通常情况下,Esolang的创作者通常并不打算让它成为主流编程语言,尽管如此,一些深奥的功能如视觉空间语法,启发了在艺术中的实际应用。这种语言在黑客和爱好者之间通常较流行。
设计者几乎不会在意语言的可用性——一般,他们的目标完全相反。通常会移除或取代传统语言的功能,但同时仍保持图灵完备性,甚至可计算性都是未知的。
最早、且仍是深奥语言典型案例的是INTERCAL(英语:INTERCAL),由唐·伍兹和詹姆斯·里昂在1972年设计,意在于创造一种与他们知道的语言所不同的语言。它戏仿了当时通用的语言,如Fortran、COBOL和汇编。
INTERCAL的早期实现尝试是在IBM System/360和一台身份不明的雅达利电脑(可能是Atari 2600)上进行的,但没有成功。多年来,INTERCAL仅仅只存在于INTERCAL手册中。1990年Unix中C语言的实现复兴了这个语言,刺激了深奥计算机语言的设计热潮。
1992年,Wouter van Oortmerssen创建了一个小的面向堆栈的编程语言FALSE,它的语法设计成本身就能使代码混淆、混乱,并且难以阅读。值得注意的是,它有一个只有1024字节的编译器。这启发了Urban Müller创建一个更小的语言,也就是现在著名的brainfuck,其中只包括了八个可识别字符。它与Chris Pressey的Befunge(类似FALSE,但有一个二维的指令指针)一道,成为现今最为广泛支持的深奥编程语言。这些都是最小化图灵焦油坑、和多余的语言混淆功能的典型例子。brainfuck的极小化设计兼具了优雅和纯净;实际上它与图灵机P''系列有关。
图灵焦油坑(Turing tarpit)具有图灵完备性的编程语言,但它的指令、操作数或等效对象非常少。其中包括brainfuck(8个指令,0个操作数),单一指令计算机(1个指令,2至3个操作数)和Thue(1个指令,2个操作数)。
Turning tarpit是有状态编码的图灵焦油坑,即语言中的命令用于从一个有限的范围内选择操作,然后将这些操作应用到程序的当前状态中。这样的例子包括reMorse、Whirl,也许还包括INTERCAL(英语:INTERCAL)。
一种编写程序的方式,使得代码中的每一个子串:
注意每一个单一的指令总是包含两个连续的阶段:选择一个操作,并执行它。操作列表可能是静态的——如reMorse或THRAT,或动态的——如reMorse4ever。
下面是一个reMorse或THRAT的例子:
Select Next Operation in listPerform Operation
语言范型
编程语言的范型可以分为若干类别,这些类别可以用来大致了解特定语言的操作方式。其中包括命令式语言,如brainfuck,其指令描述了如何修改数据;函数式语言,如Unlambda,其中的数据和代码都或多或少地可交换,而程序的执行是通过重复迭代调用函数实现的;和重写语言,如Thue,其中可以使用变换函数使状态初始化。
funge是一类深奥的编程语言,其程序是基于度量空间中的坐标系的(通常为笛卡尔坐标系,但不一定是)。运行时,通过在程序空间中通过移动指令指针(用一个位置矢量表示当前执行的指令),以确定空间中的点,从而执行指令。不同的指令指示了指令指针的移动方向,并因此决定指令的执行顺序。
目前,这些语言行为的官方标准是Funge-98规范。这个规范是Befunge语言——一个有二维环面拓扑结构的语言——语义的一个概括。严格遵守这个标准的语言有时也被称为,如Unefunge(一维)和Trefunge(三维),而更多有显著差异的“远亲”被称为,如Wierd。
对于确定性语言,如果给定程序的当前状态,则总是可以预测它的下一个状态。但非确定性语言就不是这样。大多数的语言都是确定性的,但某些语言提供了一个内置的随机指令,例如Befunge。此外,有些语言,如Java2K只有随机指令。因此,即使编一个像有可靠输出这样简单的程序,往往都是一项艰巨的任务。
非确定性语言可以用来搜索大范围空间,例如对于语法,穷举搜索是不切实际的。随机文本生成器,例如the Dada Engine和rmutt都是非确定性语言的例子。
更神奇的是,不确定性算法已经用于了超计算的理论研究中。
在互联网上,有一个规模小、但有活力的社区,聚集了使用和设计语言的爱好者,目前主要围绕着Esolang wiki进行(见下文)。
esolang社区偶尔会活跃,讨论的范围从争论某个语言是否图灵完备,到如何在编程环境中,将形象化的数学概念弄得抽象和难理解。有一个邮件列表,但几乎废弃不用,大多数时候是在wiki或在IRC上讨论。
图灵完备性是一个热门的讨论话题,因为语言的图灵完备性绝不是一眼就能看出的,而且往往需要证明方法上的飞跃才能解决。新语言和新功能不断被创造出来,因此,证明图灵完备性始终是一个挑战。
编程语言爱好者的另一个相关追求是混淆代码。
下面是一些深奥的语言的典型示例:
///是一门由坦纳斯·韦特(Tanner Swett)在2008年发明的编程语言。该编程语言只含有一个操作符——“/”,功能是替换字符串。
Hello World程序示例:
Hello, world!
稍微复杂的Hello World:
/ world! world!/Hello,/ world! world! world!
在上列代码中,第一次出现的“ world! world!” 先被替换为“Hello,”,得到了“Hello, world!”。随后的代码的功能为打印。
Befunge类语言允许使用代码,让指令指针在多个维度中漫游。例如,下面的程序将“Hello World”字符以相反的顺序压入栈,然后通过指令、、、、和以顺时针方向循环,并在循环中打印字符。
"dlroW olleH">:v ^,_@
二元Lambda演算
二元Lambda演算是从算法信息论的角度设计的,以便在最少的语句意义下写出尽可能密集的代码。它有一个29字节的自解释器,一个21字节的素数筛选器,和一个112字节的Brainfuck解释器。
Brainfuck的语言设计极为精简,并且能轻易写出混乱的代码。它的程序中只有8个不同的字符。例如,下面的程序输出“Hello World”:
++++++++++>++.>+.+++++++ ..+++.>++.<<+++++++++++++++.>.+++.------.--------.>+.>.