无类型 Lambda 演算
相信点开这篇文章的您或多或少地听说过函数式编程这个名词。在摩尔定律失效的今天,对多核处理器的充分利用成为了一种越发重要的程序优化方法,而函数式编程也因为其并行运算亲和的特点在大众视野中越发频繁地出现。究其原因,离不开它从其理论上的祖先之一 - lambda演算那里所继承的特征。 而lambda演算这一起源于20世纪30年代,出自图灵导师阿隆佐·邱奇之手的形式系统如今已经发展成了蔚为大观的一个大家族,本文将展示其中最基础的一种:无类型lambda演算(这也是最早阿隆佐·邱奇提出的那种)
无类型lambda演算的基本规则
无类型lambda演算中能做的事情只有定义lambda(经常称为Abstraction)和调用lambda(经常称为Application),它们也是lambda演算中的基础表达式。
由于函数式编程范式对主流编程语言的影响,大多数程序员对lambda表达式这个名字已经不会感到陌生了,不过,无类型lambda演算中的lambda要比主流编程语言简单一些。一个lambda通常看起来就像这样:λx.x x
, 其中x是它的参数(每个lambda只能有一个参数),.
是分隔参数与表达式具体定义的分隔符,后面的x x
便是它的定义了。
也有些材料的记法不写空格,上面的例子要改写成
λx.xx
上面的x x
如果换成x(x)
, 可能更符合我们在一般语言中见到的函数调用。但在lambda演算较常见的写法中,调用一个lambda只需要在它和它的参数中间写个空格。此处我们调用x
所给出的参数就是x
自己。
以上两种表达式和定义lambda时引入的变量加在一起合称lambda项,我们在MoonBit里用一个enum类型来表示它
enum Term {
Var(String) // 变量
Abs(String, Term) // 定义lambda,变量用字符串表示
App(Term, Term) // 调用lambda
}
我们在日常编程中所接触的概念诸如布尔值,if表达式,自然数算术乃至递归都可以通过lambda表达式实现,但这并非本文内容的重心所在,有兴趣的读者可以参阅Programming with Nothing这篇博客。
要实现一个无类型lambda演算的解释器,我们所需要了解的基本就只有两条规则:Alpha转换与Beta规约
Alpha转换所描述的事实是,lambda的结构是重点,变量名叫什么没那么重要。λx.x
和λfoo.foo
可以互相替换。对于某些有重复变量名的嵌套lambda例如λx.(λx.x) x
,重命名时不能把内层的变量也重命名了,例如上面的例子可以通过Alpha转换写成λy.(λx.x) y
.
Beta规约则专注于处理lambda的调用,还是举一个例子
(λx.(λy.x)) (λs.(λz.z))
在无类型lambda演算中,调用lambda之后所需要作的事情仅仅是对参数进行替换(substitution),上面这个例子里就需要把变量x
替换成(λs.(λz.z))
,得到的结果是
(λy.(λs.(λz.z)))
想看更多的例子可以参见这篇文章:https://zhuanlan.zhihu.com/p/57972301
自由变量与变量捕获
一个lambda项中的变量如果在它所处的上下文中没有定义,那么我们叫它自由变量。例如(λx.(λy.fgv h))
这个lambda项中变量fgv
和h
就没有对应的lambda定义.
在进行Beta规约时,如果用于替换变量的那个lambda项中含有自由变量,可能会导致一种被称为"变量捕获"的行为
(λx.(λy.x)) (λz.y)
上面这个表达式在替换后会变成
λy.λz.y
λz.y
中的自由变量被当成了某个lambda的参数,这显然不是我们想要的。
变量捕获问题在编写解释器时的常见解决方案是在替换前遍历表达式得到一个自由变量 的集合, 做替换时遇到内层lambda就判断一下变量名在不在这个自由变量集合里面
// (λx.E) T => E.subst(x, T)
fn subst(self : Term, var : String, term : Term) -> Term {
let freeVars : Set[String] = term.get_free_vars()
match self {
Abs(variable, body) => {
if freeVars.contains(variable) {
//自由变量集合中有当前这个内层lambda的参数名,即会发生变量捕获
abort("subst(): error while encountering \{variable}")
} else {
......
}
}
......
}
}
此处我们介绍一种较少见但具有一定便利性的方法:de bruijn index。
de bruijn index
de bruijn index(德布朗指数)是一种用整数表示lambda项中变量的技术,具体地说,它用变量所在位置和原先引入它的位置中间有几层lambda来替换特定变量。
λx.(λy.x (λz.z z))
λ.(λ.1 (λ.0 0))
上面的例子中,变量x
和引入它的地方λx
中间有一个λy
, 于是将x