今天,”Linux 三剑客 ” 中一个非常古老的工具突然登上了GitHub 今日热榜:
——这竟是因为80 岁的原作者更新了。
是的你没听错,有人都 80 岁了还在改代码!
这位大神,就是加拿大计算机科学家——布莱恩 · 柯林汉(Brian Kernighan)。
与比尔盖茨、Java 之父、Python 之父等大佬齐名的他,开创的 “Hello World” 范式让每一位学编程的同学刻烟吸肺:
不管你学的什么语言,第一个程序就是学会输出它。
printf ( “Hello World!n” ) ;
cout << "Hello World!n";
print “Hello World!”
……
此外,C 语言的第一本编程著作,作者之一有他;Unix 系统的早期开发人员、AWK(Linux 及 Unix 中的文本数据处理工具)的共同创造者名单中,他也赫然在列。
如今老爷子已经满头白发,还活跃在 ” 一线 ” ——
今年 5 月,AWK 的 GitHub 仓库中,老爷子提交了新的 pull request,给 AWK 添加了一直没法做到的 Unicode 支持。
对此,网友的态度是这样的:
是什么让这位大佬常年保持编程热情的呢?
免试进入贝尔实验室
事情还得从柯林汉的大学时代说起。
柯林汉于 1942 年出生于加拿大,本科就读于多伦多大学工程物理学。
他形容这是一个给那些自己也不知道想学什么的人准备的 ” 大杂烩 ” 专业,但很幸运,刚上大一他就对编程开始感兴趣,学起了 Fortran 语言。
当时,计算机的发展还处于初期。他直到大三才见到全校唯一的一台晶体管计算机:IBM 7094。
由于太贵(时值 300 万美元),学生们并没有机会碰到它。
由此可见彼时工具的稀缺,所以正在学编程的柯林汉也就只是拜读了丹尼尔 · 麦克拉肯的大作,获得了 ” 颇丰 ” 的理论知识,实际并没有真正上手写过一行代码。
大一暑假,不知道他如何在一家石油公司找了个实习,任务是用 COBOL 语言给精炼厂开发优化软件。
鉴于这个语言他不熟,也没有编程经验,所以最后也没写出个像样的程序来。
虽然受了一点小挫折,但他对编程的热情并没有退却,回到学校继续研究。
大四毕业后,柯林汉决定继续深造,并拿到了 MIT 和普林斯顿大学的 offer。
由于去 MIT 要 7 年才能完成博士学业,且每周需做 30 小时的研究助理工作,而普林斯顿只要 3 年且提供全额奖学金,再加上柯林汉的好友就在普林斯顿,他毫不犹豫地选了后者。
在普林斯顿大学,柯林汉读的是电子工程专业,因为当时同样还没有专门的计算机系。
这完全没妨碍他前进。
读博期间,他先是得到了 MIT 的实习机会,有幸在后来的图灵奖得主费尔南多 · 科巴托(Fernando Corbat ó)门下干活,给一种叫作 Multics 的分时操作系统项目写代码。
转年夏天,他又得到了贝尔实验室的实习机会,在那里写汇编语言。
为了方便在 Fortran 程序中做列表处理,他还写出了一套函数库,他形容这份工作 ” 十分过瘾 “。
转眼到了博士毕业,柯林汉被直接留校任教,并在没有进行面试和研究成果展示的情况下,成为了贝尔实验室的正式成员,足以见其优秀。
而他和 Unix 的渊源也就此展开。
Unix 命名人
我们现在的大部分服务器、手机系统和物联网系统的底层基本都是基于 Unix。
而三大系统之一的 Linux 也是一种类 Unix 系统,可以说,Unix 是现代操作系统的源头之一。
说起来比较意外,这么一个重要的操作系统,其初代版本被后来的图灵奖得主 Ken Thompson 仅花 3 周的时间就搞定了。
当时的 Unix 还叫 UNICS (Uniplexed Information and Computing System),后来被柯林汉改成了现在的名字。
Unix 中有一个核心工具,叫做 AWK,柯林汉就是其发明者之一(名称中的 “K” 正是代表他)。
AWK 作为一种文本处理语言,只做过滤和转换文本行这一件事,却成为 Unix/Linux 平台上现有功能最强大的数据处理引擎之一。
在 Linux 系统中,它和 grep、sed 命令并称为 ” 三剑客 “,并占据 ” 老大 ” 席位,掌握了它,处理日常操作可以 6 到飞起。
如今,AWK 已经分化出三个版本,依然受到人们的欢迎,诞生 45 年仍未 ” 退休 “。
除了 AWK,柯林汉还发明了 AMPL,一种描述并求解大规模复杂数学问题的建模语言,支持世界上大部分的求解器。
还有编译器 Ratfor、文档编制预处理器 Pic、Grap 和数学排版语言 Eqn 等这些重要研究成果背后都有他的身影。
除了写代码,柯林汉还很爱写书,且诞生了不少经典之作。
比如你想了解 Unix 的历史,就可以看《Unix 传奇》,作为参与者和见证人之一,他写的这本书可以让没有足够专业技术背景的人也能欣赏 Unix 的思想。
△《Unix 传奇》
而文章开头所说的 “Hello World” 范式,则是出自于他与 C 语言之父丹尼斯 · 里奇(Dennis Ritchie)合写的开山之作《C 程序设计语言》。
再比如柯林汉的第一本著作《The Elements of Programming Style》(《编程格调》),则留下了一个以他名字命名的定律——柯林汉定律,即:
调试一段代码的难度是编写它们的两倍。按照这个定义,如果你的代码写得非常巧妙,那你可能没有足够的能力来调试它。
(相比于复杂代码,简单的代码更可取。因为调试复杂代码的过程中,任何问题都会十分棘手,甚至无法解决。)
解决问题靠拖延?
那么,柯林汉本身是个什么性格的人呢?
2021 年他接受《程序员》采访时,曾被问了这么一个问题:
肯(Ken)用 3 周创造了 Unix,道格(Doug)在几天内就提出了 ” 管道(pipe)” 的想法,你们工作效率这么高,有什么诀窍吗?
(以上两人都是他在贝尔实验室的同事)
对此,柯林汉连连摆手:
他们是” 别人家的程序员 “,我可从没这么高效过!
老爷子说了,遇到新问题,他的解决方案通常简单粗暴,那就是尽可能地拖延,以及祈祷问题消失,或者祈祷问题自己解决自己。
这个玄学办法本身是不能解决问题的,但这样做,柯林汉有足够时间消化问题,然后想出对策。
而且,他其实会选择直接动手搞定问题。
今年 1 月 1 日,柯林汉刚好过 80 岁生日。
上个月,油管频道 Computerphile 对他进行了采访,大伙儿才知道,老爷子还在改代码!
柯林汉说,没有任何一种计算机语言或工具是万能的,AWK 也不例外。
此前,AWK 只适用于 ASCII 或 8 位输入,不能处理 Unicode(统一码)。
△图源 Youtube 频道 Computerphile 视频
几个月前,柯林汉花了点时间,折腾了一下 AWK ——他称它是 ” 一个非常古老的程序 ” ——现在 AWK 可以处理 UTF-8 输入和输出了。
现在,用户已经能用正则表达式提取日语字符以及类似的东西。
视频中柯林汉还顺口提了一嘴,他修补了一些 ” 又快又脏 ” 的东西,让 AWK 可以处理 CSV 文件。
△图源 Youtube 频道 Computerphile 视频
整个采访过程,老爷子依然健谈,精神面貌也不赖。
话说回来,精力充沛的他,对几十岁的 ” 古老程序 ” 改改改,还有啥原因呢?
柯林汉的回答是这样的:
今天的计算环境,和三、四十年前非常不同,内存量也大大扩充了,” 这会改变你对 AWK 的思考方式,尤其是 AWK 运行不起来的部分 “。
所以,老爷子一直偷偷在后台玩儿新版本的 AWK,目的是尽可能做拓展,让 AWK更容易实践和使用。
这其实是柯林汉一以贯之的行事准则,此前,他就在播客 CoRecursive 中表示过:
如果做些能对自己有帮助,又对他人工作有所改善的事,何乐而不为呢?
有意思的是,世界上没有万能工具,也没有万能通才。老爷子自己就承认说,他的 bug 是还没完全搞懂 Git 怎么用。
所以他只能通过电子邮件,把更改发送给当前的维护人员。
△图源柯林汉的邮件网友:Hacker 永不退休
80 岁高龄还要修改几十年前写下的代码,这位程序员届卷王的故事再次引起了网友关注。
自面世起,AWK 就广受欢迎。看到 AWK 在今天依然能得到完善,变得更强,不少人对老爷子的敲代码热情表示 respect。
有的网友表示了对老爷子的感激。
还有人觉得,为改善程序员写代码的环境不断付出,是一件很鼓舞人心的事情。
当然少不了玩梗的人。
Hacker 永不退休!
One More Thing
最后,让我们回到 “Hello, world”。
这句 ” 万物开头 ” 其实最早是在柯林汉 1974 年撰写的《Programming in C: A Tutorial》中首次出现,后来才被合写进那本经典之作。
该书中两位作者形成的写代码风格,也被称为K&R 风格(K&R 即指柯林汉 Kernighan 和里奇 Ritchie)。
有意思的是,柯林汉表示这本书是自己强行拉着丹尼斯写的。
至于为什么选择用 “Hello, world” 而不是别的,柯林汉自己都记不清了。
在接受福布斯杂志访谈时,他模模糊糊回忆:
可能是因为看了个动画片,里面有一个鸡蛋和一只小鸡,小鸡说了句:Hello,World!