C 语言本身是用什么语言写的?

C 语言本身是用什么语言写的?

皮皮关,划重点:这里是游戏开发小班培训 http://www.levelpp.com

这个问题很有意思:

C 语言的编译器,是用 C 语言写的。

什么?C 语言是用 C 语言写的,这不就是“鸡生蛋,蛋生鸡”的问题吗?

要让 C 语言编译通过,就需要一个 C 语言编译器。但是 C 语言编译器是用 C 写的。那么世界上第一个能执行的编译器,是如何编译的呢?

这种编译器也用语言本身写的特性,称之为“自举”。

奇怪的是,这么一个让我们纳闷的问题,却很少有人提到。似乎大神们觉得很自然,不屑于说明。

直到后来学到一些编译相关的技术,才慢慢了解到这件事的原委。原因不复杂,我简化一下表述:

  1. 首先,简化 C 语言的设计,只选择最最基本、不得不实现的功能,形成一个 C 语言的子集。我们可以叫它 C0。
  2. 用汇编语言实现 C0 语言的编译器,由于 C0 功能很少,比较容易直接写一个编译器。
  3. 用 C0 语言去实现更多必要的功能,由于 C0 语言功能太弱,遇到不好写的地方可以用汇编来打补丁。最终你得到了一个改进版的 C0 语言,我们称之为 C1。
  4. 用 C1 语言去继续实现更多 C 语言功能,不好写的地方继续用汇编打补丁。可以得到 C2 语言
  5. 用 C2 语言去继续实现更多 C 语言功能,不好写的地方继续用汇编打补丁。可以得到 C3 语言
  6. 以此类推……
  7. 到 Cn 语言的时候,你已经得到了一个足够接近 C 语言的编译器。
  8. 继续迭代一两次……
  9. 终于,你得到了一份 C 语言的编译器。而前面的从 C0 版到 Cn-1 版的编译器,都可以扔掉了。

为什么要分 N 个步骤呢?主要还是为了解释 C 语言慢慢进化的历史过程。实际上不见得要分很多步,很多中间步骤只是代表了远古大神们迭代改进的过程。

如果大神足够神,可以更简化:

  1. 直接用汇编语言写一个 C 语言编译器。
  2. 然后再用 C 语言写一个 C 语言编译器的源码,用汇编版的编译器 编译这个 C 代码
  3. 即可得到一个可运行、可正常使用的编译器。

然后,那个用汇编语言写的版本就可以扔掉了。

如果你觉得这个故事有点意思,说明你可能是对编程感兴趣的人 :)。

理解这个问题的关键,是认识到:编译器,只是读取文本文件(源代码),输出某种计算机编码(比如机器语言)的程序。

既然编译器也只是个普通的程序,那么就能用任何语言编写。

所以,理论上来讲,你可以用 Python、Java 或者 Scratch 来写个 C 语言编译器【捂脸】。

只要加上读写二进制文件的功能,理论上像这样也能撸出来一个 C 语言编译器