如何翻译/研究从未接触过的外星语言?

如何翻译/研究从未接触过的外星语言?

One Two,效果拔群。

「从未接触过的外星语言」,这个问题看起来似乎无从下手,其实在地球上我们已经经历过类似的情况。我们已经注意到某些动物的交流方式可能就是我们「从未接触过」的语言;而对古埃及象形文字(圣书体)的研究历程也无异于破译一种「外星文字」。

先说说古埃及圣书体的故事。目前认为圣书体发源于 5200 年前(即公元前 32 世纪)的青铜时代早期,在中王国时期(公元前 21 世纪~前 18 世纪)形成了成熟的书写文字体系。圣书体在公元 5 世纪后由于缺乏使用场景被逐渐遗忘。

古埃及圣书体︱Wikipedia

从公元 5 世纪到 18 世纪间,有数次对圣书体的破译尝试,但都未取得实质性突破。直到 19 世纪初,在英国学者托马斯·杨(Thomas Young)和法国语言学奇才商博良(Jean-François Champollion)的联手努力下,圣书体的本意才得以重见天日。

托马斯·杨(Thomas Young)︱Wikipedia
商博良(Jean-François Champollion)︱Wikipedia

回顾这次成功的古文字破译过程,除了杨和商博良两人的天才,还有一个至关重要物件,那就是 1799 年在埃及出土的一块石碑,因在港口城镇罗塞塔的郊外被发现,也称「罗塞塔石碑」。

罗塞塔石碑,现藏于大英博物馆︱Wikipedia@Hans Hillewaert

罗塞塔石碑上刻录了古埃及法老托勒密五世颁布的一则政令,主要叙述了托勒密五世自父亲托勒密四世处袭得的王位之正统性,与托勒密五世所贡献的许多善行,例如减税、在神庙中竖立雕像等对神庙与祭司们大力支持的举动。让罗塞塔石碑在破译圣书体过程中发挥关键作用的,并不是政令内容,而是诏书的刻录方式:石碑上有三种文字,记录了同样的政令内容,三种文字自上而下依次是圣书体、世俗体和古希腊文。石碑上独特的三语对照文本意味着学者们终于找到了一把破译圣书体的「钥匙」。1822 年,商博良致信时任法兰西文学院秘书邦 - 约瑟夫·达西耶(Bon-Joseph Dacier),宣布自己完全破译了罗塞塔石碑上的象形文字。

某个版本的石碑复原图︱Wikipedia@A. Parrot

如果要翻译外星语言,一段「罗塞塔石碑」式的双语对照文本将会必不可少。问题是两个文明在从未接触过,双语对照又从何谈起?我们需要寻找一些地球文明与地外文明可能会共享的信息。目前科学界普遍认可数学是宇宙通行的「语言」,很多科幻作品中都会描述星际文明与地球的最初沟通内容是数学;宇宙中普遍存在的物理实在也可以作为一种翻译「中介」,例如氢元素或电磁波的一些性质。

学好数理化,走遍宇宙都不怕︱电影《超时空接触》

我们过去设计的一些 SETI 信息会在一开始加入这类「罗塞塔石碑」式信息,例如先驱者金铭牌上和旅行者金唱片的封面都给出了中性氢原子超精细跃迁图像,以定义整个信息中长度与时间的基本单位。

中性氢原子超精细跃迁现象对应的长度和时间分别是 21.106 厘米与 0.704 纳秒︱NASA

接收外星信息时使用到的仪器所依赖的科学技术也会是重要的突破口。比如我们通过射电望远镜收到了地外文明发出的信号,某种程度上就说明地外文明拥有与我们相当的无线电通信技术。


古文字终究还是人类自己创造的产物,而对动物的通信模式的研究可能更接近于研究一种人类从来都没有了解过的「语言」。多伊尔(Laurance R. Doyle)等学者 2011 年在《宇航学报》(Acta Astronautica)上发表了一篇名为《信息论,动物通信与地外智慧生命搜寻》[1](Information theory, animal communication, and the search for extraterrestrial intelligence)的文章。几位作者认为,不管是什么物种,要传递智力(即复杂的知识),就必须遵守信息理论的某些规则。他们从信息论的角度分别考察了人类文字与宽吻海豚、座头鲸以及树栖松鼠猴等一些动物的通信系统,具体来说就是研究他们是否符合齐普夫定律(Zipf's Law)[2]

所谓齐普夫定律,简单理解就是在一段文本中某个高频词的出现次数反比于该高频词出现次数的排序。具体来说,第二高频词的出现次数是最高频的一半,第三高的又是最高的三分之一......出现频次排名第十的词汇,其出现次数是最高频词的十分之一。

齐普夫定律是在人类语言文本中发现的,但几位学者发现宽吻海豚与座头鲸的声音交流系统竟然也符合人类世界的齐普夫定律。

如果一套信号系统符合齐普夫定律,该系统的齐普夫斜率应落在 -1 附近︱参考文献[1]

不仅如此,人类语言文本遵循的高阶信息熵结构(high-order information-entropic structure)特征也在宽吻海豚的声音交流体系中出现了。

在人类语言中,随着信息熵的阶数(词语 / 字母数量)增加,总信息熵在逐步降低︱参考文献[1]

严格来说齐普夫定律和高阶信息熵结构都只是语言的必要不充分条件,所以即使宽吻海豚的交流系统在这两个指标上与人类语言接近,也不代表海豚就一定拥有像人类一样的语言系统。但这种定量研究非人类通信系统复杂性的过程为我们探测地外生命提供了全新思路,比如可以在未来的地外生命搜寻项目中加入基于信息论方法的仪器或算法。