为什么除了汉语以外的其他语言大多用表音文字?

为什么除了汉语以外的其他语言大多用表音文字?

路易·罗莎,少年梦阅读《美洲日不落》欢迎阅读

先说结论:因为表意文字基本都是原生文明本族人使用,而拼音文字(表音文字)则都是外族人借去原生文字发展而来的。

感慨一下,这个问题其实早该终结了,但竟然持续有人凑热闹回答,而一些高票答案讲了很多故事,嗯很好就凭码了这么多字确实值得赞一下(但其实内部的论据和逻辑有很多问题,这里不多说了)。实际上这个问题远没有这么复杂,对世界各大语言、文字以及相关的世界史有所了解应该都可以自行领会出答案。

下面我也开始讲故事吧。

1、原生文字的形成:从原始图画 / 刻画符号到象形文字

原生文字就是在发明创制之前没有参考借鉴任何别人的文字系统的文字,一般来说公认的原生文字有以下四套:埃及圣书体、两河楔形文字、汉字、玛雅文字,以及零星几种不怎么为人所知的文字,包括纳西族的东巴文(去过丽江旅游的同学应该会印象深刻)。

那么现在的问题就是:为什么会出现文字?文字是怎么出现的?对于解决题主的疑问,后一个问题更为关键。

通过对上面几种表意文字的考察,尤其是最为直接的东巴文的观察很容易发现答案,而这个答案同样存在于中学的历史教材当中,相信很多人都还没忘记。

在进入文明之前人类早就已经使用口头语言了,但是那时候的人并不懂得也没有需求想要去把说过的话记录下来,因而往往就是说过就算了。当人类逐渐走向文明、生产力逐渐提高之后,便逐渐有了记录的需求。

你是最早的那个“国家”的智者,你被“国王”要求找个办法记录下我们这个文明的丰功伟绩,你会怎么做,拿什么来进行记录?

对于现代人而言,使用文字早就习以为常了。但是对于文明初期的人来说,这个真是个头疼的问题。有些文明选择了一种非常特别的方式——结绳记事,这个技术在印加文明当中高度发达几乎能够达到文字的水准。而大多数新石器时代的人则还有着另一种更为直观的记录方法——画画。

在欧洲,西班牙阿尔塔米拉洞窟壁画和法国拉斯科洞窟壁画都是石器时代产物,距离文明传播到这些地区可能还有万年的时间差。由此可见,画画这种记录方式由来已久。随着生产力的进步,画画也越来越抽象,传达的信息也不再只是满足于把一个场景描绘下来。对印第安人的研究中,就有一个经典的“少女书信”——这个少女想要跟心上人约会,把时间、地点用简单的笔画都画在信上。随着人类画的画愈发抽象,传达的信息越来越丰富实在,也开始有了一些高度符号化的记录方式——刻画符号(在现代意义来说,就相当于我们打个叉意味着“错误”又或者“目的地”)。而这些,都是象形文字的爹妈。

现在你作为一个智者,大概知道对于刚进入文明时代的人来说,会采用什么方式来记录语言了吧?很简单,就是画画!当然我们不用再像古人那样一个一个场景地画,我们要做的,是一个词一个词地画

于是乎,那些个原生文明的原生象形文字就这么诞生了。在中国则出现了仓颉造字的传说——传说中,仓颉正是照着大自然来“画”出了那原始的 20 来个字,逐渐发展成后来我们能见到的甲骨文。

如图所见,处在偏僻地区的东巴文等小民族的文字不像“四大文明”那样能够快速发展,所以他们的文字也相应地保留了非常明显的原始特征——文字所“画”出来的内容非常实在。

2、文字的进化:从象形文字到意音文字

(注:我对汉字演化一知半解,因此以下举例的汉字可能并不是这么产生的,仅作为举例帮助理解)

但是象形文字只能记录实在的东西——我们能见着的事物,比如天上飞的、地上爬的、水里游的,这些确实能表达我们语言当中的不少词汇,但是远远还不够。一开始古人的解决方法有两种——指示会意。指示就像“上”“下”这样的字,指了个方向,你总该懂了吧;而会意则像语言当中的复合词一样,用两个甚至三个语素来构成一个新的词汇,新的文字也同样用别的两到三个文字来组合,就像“歪”字,就是“不正”的意思。这样似乎都解决更多的单词了。

但是!还是不够!更抽象的词汇怎么办?就像“聾(聋)”我们该怎么象形出来、怎么会意出来呢?总不能把“聽不見”三个字硬塞在一个方块里吧?古人挠破脑袋,终于发现了一个问题——“聾”字和“龍”字同音啊,我们用“龍”字来书写“聾”这个意思不就好了?!但是会不会有误解啊?那就在“龍”字下面再加个“耳”字来表示这个字跟耳朵相关呗!哈哈哈哈我真是太天才了!!!(请无视最后一句话 =v=)

就这样,形声字便诞生了。这种造字方式极其便利,任何字我们不想挠破头去画出来或者会意出来的,我们就先写下它的同音字作为声旁,再给他加个关于它的形旁就好了。更有甚者,连形旁都不要,直接占据了原来的那个字,就像“其”字原来表达的是“箕”(那种容器),却被代词“其”给占去了,而原来的容器只能加上个竹字头以做区分。这便又出现了假借字

形声字和假借字越来越多,尤其是形声字已经占据了汉字当中超过三分之二的字,因而汉字早就已经不能算是“象形文字”了。一般来说更准确的说法叫“意音文字”,但意音文字跟表音文字(拼音文字)依然是截然不同的,无论其表音成分有多么多。

而走向意音文字并不是汉字的专属,那些原生文字(包括埃及圣书体、楔形文字、玛雅文字)统统发展成了意音文字。从上面的描述中应该能够很容易理解其原因——完全象形是无法描述我们语言当中的所有词汇的,大量的抽象词、高级词需要别的方式来进行记录,其中最简便的就是记音。

注意,在文字的分类上,意音文字依然属于表意文字这个大类当中,而不属于表音文字(拼音文字)。

这一部分还有一个许多人关心的问题——表意文字会不会自己演化成表音文字?根据表意文字的历史发展,一般来说,本族所使用的表意文字通常不会自行变化成表音文字,因为这种文字已经是最适合这种语言的记录方式。就像汉字,在汉朝定型之后其字形结构再也没有过本质的变化。而古埃及文字随着古埃及多次被外族征服而淹没在历史当中,我们无法观察到这个问题的发展,玛雅文也是同理。而苏梅尔人的楔形文字在两河地区很早就变成表音文字,但需要注意的是,苏梅尔人很早就失去了对两河的统治,继而被阿卡德、巴比伦等一系列外族国家所统治,其文字也很早就被外族人拿去记录他们自己的语言,这才是楔形文字完全表音化的原因所在,也正是下一部分所要论述的。

有个唯一的例外是彝文,原本彝文是表意文字,据说在上个世纪已经发展成了纯表音的音节文字。

3、表音文字的形成:外族人借去发达文明的文字来记录自己的语言

这一部分是解答题主疑问的关键,所谓的“大多数国家”为什么主要使用表音文字。

要注意,文明的发展并不是封闭的,不同的民族之间存在着交流,在中东地区和欧洲地区这种交流特别频繁。上面已经说到两河统治权不断更易,使得楔形文字很早就发展成了表音文字,其原因正是外族拿了楔形文字去记录自己的语言。

而地形相对封闭的埃及则使古埃及文明延续得更长时间,一直到公元左右古埃及文字和语言依然保持活力,直到最后被阿拉伯人完全熄灭。而更加封闭(但是纵深也相当大)的中华文明则有幸将表意文字一直延续了下来。但是汉文明并非不跟外族进行交流,其中最典型的交流就在汉 - 日之间。日本的文明发展相对较慢,在隋唐时期依然羡慕中华文明的高度发达,多次派使者到中原学习,也因此把汉字带回了日本。

谦逊的日本人对汉字毕恭毕敬,认为这是非常先进的文字(其实是因为其使用者的文明非常先进),而记录自己的语言(古日语)也应当使用这一套文字。但是每一种文字都有自己最适合的语言(反之亦然),汉字是用来记录汉语的,汉字 - 汉语之间就可以做到高度吻合,使用起来没有任何不适。但是日语不然,日语跟汉语甚至处在不同的语系当中(汉语归属于汉藏语系,而日语目前被认为是孤立语言),发音、词汇、语法差异非常明显,直接用汉字去套日语并不合适,虽然日语当中确实存在非常多的汉字词,是把汉字的发音也顺带借走了的(音读)。但是音读不能解决所有问题,毕竟日语还是日语,并没有因为借词而变成汉语的方言,日语自己原有的词汇怎么办?一个办法就是套意思,你的“空”指的是天空,我日语里是そら(sora),那我就对着“空”这个字读そら好了而不必音读成こう或者くう,这便产生了训读。这种方式又解决了一大堆的日语本族词汇,并且导致了日语学习者总是很头疼的一个现象——一个汉字可能有音读和训读两中发音,就像“水”有可能是みず(mizu,训读)也有可能是すい(sui,音读)。

但是靠整词借去(音、形、义全部借走的汉字词)+ 训读,也最多只能解决大半的日语词汇,而更多的小词,包括语法成分,该怎么办?那些助词又该怎么办?实在没办法,日本人也走上了用汉字来记音的道路,比如 ka 这个音,就拿“加”字来记,而 i 这个音则拿“以”字来记。这些纯表音的字跟上面的音读汉字词和训读汉字词混杂在一起,会让现代中国人读起来莫名其妙,总觉得能看懂又似乎看不懂……

随着日本文明的继续发展,日语里的所有读音都有了自己所能够对应的记录其发音的汉字,又为了能够跟真正的汉字词区分开来,那些纯记音的汉字在字形上逐渐有了两种变化,一种是变成像汉字草书一样的字形,叫做“平假名”;另一种则是拆下那个字的其中一个部首或一个字形部分,叫做“片假名”(“片”就是只有一部分的意思)。假名便就此诞生。

假名是一套完整的文字系统,日语完全可以不使用任何汉字、仅使用假名来记录其语言。而假名作为一套纯表音的文字系统就是“外族人借去表意文字记录自己的语言变成了拼音文字”这一论述的非常有力的证据。

在西方,同样的表音化过程出现在了腓尼基人当中。腓尼基人住在黎凡特地区(地中海东岸),主要聚居于黎巴嫩,从地理位置上看夹在埃及和两河之中,受这两个文明的影响很大,是一个次生文明。作为一个商业民族经常到处跑,尤其是其造船、航海技术也十分精湛。而当时最先进的文明之一埃及也自然是腓尼基人的重要的商旅目的地。要跟埃及人通商,腓尼基人怎么也该学两句古埃及语。同样处在闪含语系当中,腓尼基人学习古埃及语并不算太费劲,接下来他们也把圣书体(甚至其变体僧侣体 / 世俗体)也学会了,读起古埃及文献来腓尼基人浑身舒畅(雾)。而作为商业民族,记录的需求是非常强烈的——我们要记帐啊,要把价格啊数量啊什么的白纸黑字(那时还不是白纸的说)清清楚楚地记录下来才能算诚信交易对不对?

既然我们学会了圣书体这么伟大的文字,腓尼基人就根本不需要自己再去把文字给画一遍演化出来,直接拿圣书体去用了。而据说,那个年代的古埃及文字的表音成分比现代汉字更甚,所以不像日本人还把字形的表意功能保留下来,而是完全用圣书体来表音,直接记录腓尼基语的发音。由于同为闪含语系的语言,古埃及文的表音成分和腓尼基字母都只记录了他们语言当中的辅音(记辅音就够表达意思了,可以参考阿拉伯文)。而嫌古埃及文字字形复杂的腓尼基人还把其字型也简化了许多。腓尼基字母这套纯表音文字便诞生了,并且成为了非常多拼音文字的祖先。

古典时期虽然民族之间交流频繁,但效率远远不如现在,所以在交流过程当中文字的字形也有诸多变化。古希腊人通过跟腓尼基人通商、交流发现:他们的字母不错啊,记录语言可真方便啊!我们也借来用吧。于是乎,懒惰的希腊人(雾)也省去了自己画画的步骤直接拿了已有的拼音文字腓尼基字母去用,并且修改了其字形和发音,尤其是元音很重要的印欧语不能像闪含语那样只记录辅音,因此把好些个腓尼基字母改成了元音。而同样的“懒惰”的过程继续传播下去(想想懒惰毕竟是人类的天性,已经有了好东西何必自己辛苦再来做一遍呢?),从希腊字母又继而衍生出了拉丁字母、卢恩字母、西里尔字母、科普特字母(记录古埃及语的直系后裔科普特语用的,绕了一圈又回到了埃及……)等等等等。

而随着罗马帝国的强势,罗马人所使用的拉丁字母成为了欧洲“最先进”、“最有文化”的代表,很快将卢恩字母等民族文字给绞杀了,被诸多欧洲民族和国家采纳使用,其中最重要的当然就是西欧的那些后来的殖民大国,尤其是不列颠。随着殖民国家在世界上的强势,拉丁字母也跟着扩散到了全世界,使用拉丁字母的国家合在一起力量是其余所有国家总和的数倍,文化影响力也是巨大的。在这样的一个大环境下,诸多非印欧语也采纳了拉丁字母来记录自己的语言(如土耳其语、马来语等等,以及几乎整个黑非洲)。

跟古埃及文字→腓尼基字母→希腊字母以及汉字→假名有着相似发展历程的文字还有很多,包括印度的诸多文字(最早也可以溯源至两河与埃及文字)、安拉胡阿克巴的阿拉伯文。而印度文字从原始婆罗米文字发展出来非常多的后裔,在南亚和东南亚被广泛采用,而其最远的后裔则到了朝鲜半岛。韩文或者称谚文的直系母亲一般认为是八思巴文,也有认为来源于梵文 / 天城体的,而八思巴文来源于藏文,藏文又来源于梵文,所以无论如何谚文依然会被放在婆罗米一系当中;韩文还有特别之处在于模仿汉字使用方块的结构来书写,很大程度上也受汉字不少影响。

到这里,应该已经能够明白为什么拼音文字占据了绝对的数量上和范围上的优势了吧——毕竟原生文明、原生文字就那么几个,其他的民族都是懒惰的不会重走一遍原生文明的造字之路,通常会直接借别人家的文字来记录自己语言的发音,若有不合适的地方(一言不和)就改字形,便形成了如此丰富多彩的文字世界。

最后做些补充,感谢评论区人民。历史上汉字除了传播到日本外在周边地区都有很大的影响,因而历史上的不少民族也一样会借汉字去记录自己的语言,其中越南人借去的过程当中非但没有纯表音化变成拼音文字,反而还借助六书的规律新造了诸多适用于越南语自身的“汉字”,称作“喃字”,完整地保留了整套表意系统。最后是在法国殖民时期才改用拉丁字母来进行记录。

喃字的出现一定程度上是由于越南语和汉语一样同样是单音节分析语,而另一方面也说明了外借文字不一定会完全表音化。不过反过来,表音文字基本上都是借去的文字而绝无原生文字这一点则依然成立。对于一个民族的一个语言来说,适合自己的才是最重要的——汉字跟汉语高度吻合,没有任何不适,就完全没必要拉丁化。而那些借入人家的文字的民族之所以需要将文字改成拼音文字,也同样是一种使文字适应于新语言的过程。

以上です。