既然可以用拼音打字,当初为什么推广五笔?

既然可以用拼音打字,当初为什么推广五笔?

知乎用户,每日翻看技术词典

因为拼音打字想要好用,起码要有 7 万条词库,7 万条单词存储空间至少要 2m,而当初电脑没有 2m 存储空间。

就是这么简单。当初的电脑装不下大词库版的拼音输入法,只能装得下不需要词库的五笔等字形输入法。王码五笔安装包大约 200k,可以装在 82 年以后的大部分电脑上。


下面详细说说。

这是七年前的问题,但前排答案回答的不具体。

最初五笔或者郑码成为主流输入法,是因为当时电脑内存太小,存不下拼音输入法需要的大词库。

常用汉字至少 7000 个,但汉语拼音只有 400 个有效音节,一个音节平均对应 17 个字,所以拼音输入法重码率极高。

我们现在降低拼音重码的方法就是使用词组输入或者短句输入。比如 “重”“码”两个拼音都对应着几十个同音字,单独打需要翻好几页找字,但输入“重码”立刻可以找到正确的汉字。

所以拼音输入法需要大词库。词库比字库大多了。搜狗拼音输入法的标准词库大约 40 万条词汇,单纯一个词库包的体积就是 14m。

哪怕是一些号称“清爽”“轻便”的拼音输入法,内置词库也至少有 20 万条,词库体积不小于 10m。再少了就不好用了。

请记住这个容量。

这是联想早期的 386 电脑,1m 内存,没有硬盘,售价大概 7000 元。是普通人两年的工资

五笔输入法出现于 1983 年,当时市面上常见的 286、386 电脑的内存只有 1m,甚至 512k,很多电脑没有硬盘,只能依靠软盘驱动器。而最先进的软盘容量是 1.44m。

这种容量下,根本不可能安装拼音所需要的大词库。

早期微软全拼只有一个大约 1000 词的词库,聊胜于无,打字非常麻烦。你说它词库容量小吧,你打什么他都给你联想单词。你说它有词库吧,联想出来的词全是你不想用的,打字非常费事。

对了,你们家有机顶盒吗?如果你想体会当时微软全拼打字的感觉,可以找个机顶盒,用遥控器试试内置的输入法,就知道有多别扭了。每分钟输入不超过 10 个字。

五笔输入法并不依靠词库去重,也不需要大词库,所以五笔输入法体积只有 200k ,完全可以安装在 286 电脑上。稍加训练就可以达到 100 字以上的输入速度,效率碾压拼音输入法。

开头我为什么说 7 万条的词库?因 1995 年,智能 abc 输入法出现了。它第一次让拼音输入法有了实用价值,打字速度可以提升到 50 字以上,而它所依靠的,就是大词库和整句输入模式。

智能 ABC 的词库有 7 万个词,是当时最大的词库,极大降低了拼音输入法的重码率。使得汉语输入有了另一种选择。

(补充说明:智能 ABC 的整句输入,不是我们现在输入法的整句输入。现代输入法打完一句话后会根据上下文语意自动调整里面的字词,比如"它的尾巴",写上“尾巴”后前面的 ta 就自动变为它。

智能 ABC 的整句输入,是你输完一句话的所有编码,再逐个选择正确字词。这看起来还是很笨重,但比起之前的每打一个字词就要选择一次,这种先打字再集中选字的方式使得打字更流畅,选字更集中,就这一点改变,就让打字速度从 20 字每分钟直接提升到 40 字每分钟!效果拔群!)

智能 abc 不但有大词库,还有整句输入后再选字以及中英文混输功能,避免了来回切换输入法,使得输入更流畅。还支持自定义词组,你可以自己造词了!

但为了支持这些高级功能,智能 abc 输入法的体积也到了惊人的 5m,是五笔输入法的 25 倍。其中 2m 给了词库,还有 3m 用来调用词库,迅速找到备选字。是的,要流畅操作一个 2m 的词库,你还得有足够强大的缓存和 cpu。

如果强行将智能 abc 移植到 win2.1 版本上,你会发现系统反应不过来,一旦打字速度稍快,智能 abc 输入法就漏字。但五笔你打多快都不会漏字。就是因为检索 7 万条词库是个大活,内存低了硬盘慢了缓存小了都跑不动。

所以智能 abc 一直到 1995 年才出现,预装到 win95 中文版操作系统中。那时候电脑也有了 100m 以上的硬盘和 4m 以上的内存,能够运行 5m 的输入法了。

但即便如此高速检索 7 万条词库也是个大活。智能 abc 支持自定义词组,自造词超过 30 个,整个软件就不稳定了,随时会崩溃溢出。那时候去网吧必备的技能,就是利用智能 abc 的输入法 bug,搞崩溃美萍网吧系统,偷着上网。

所以拼音输入法需要极高的硬件支持。在 486 电脑出现之前,拼音输入法只能实现“打字”功能,却无法流畅打字。到了奔腾电脑上,智能 ABC 也只能是“较为流畅”的打字。

直到 2000 年,电脑再次升级,128m 内存成为标配后,拼音输入法才进入腾飞的年代。紫光开始支持真正的整句输入了,黑马语素库上升到数千万字内容,微软拼音、拼音加加异彩纷呈,直到搜狗出现,成为了集大成者。

更大的词库,更多的语素库,动态词频,整句输入,云词库,一项项技术伴随着硬件的提升而出现,拼音输入法越来越好用,也越来越普及。

而这一切都是硬件及大丰富的结果。我们现在已经无法相信,当年电脑没有硬盘,甚至内存不足以显示汉字,更别说打字了。所以才有了这样的问题。

五笔则与硬件进化无缘。

它天生就是为了用 200k 的体积高速输入汉字而存在的。

现在硬盘空间扩张了千万倍,但五笔用不上这么大的空间了。

回到问题。为什么当初推广五笔?

就是为了在有限的硬盘空间上流畅打出汉字。

当然五笔不是唯一的选择,还有郑码、无虾米、区位码等多种形码或者音形码输入法。他们共同的特点都是,不依赖大词库准确输入汉字。

它们都在降低重码上下功夫,试图用人脑来代替电脑存储无尽的单词。

他们从未想过,有一天电脑硬件会极大丰富,电脑会主动帮你选出你想说的那个字。