主题 : 观点:输入法这事上,英文已经输给了汉字
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 604963
威望: 528524 点
无痕币: 3089 WHB
贡献值: 0 点
在线时间: 61681(时)
注册时间: 2008-12-25
最后登录: 2024-03-29

0 观点:输入法这事上,英文已经输给了汉字

一个秋日的早晨,斯坦福大学的穆兰尼向我抱怨现行的QWERTY电脑键盘布局。他并不是一名技术人员,也不是德沃拉克键盘(一种将常用字母都归在一起,以期提高打字速度键盘布局,1936年由美国人奥古斯特·德沃拉克设计——观察者网注)的忠实粉丝,他研究的是中国现代史。我们正在一起策划一个关于中国打字机和键盘的展览,在策展的过程中穆兰尼得出结论:在西方人执迷于QWERTY键盘布局时,中国在科技上早已把西方甩在了身后。

他的观点至今仍非主流。由于汉字有将近7.5万个,远比字母体系复杂得多,因此历史上人们一直认为中文与现代科技是不相容的。如何用打字机打出汉字,用汉字发电报,甚至如何用汉字与现代世界沟通?如果你是一个剑桥毕业的、熟悉并热爱希腊文的西方古典主义者,也许会得出结论——汉字是古老迂腐的,再由衷赞叹一句“字母表万岁!”
但是,穆兰尼却认为,计算机的发明可能会将庞大汉字字符库的劣势转变为优势。
穆兰尼近期与人合作出版了两本有关计算机和中文打字机的书。他跟我聊了聊研究的收获。他的发现让我十分激动,因为这不仅关乎中国,更关乎人与计算机的关系。计算机不只是硬件,它更是沟通人与软件的媒介。他说:“使用QWERTY键盘是与电脑沟通最早、最原始的方式。你按下A,屏幕上就跳出字母A,实际上这一操作并未充分利用电脑处理器和内存的性能,可以说是大材小用了”。然而在中文电脑上使用QWERTY键盘键入字母A,电脑就会给出与这个A关联的所有汉字。在电脑上输入中文要求计算机各层软件协调工作,用户在使用电脑的过程中很容易就可以发现这一点。
换句话说,输入中文的本质是给电脑一串指令,电脑给出你要输入的汉字。穆兰尼认为会打字的中国人都是“懂代码的人”。现在有各种各样的中文输入法,但是西方世界却仍然只能一个字母一个字母地打出想要的内容,无法靠升级软件带来任何输入法的进化。“很多人一个半世纪以来都坚信字母体系是最科学的文字体系,你很难改变他们的想法”,穆兰尼说。
穆兰尼表示,历史上中文打字方式非常落后,但正是这段历史激励着中国人在计算机软件大发展时代充分利用软件优势,最终使得现在输入中文的效率超过了输入英文。
1871年电报进入中国的时候,最早使用电报的那一批人不得不在语言面前向西方科技低头。一位荷兰的天文学家和法国的海关官员提出了解决方案,即给每个汉字一个四位数的电码,再将电码编成摩尔斯电码的点划线。这的确是有用的,但是却使得中文传输处在弱势地位。摩尔斯电码用五位点划线表示数字,而只用一至三位点划线表示字母。这使得发送中文电报既昂贵又没有效率。据一些人说,前总理周恩来出访时,发送电报是最大的一笔开销。
中文打字机也十分笨重,2000多个常用汉字挤在厚重的底盘上。打字员通常需要在键盘上找到对应的汉字,重重地将推杆敲在纸上。如果你要打的不是常用汉字,那么就得在备用底盘上,大海捞针般地从几千个汉字中找出你要的那一个。
与此同时,也有许多人在不断尝试寻找发送电报更简便的方法,试图发明更适合中文输入的打字机。为此,他们必须找到汉字新的索引方式,把汉字分解成一个个小部分。比如四角号码检字法就以汉字四个角上的形状对汉字分类。十种不同角的形态被冠以0到9十个数字,以顺时针键入四个角的形状所对应的代码,就能打出相应汉字。如果你不会写汉字,你也许不会觉得这个发明多么精妙。但事实上,这是对于汉字彻头彻尾的一次再思考。
打个比方,这就像是你不再一个一个字母地输入英文单词,而是根据上伸(如d,b,l,h)或下探(如p,y,g,j)的字母个数来表示单词。以抽象代码的方式进行检索,这一想法某种意义上来说是中国人的创新。

穆兰尼说,随着计算机的普及,中文输入法的种类愈发多样,在上世纪七八十年代甚至掀起了输入法战争。不同的输入法对思考汉字提出了不同的要求:也许是按照四个角来思考,也许是三个角,也许只是部首,或者是笔画顺序。还有一些人则尝试了拼音输入法,在QWERTY键盘上通过对软件的应用将字母转化成文字。随着技术的不断突破,这些输入法现在都可以为你预测将要输入的汉字。比如,你如果要输入一段话,只需要输入每一个字对应拼音的第一个字母。换句话说,系统联想出你接下来要输入什么。以软件辅助的中文输入法将会胜出,事实上我觉得它已经赢了。西方人有必要知道,我们目前“敲击什么就输入什么”的键盘具有很大局限性。不过即便如此,估计美国人也只能理解到这一程度。
总部设在西雅图的Tegic公司最初发明T9输入法时,创造了手机上新的字母排列方式。通常人们以数字2代表a,b,c,以数字3代表d,e,f,以数字4代表g,h,i,以此类推。T9输入法的用户可能并不陌生,如果要打“hone”一词,输入“4663”后,要先划过“good”,“home”和“hoof”后才能找到“hone”。但是Tegic最早开发了以数字代表字母的新方式,既不按照QWERTY的顺序,也不按照字母顺序,只为优化输入法避免重复。
但是这一输入法未获成功。Tegic公司的联合创始人瓦伦丁回忆道:“你不能在手机上改变字母的排列顺序。因为现行的字母排列方式已被广泛接受,我们不得不采用这种低效的输入法”。

在中国让用户接受新的事物就没那么难,因为中国用户的使用习惯尚未固化。中国T9输入法是基于汉字笔画开发的,每一个数字代表不同的笔画。瓦伦丁表示,由于中文T9笔画输入法带有联想功能,因此用户平均只需要输入1.4个笔画就可以打出一个字,而一个汉字通常由9笔组成。这是输入效率上的一大飞跃(顺便提一句,瓦伦丁在越战时期是一名中文翻译,他听录下中文的四字电码,并将其译成汉字,因此他对落后的中文输入法深有体会)。
克里斯蒂娜是一名独立设计研究员,也是一位民族志学者。她说:“在中国,过去十年里手机的普及意味着许多新用户第一次开始学习在移动设备上输入汉字。他们此前对QWERTY键盘没有什么经验,因此他们更容易接受新的输入法”。新的输入法家族包括T9笔画输入法,QWERTY键盘上的拼音输入法以及触摸屏手写输入法等等。
“如果你找50个人,让他们输入一样的东西”,穆尔尼说,“然后你自己观察他们在键盘上的操作,你也许会发现50种不同的操作方式”。新的输入法不断涌现,其中一些新的英语输入法效率更高,比如ShapeWriter和Swype输入法,使得用户能够一次动作划过所有字母打出单词。但是似乎它们并未获得用户的认可。旧的QWERTY输入法足够用,谁会仅仅为了在手机上打字快一点而完全从头开始学习一种新的输入法呢?
穆尔尼的说法也许有些刺耳,“在使用字母的国家,有一种过于自满的氛围。我个人认为,这不是对字母的主观崇拜,而是因为人的懒惰,不想学习效率更高的编码输入方式”。穆尔尼这是在挑战QWERTY的“权威”,挑战西方科技的根本协议标准。
人们之所以觉得他的话刺耳,是因为已经很久没有人挑战西方权威了。电报和打字机的发明与字母的思维方式息息相关,之后的计算机和网络协议亦是如此。中文使用者用了一个世纪的时间让他们的语言适应科技的发展,直到计算机的发展使得中文重新获得地位。这使得中文世界与科技的关系变得比英文世界还要密切和深入。
(青年观察者张成译自《大西洋月刊》,观察者网马力校)
Total 0.047374(s) query 3, Time now is:03-29 10:23, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛