文档库

最新最全的文档下载
当前位置:文档库 > 输入法的发展过程

输入法的发展过程

输入法的发展过程

由于汉字有数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编码(检索出汉字的代码),用数个键来输入一个汉字。中文

输入法的发展过程,是“万码奔腾”的过程,在30年间出现了上千种编码方法。

最早的汉字输入法,一般认为是从70年代末期或者80年代初期有了个人

电脑PC开始诞生的,虽然更早有电报码,用0──9十个数字中的四位组合构

成每一个汉字,便于邮电局发送电报之用,但通常意义上,人们还是认为从

1981年国家标准局发布《信息交换用汉字编码字符集基本集》GB2312-80以来,个人计算机上开始使用五笔或者拼音输入汉字才是输入法广为使用的真正开始。在台湾的汉字输入法历史则可追溯至1976年由朱邦复发明之仓颉输入法开始。

汉字输入法的发展,一方面是输入法软件的功能的改进和完善,另一方面

是新型输入法编码的不断涌现。前者主要是针对拼音输入法,后者则出现了

“万码奔腾”的局面。早期的输入法软件大都为收费软件,很多企业或个人依

靠销售输入法软件挣钱,如今收费的输入法已经很少,绝大多数输入法软件都

是免费的产品。拼音类的输入法包括大陆的拼音输入法和台湾的注音输入法等。拼音输入法相比其他输入法有着天然的优势,因为现代每一个接受教育的中国

人在还没学习汉字前就先用大量时间学习汉语拼音或注音符号,原本只是用来

标记汉字读音的拼音也就可以轻松地作为汉字的输入编码。拼音输入法另一个

优势就是接近口语话,所以拼音输入法可以在极短时间内适应。

但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率异

常高,即使词组重码率也是非常高。为了让拼音能够较快速的录入汉字,只有

借助复杂的输入法软件来提高拼音输入能力,比如支持智能排序,以词定字,

整句输入,云输入功能等,纵观拼音输入法的发展,也即拼音输入法软件的发展。

在中文输入法诞生之初就最先出现拼音输入法,但是当时的拼音输入法软

件功能差,字序固定,不支持词组和整句输入,甚至文字不能和编码一起显示。在输入汉字过程中常常要翻很多页才能找到需要的汉字,输入效率非常低下。

虽然当时很多人都只会用拼音输入法,但大部分人都不满拼音输入法的输入效率。

20世纪90年代后,拼音输入法软件开始支持词组输入和整句输入。1993年出来的中文之星输入法软件能够做到单个字词的即时显示,即一边打拼音,同时显示汉字。中文之星软件进行一些巧妙设计,如空格确认、逗号句号选重码、允许模糊音容错和自定义字符串等,这些功能已经成为当今所有拼音输入法软件的必备功能。1993年初北京大学的朱守涛先生发明发明了智能ABC输入法,后被微软收购内置到Windows系统中。在随后几年中智能ABC输入法成为了中国大陆使用人数最多的输入法软件。

1994年的出来的自通输入法软件和1996年的黑马神拼输入法软件,这两种输入法都实现了汉字整句输入(又称语句输入)能力。汉字整句输入可追溯到20世纪80年代末期,哈尔滨工业大学在校博士生王晓龙进行了汉字分词方面研究,并申请了863课题,写出了“最小分词问题及其解法”方面的论文,从而奠定了拼音整句的输入的理论基础。微软从Windows 95中文版开始,在系统内置支持整句输入功能的“微软拼音输入法”。

然而当时的拼音输入法普遍智能化程度不高,整句输入不成熟,输入过程中错误率高,而且不能够与所敲拼音同步显示汉字(微软拼音是滞后一个字、自通是滞后几个字、黑马拼音是需要最后确认才出现汉字),整句输入过程中修改拼音选择汉字不方便,大大限制了整句拼音输入法的使用,所以很多用户还在继续智能ABC。直到1998年谭亚军发明的拼音之星软件,才完全支持“实时显示”的方式,不管输入多少拼音,每个字母按下去,汉字就同时显示,拼音有错误,用户就会立即发现,又由于支持自动分词与整句输入,用户不用去担心是输入一个词语还是一句话,系统都能够进行处理,如果没有该词语,系统也能够自动学习并存盘,似乎具有了词语输入法的方便性与整句输入法的智能性。到了1999年出现了另外几个拼音输入法软件:拼音加加、自由拼音输入法和考拉输入法,拼音加加软件开始支持在不切换输入法情况下直接用Enter 直接键入英文字母

在90年代,双拼输入法和相应的输入法软件也得到了快速发展。双拼输入法诞生了多种方案,如自然码输入法软件提供的自然码方案,更采用双拼加偏旁或笔划的音形结合方式编码,提供了一种快速输入汉字的途经,这已经超出

了拼音输入法的范畴,严格来说自然码双拼不属于纯拼音,而是一种音形码。

此外微软、拼音之星、拼音加加、小鹤双拼等都提供了各自不同的双拼方案。

进入新世纪后,拼音输入法软件功能趋于成熟,正式进入了智能拼音输入

法时代,这时产生的拼音输入法软件主要是整合以前拼音输入法软件优点,提

供了更大的词库,软件的智能性也更强,还拥有了更强的学习能力。

2000年初出来的智能狂拼也提供了更智能的输入方式。而紫光拼音输入法

是在考拉输入法的基础上开发而成,提供了一个更大的词库,增加了智能组词,也就是说用户连续输入9个字以内的拼音串,系统能够自动转换成汉字,而不

论是否有这个词语,系统根据词频高频先见的方式给出一个词语串的组合。紫

光输入法最终成了用户最喜欢的输入法之一。

随着互联网的快速发展,2006年6月由搜狐公司推出的一款Windows平台

下的搜狗拼音输入法。搜狗拼音输入法是基于搜索引擎技术的新一代的拼音输

入法产品,用户可以通过互联网备份自己的个性化词库和配置信息。搜狗拼音

输入法一经出来很快取代了智能ABC输入法而成为中国现今主流汉字输入法。

在搜狗输入法出来后,谷歌、腾讯、百度和微软也相继推出了同一类型的

智能拼音输入法:谷歌拼音输入法、QQ拼音输入法、百度输入法、必应输入法。

随着智能手机和平板电脑的流行,很多IT企业又开发了Android、iPhone、iPad的拼音输入法,如百度手机输入法、QQ手机输入法、搜狗手机输入法等。这些输入法延续了电脑上输入法的特点,同时输入法软件针对触屏的特点,从

而提供了更为灵活的输入方式。

在台湾的拼音输入法则以注音输入法为主,与大陆类似都是在输入法软件

方面不断得到完善和改进,变得更加智能。与大陆不同的是,大陆拼音输入法

一致采用英文26键作为拼音输入法的键位,而台湾使用的注音输入法键位设置没有一个统一的标准,从40键到30键,再到26键都有人使用。因为注音符号与键盘的英文字母并不是一一对应的,所以注音符号设置键位的时候往往采用

数字键和符号键作为编码。

在香港人则流行粤语拼音输入法(又名广东话输入法),利用汉字的粤语

读音,在电脑上输入汉字。由于粤语拼音缺乏统一的拼音标准办法,各种软件

的拼音法并不一致,故有碍粤语拼音输入法进一步的发展和普及。虽然拼音输

入法简单易学,但是汉字同音字现象之多所导致的重码率居高不下,即使输入词组重码也是相当高,纵然加上云输入功能也无法完全做到精确地输入文字,所以在拼音编码外就涌现了大量的编码方案,主要有形码和音形码两类,这些编码往往比拼音输入法具有更低的重码率,熟练后可以很快地输入汉字。中国大陆最早出现并流行开来的形码输入法是由王永民于1983年发明的五笔字型输入法。在台湾最早的形码输入法则是1976年由朱邦复发明之仓颉输入法。

电脑在中国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,拼音虽然可以作为汉字的编码,制作成拼音输入法,但是很长一段时间拼音输入法的输入汉字效率极其低下。为了能够让中文快速的在电脑上输入,有的人抛弃英文键盘布局而另外设计了专门的中文键盘,这些键盘作为编码的键数量有的为几十个,甚至有的达到几百个,但是这些方案并没有实现中文的轻松或快速录入。

直到 1983年8月,王永民推出了划时代的五笔字型输入法。五笔输入法采用普通的电脑键盘,只使用英文字母键其中的25个参与编码,不但可以让我们输入汉字,而且也极大的解决了输入速度这一顽症。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型在发展过程中先后诞生了三种编码方案,即86版和98版和新世纪版。作为国内第一个推广的形码输入法,一经推出来,即受到很多用户的热捧,在80年代和90年代,很多人学习电脑的第一要务就是学习五笔字型输入法,五笔的教学培训班也遍地开花。

在80年后期还出现了另一个著名的形码输入法——郑码输入法。郑码是郑易里和女儿郑珑共同发明的一种中文输入法,郑码相比于五笔更加规范,而且郑码输入法要比五笔更加广泛,因为微软从Windows 95系统开始就内置郑码输入法,成为系统默认自带的输入法,直到2012年的Windows 8才取消内置郑码输入法。郑码推出后很快获得中、美、英国专利授权,并通过国家级的鉴定,曾荣获北京国际发明金奖和最优秀发明大奖;荣获第22届日内瓦发明金奖。为了解决繁体字与简体字通用的问题,郑码采用字根双编码方式减少字根重码,因采用按特征检索基根和区码方式以及大多采用标准的偏旁部首记忆量增加不大较为易学。

在80年代和90年代,由于国家教委尚未有推荐输入法方案,所以在中小

学里教的汉字输入法相当多,各个学校教汉字输入法也不尽相同,有的教五笔

字型,有的教自然码,有的教肖码等。虽然五笔字型输入法可以快速录入汉字,也在全国范围内得到较为广泛的商业推广,但是五笔因为学习难度高,而且五

笔编码本身有不少存在不合理的地方,比如字根不符合汉字基本部件与违反笔

顺的问题,所以一直无法成为国家教委的推荐输入法。

进入90年代后,国家教育委员会批准了关于研发输入法的“八五”重点攻

关项目。在1992年8月1日至3日,国家教委基础教育司及直属的全国中小学计算机教育研究中心在北京召开了“全国中小学教学汉字编码规范与计算机汉字输入系统”的研讨会。最后与会代表认为,在目前的中小学计算机教学中,

应主要使用汉语拼音方案作为计算机汉字输入方法,而对形码的选择应持特别

慎重态度,目的在于避免对语言文字的“污染”,并坚决反对用商业竞争或行

政命令手段在中小学中强制推行不规范的汉字输入编码方案的做法。两年后项

目课题组推出了名叫“认知码计算机汉字输入系统”的形码输入法, 1995年

国家教委推荐中小学使用认知码,向全国中小学校全面推广。

可是,由于认知码自身存在很多欠缺,在推行之中遇到很大争议和阻力。

不少学术刊物纷纷载文讨论认知码,因为认知码自身的致命缺陷,比如重码率

相当高、编码规则复杂、易学性差、字根选择缺乏正确的规范、简码的使用不

科学,使这种后来研制出的官方编码被批评家批驳得体无完肤,一蹶不振。最

后认知码全面推广之事也不了了之。

在国家教委想方设法研发一种易学规范而又快速的输入法同时,一种更优

秀的输入法——二笔输入法已经在民间诞生。二笔输入法是陈劲松于1992年发明的音形码输入法,采用拼音首字母与笔画(两个笔画取一键)相结合的方式

取码。二笔输入法直到2000年1月成立的广东二笔软件有限公司向外界推出二笔输入法软件后,才正式出现在大众的视野中。二笔输入法不但易学,还可以

输入文字打出像五笔一样速度。二笔输入法具有规范、易学、快速的特点,因

此顺利通过国家教育部基础教育课程教材发展中心评审而获准进入中小学基础

教材,这是截止2013年唯一获得批准进入中小学基础教材的汉字输入法。

由于广东二笔软件有限公司以高价销售二笔输入法软件,而且当时(2000

年到2004年期间)已经得到广泛使用的智能ABC输入法和五笔输入法是免费的

产品,只有很少人愿意尝试使用二笔。最终导致以经营二笔输入法软件为主要

业务的广东二笔软件有限公司在2004年濒临倒闭。在另一方面,二笔输入法以其优秀的特性吸引了不少二笔爱好者,还有些爱好者对二笔进一步改进和优化,同时对二笔输入法软件进行维护。二笔输入法软件大都能够在互联网上免费获

得和使用。

而随着智能拼音输入法时代的到来,特别是在2006年搜狗拼音输入法的诞生后,非拼音类的形码或音形码输入法受到的关注也就越来越少,而且不再有

国家相关部门参与开发和推广输入法。但这并不影响众多输入法爱好者对输入

法编码方案研究的热情。很多爱好者研究输入法都会从多面方面考虑,比如重

码率、易学性、对大字库的支持、输入法按键的舒适程度等。

一些输入法爱好者仍然想得到一个超低重码率的输入法,所以也就产生了GB2312-80字符集的6763个汉字中只有14个重码字的张码输入法。在支持大

字库方面,除了输入法编码本身外,更要输入法软件和字库或词库的支持,所

以诞生了收录全部七万多个UNICODE汉字的海峰五笔软件。而在输入法编码方

案易学方面,至今依然没有一个能够超越二笔输入法的编码方法,能够做到既

高效又易学。

在台湾,中文输入法也出现了非常多的输入法编码方案。1976年朱邦复发

明第一个形码输入法——仓颉输入法,发明输入法后,朱邦复公开该输入法,

不收分文,使电脑汉化得到很大的进展。所以台湾的Windows操作系统都内置

有仓颉输入法。也成为台湾最流行的形码输入法之一。成仓颉输入法出来之后

又诞生了一批形码输入法,像王赞杰发明了大易输入法,廖明德发明了行列输

入法,和仓颉输入法一样,这些输入法作者开放输入法专利,所以同样内置到

了Windows系统中。在台湾使用人数最多的形码输入法是呒虾米输入法,这是

在20世纪80年代后期,台湾人刘重次发明的一种形码输入法。通常我们所说的输入法都指电脑普通键盘或手机键盘上的输入法,包括拼音、形码和音形码。除了这些通常意义的输入法外,还有语音输入、手写输入,以及速录技术等,

这类输入法技术的发展既与普通键盘输入法发展息息相关,又独立于普通键盘

输入技术。

汉字语音输入是利用语音识别技术将语音转换为文字的输入方法,通常是

采用马尔可夫信息模型进行统计处理和基于规则方法进行歧义判别。20世纪90

年代中后期,IBM终于推出非特定人连续语音识别系统ViaVoice,这是当时语

音识别中的佼佼者。与此同时国内很多从事汉字语音识别研究的人员运用在研

究所或大学学到的知识或研究成果,建立了巨大的中文语言资料库(又叫语料库),推出了中文普通话的语音输入系统。科大讯飞现已成为中国最大的智能

语言技术提供商。在个人电脑上要实现语音输入中文往往还需要外接设备。而

今随着智能手机的普及,很多智能手机的输入法都自带语音输入功能,如百度

手机输入法、讯飞语音输入法等都具有语音输入的方法,用户也可以方便地利

用手机进行语音输入文字。但是,语音输入有还不能提高非常精确的文字输入。

除了语音输入文字外,手写也是一种常见的输入汉字方法。手写输入法是

在手写板或触屏手机屏幕直接书写的中文输入方式。1997年就已经出现了基本

可以使用的手写汉字输入系统,采用了基于语义句法的模式识别方法。20世纪90年代也诞生了不少手写产品,比如中自公司的“汉王99”和摩托罗拉公司的“慧笔”。但是在随后几年里手写并没有得到广泛使用,直到触屏手机的出现,特别是在智能手机和平板流行后,手写输入法才得到更加广泛使用。

速录技术严格来说并不属于输入法编码方法,速录所用到的编码方法实际

上也就主要为三种:拼音、形码和音形码。速录一般面向特定的领域,速录师

就业面向政府机关、司法系统。这些领域对于文字的录入速度要求比较高,特

别是在会议,速录师可以边听边将文字打出来,就像文字立即出现在眼前。另

外速录的键盘通常也不同于普通键盘,而采用速录键盘,如亚伟速录采用国际

通用的速录键盘。

亚伟速录是最早的一种中文速录技术,采用拼音输入方式,由唐亚伟于

1993年发明。亚伟速录也是如今最广泛的中文速录技术。在亚伟速录之后又出

现了其他多种速录技术,如国育速录、超音速录、飞耀速录、五笔双打等。

虽然速录使用的编码方案通常为拼音方案(也有少数采用五笔或二笔方案),

经过特殊的编码组合,但是大多数都采用并击技术,并击需要每次多个手指分

别按下多个不同的键,可以有效地提高击键效率,从而也就突破了普通键盘每

分钟200到300字的极限速度,而达到每分钟600字以上的速度。