加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
您当前的位置:首页 > IT新闻 > 中文信息

世界信息战,中国怎么办?

时间:2012-04-04 12:11:49  来源:北大中文论坛  作者:sfpfh;

要制造出一种使用“中文信息交换标准代码”的电脑,必须具备如下三个基础条件:
1、汉字系统必须是由组字元件按一种规则构建的具有系统性、规律性、规范性和规律性的
  文字系统。这种文字系统,对电脑来说,可以用很少的“组字元件”,组建出任何需要的不重码的单字。
2、能制造出完全支持这种“组字元件”的电脑硬件。
3、能以这些“组字元件”为“信息交换标准代码”,编制电脑的操作系统软件和一切应用软件。
因为,汉字楷体的基本构字元件“ 点、 横、 竖、 撇、 捺、 挑、 趯、 啄、 擐、 转、”,其长短、粗细,位置、方向等等空间参数,因每个字的不同而不同。汉字楷体的组字方法是随机性的,无任何规律可循,其组字元件也没有规范性和标准性。
电脑的工作原理,决定了任何人也制造不出可以用“ 点、 横、 竖、 撇、 捺、 挑、 趯、 啄、 擐、 转、”基本元件,随意组建出任何楷体汉字的电脑硬件。没有电脑硬件的支持,当然也不能编制出用“ 点、 横、 竖、 撇、 捺、 挑、 趯、 啄、 擐、 转、”,为“信息交换标准代码”的随意组建任何楷体字的软件和其它纯中文的操作软件与应用软件了。这样,在汉字楷体系统不变的情况下,以上3个基础条件是无法创建出来的。
那么,现在以英文代码为 “美国信息交换标准代码(ASCII)”的电脑,是怎样处理汉字的呢?
电脑是对汉字楷体进行整体加工的。即利用英文代码编制的电脑操作系统(Windows)的图形处理功能,将各个汉字整体作为各个小图形来存储和调用。基本方法是。首先赋予每一个汉字一组“英文代码”,把它存储在“汉字库”里。这个“英文代码”,就相当于汽车零件仓库里的零件名称和编号一样,是为了管理和提取用的。然后把每个汉字的“英文代码”与英文键盘代码(“汉语拼音输入法”键盘代码或“笔画输入法(例如‘五笔输入法’)”键盘代码)对应起来。怎么对应呢?大家到图书阅览室就会看到,阅览室里的图书不是把所有的书籍不是毫无秩序地堆在一起的。为了便于管理和检取,是分类放在不同区域的书架上的。每一类的书架上还要贴上标签,例如:文学类、工业技术类、化工技术类、机电类、汽车类、电脑技术类等等。每一类书架,不是只有一种书籍,而是还有多个品种。找到标签就找到这类书籍了,你需要哪种书,你就到哪类书架内挑选出来。与此相似,每一组“汉语拼音输入法”键盘码或“笔画输入法”键盘码,就相当于书架的一个“标签”,用键盘输入这个“标签”,就把汉字库内的这一“类”里的字都列出来了。
由于汉字库里存在着大量的同音异义字,所以,使用“汉语拼音输入法”时,每一组汉语拼音字母(其实是英文字母),大都“对应”多个同音异义字。例如“yi”就“装有”“一、以、意、益、等等”。
与此相同,由于汉字楷体在笔画结构上也有大量的同画字,所以,用“笔画输入法”,也“对应”着多个同码字。例如:人、八,目、且,田、由、甲、申、毌,等等。
因为,在楷体字的基础上,不论使用什么输入法,都是通过英文代码从汉字字模库里“调取”整体汉字的。所以,在以“ASCII码为基础的电脑上,使用楷体字,是不可能解决“同码”问题的。
由于“以ASCII码为基础的电脑”不能解决楷体字的“同码”问题,楷字就不能作为电脑编程代码了,就不可能建立“纯汉字信息系统”了。所以,汉字信息,就只能挂接在“英文信息系统”上了。
目前电脑在调用汉字方面,与用老式的铅字打字机相比,没什么本质的变化。只是把“铅字盘”换成“图形字库”罢了。所以,先进的电脑给汉字带来的好处是很有限的。有人说用“词索输入法”可以提高输入速度。其实,“词索输入法”除了让电脑先从几万个汉字中找出同码字外,还必须再根据这些同码字关联出双音词或多音句来。其实,这种办法效果并不大,因为,汉语的二级词是任何人都可以随意组建的,是无限的。所以,再大的电脑词库,也不可能把无限的汉语词汇都包括进去。即使搞一个1千亿词的词库(这将使汉字打字程序变得十分复杂和庞大,用起来成本加大),也不能避免同音词和同音句的出现。
来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
数字十笔,用十个数字输入汉字的输入法,手机上最好的输入法
数字十笔,用十个数字输
相关文章
    无相关信息
栏目更新
栏目热门