0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度解析:为什么编程语言不用中文?

5RJg_mcuworld 来源:YXQ 2019-07-31 16:32 次阅读

之所以想写这篇文章,是因为昨天在头条看到了一个这样的问题,但回答里有很多答案都让人哭笑不得,更加让人哭笑不得的是一些看似高大上但其实非常离谱的答案居然还有很多人点赞。

有人说一个汉字占两个字符,一个英文字母只占一个字符,所以用中文编码浪费空间,转化成二进制的0101之后臃肿执行效率低浪费空间。

有人说汉字各种排列组合太复杂,可能性太多,而汉语一词多意非常普遍,电脑理解起来会很吃力,很容易产生歧义,英文就要简单的多。

更有人高大上的说,中国讲究“一生二,二生三,三生万物”,那么中国的计算机更可能采用三进制,甚至八卦的八进制来取代二进制。

如果学过计算机组成原理和编译原理,就会知道这些回答都是非常离谱的。因为专业相关,所以来和大家一起好好的聊一聊这个问题。

首先,我们要理解现在的计算机都是二进制的电子计算机。二进制就是说我们计算机的大脑(CPU)只认识0和1这两个数字,其他的东西它通通不认识,不管是2345这些数字,还是我们在电脑手机里看到的图片视频软件,他们最终都会被转化成一堆一堆的0101,这一个0或者一个1就叫一个比特位(bit),八比特位组成一个字节(byte)。比如,一张100KB的图片就是100*1000=10万个字节=80万个比特位,也就是说在计算机的眼里,这张100KB的图片就是80万个0101组成的一串东西。

那为什么我们非要用二进制的0101来表示这些东西,而不是用人类更常用的十进制的0123456789呢,十进制的数字包含的信息明显比二进制多一些,这样表达起来也要方便一些啊?主要是因为十进制在机器里要实现起来远没有二进制方便,你要让计算机认识0101总得用不同的东西来表示这两个最基本的东西吧?如果只是区分两个状态,那么太简单了,大自然里到处都能找到这种自然对立的两个状态,比如阴阳天地男女正负黑白等等等等。如果要用到机器里面去呢?最容易想到的就是开关,在机器里弄一个开关,开关开的时候表示1,关的时候表示0,多简单。如果用一个东西同时表示10个状态,那么麻烦多了,以前也有人用齿轮的十个位置来表示十进制的10个基本数字,但是问题一复杂就直接要崩溃了。所以后来大家形成的共识就是要想制造稳定的计算机,必须使用二进制。

现在我们提到计算机,大多数人都会感觉计算机的思想和设计都是20世纪快中叶时的事情。其实不然,早在19世纪初期,英国就有一个叫巴贝奇的牛逼科学家提出了现代计算机的模型,他的一生都在试图制造这样的计算机,但是他失败了。他失败的原因一是因为他的思想在当时实在是太超前了,根本没多少人能理解,但是更重要的是他所处的时代机器的精度还远远不够,因为那时候还没有到电子时代,他制作的计算机都是机械计算机,只能用齿轮开关之类的东西实现,但是无论多么精密的机械齿轮开放在现代计算机的眼里都太粗糙了。他的失败是必然的,他所设计的那一套超前的计算机模型也只有等电子时代才能实现,而这一等就是一个世纪。

电子计算机之所以能够实现,主要是20世纪初出现了二极管。二极管是一个非常简单的东西,它利用半导体的特性干了这么一件事:它只允许电流从一个方向经过它。这样我们就可以把二极管想象这样一个电开关:当你给它一个高电平的时候,电流可以通过二极管,那么这个开关是开的;如果你给它一个低电平,那么电流就无法通过二极管,这时候这个开关就是关着的。利用这个特性,我们就可以用电平的高低来控制开关的闭合,而如果用开关的开表示1,关表示0,这样我们就可以用电平的高低来表示二进制的两个数字1和0,而不再需要用齿轮或者机械开关来表示二进制的01,这就是电子计算机的实现基础。后来的三极管、晶体管以至于集成电路只是物理技术上的改进。

明白了电子计算机的由来,接下来就要开始编程了。计算机被造出来了肯定不是拿来看的,要想让计算机帮我们做事我们就必须“告诉”计算机想要他做什么,但是怎么告诉?你说话写字它听得懂么?当然听不懂,因为前面已经说了计算机只认识0101,其他的一概不认识,所以,你如果想和计算机交流,那么,请用0101跟他们交流。最开始的编程就是这样的,他们在一个长长的纸带上面打了各种各样的空,打孔的代表1,不打孔的代表0,计算机把这一串的穿孔纸带读进去就识别了一连串的0101,然后他就工作去了。

注意,事情发展到现在并没有出现任何中文编码英文编码的事情,现在的编程用的是打孔的纸带,这显然不是任何一个国家的语言。也就是说主流编程语言都用的是英语而不是汉语的原因,现在还没到,还需要继续往下走。

在往下走就是人类的偷懒时代了。直接打0110计算机看看得是爽,但是人看得不爽啊,人要编写一段程序就要不停的写一大串0101,这太难写太难读而且太容易出错了,随便哪个地方把0写成了1都会出问题,于是人类就要想办法偷懒了,人们就把在编程中会用到的这些固定0101串用一些简单的英文字母来表示。比如“1000100111011000” 就按照约定被替换成了“mov ax,bx ”,执行程序的时候另外再让用另外一个程序把这些字母按规则重新变成0101,这个程序就叫编译器,因为后面的语言被叫汇编语言,所以这种程序就被称为汇编编译器。

到这里我们第一次发现了英文字母的身影,为什么这里的汇编语言要用英文写呢?当汇编语言的思想流行起来后,大家就一致决得必须抛弃0101这种折磨死人不偿命的机器代码了,然后生产处理器的厂家就直接把各种操作处理器的指令用汇编语言表示了,这样你就可以直接使用这些汇编语言写成的指令去直接控制处理器。因为因特尔是处理器领域的王者,你要使用英特尔的处理器就必须使用它规定的那些汇编指令,英特尔是美国的公司,因此他用英文编写这些指令就非常正常了。如果这时候处理器的霸主是中国的公司,而这家中国的公司用特定的汉字去代替这些0101,那么一样可以形成汉字的指令集。所以,汇编这一层用什么语言主要看生产处理器的公司用啥语言。

时代继续往前走,人们继续越来越懒。虽然汇编语言看起来比0101这种东西舒服多了,但是它仅仅是把0101这种东西一个字一个字对应的翻译过来了,但是它的思维依然是机器的思维,不符合人类自己的思维习惯。这种感觉就像是让一个英国人去读“You can you up,no zuo no die”这种中式英语,他肯定是一头雾水。于是人们要继续开发更加符合人类自己思维的的语言,毕竟写程序的是人不是机器,用符合他自己思维的语言去写程序肯定更加轻松。于是在汇编语言之后又出现了一大堆更加高级的编程语言,我们就以其中大名鼎鼎的C语言为例。

C语言有多牛逼?我随便举一个例子你就你就明白了:现在主流的操作系统,不管是Windows、Linux、Unix还是安卓 IOS,它都是用C语言写的(有的在一些特殊的地方还包含一些汇编)。C语言是怎么工作的呢,你随便发明一种新的语言这计算机的处理器认得么?C语言它当然不认得,但是你不是认得汇编指令么,那么我用C语言写好一个程序之后再利用一个软件将C语言翻译成汇编语言让你执行不就是了。实际上它也是这么干的,这个把C语言翻译成汇编语言的东西就叫编译器。

这样问题就简单了,C语言之所以是是用英文写的,是因为发明C语言的人是个美国人,他发明了C语言之后再弄一个能把C语言翻译成汇编语言的编译器就完了。所以我们看到了问题的核心其实在编译器上,只要你高兴,你完全可以随意定义一套编程语言,定义一套语法,你也完全可以让人用中文来写程序,但是你要是想让你发明的新语言能够正常工作,你必须给他弄一个配套的编译器出来,用这个编译器把你发明的语言翻译成汇编语言。大学计算机学院都会有一门非常重要的课程叫《编译原理》,就是专门教你怎么去开发编译器的。

所以,我们知道了开发一门新的语言是很简单的,只需要你自己定义一套语法,再弄一个编译器就行了,真正难的是推广,为什么别人要用你开发的语言?如果你发明的语言没有什么特别大的优势,我为什么要放着原来熟悉的语言不用用你的?除非你能像苹果一样硬:想不想开发IOS的app来赚钱了?想的话就老老实实的用我的语言,别废话。C语言那么牛逼,为什么到了90年代Java又流行起来了呢?因为用Java来做网络编程比C语言要简单的多,这个简单的多的意思就是Java的编译器帮你翻译了很多很多网络相关的事情,这样你要做的事情就简单的多了。

所以,在这一层面上用什么国家的语言开发编程语言都是可以的,中文、英文、法文、德文都没问题,也是很简单的,只要你在配套的弄一个编译器出来就行了。其实,易语言就是用中文开发的编程语言。

说到这里,再回过头来看开头的问题就简单了。不管是哪个国家的人先发明了计算机,在0101打孔的时代都是一样的。然后,除了汇编语言要和生产处理器的厂家绑定以外,其他的高级语言都是很自由的,这些高级语言对你是用中文还是英文编写没有任何的限制,而我们现在的主流编程语言也都是这些高级编程语言,直接使用汇编语言的已经非常少了。之所以现在主流的编程语言里都是英文,主要还是因为这些高级语言的发明者都是说英语的(主要是美国人)。

至于那些说中文编程语言占空间大或者中文语义难以理解的都是错误的看法。不管你用的是什么语言,这些语言在执行前都会被编译成汇编语言,你书写占用的空间大一点对程序的执行没有任何影响。而说中文语义多难以理解的,要理解你写的高级语言不是处理器,而是你自己写的编译器,如果使用你的语言会产生歧义,那只能说明你写的编译器严重不合格,这跟中文英文没有任何关系。

最后,如果你自己想去设计自己的编程语言,就去好好学学编译原理把。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 二进制
    +关注

    关注

    2

    文章

    786

    浏览量

    41573
  • 编程语言
    +关注

    关注

    10

    文章

    1936

    浏览量

    34561

原文标题:深度:如果编程用中文!

文章出处:【微信号:mcuworld,微信公众号:嵌入式资讯精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    编程语言的误区与常见问题

    误区一:编程语言的选择 常见问题: 初学者在选择编程语言时,往往会被市场上的热门语言所吸引,而忽视了自己的实际需求和兴趣。 一些开发者认为某
    的头像 发表于 11-15 09:35 60次阅读

    NPU支持的编程语言有哪些

    NPU(Neural Processing Unit)是一种专门为深度学习和人工智能应用设计的处理器。NPU支持的编程语言通常与它所集成的平台或框架紧密相关。以下是一些常见的编程
    的头像 发表于 11-15 09:21 154次阅读

    MCU编程语言和开发环境介绍

    微控制器单元(Microcontroller Unit,简称MCU)是嵌入式系统的核心,广泛应用于各种电子产品中。随着技术的发展,MCU编程语言和开发环境也在不断进步,以适应不同的应用需求。 1.
    的头像 发表于 11-01 11:51 396次阅读

    C语言与其他编程语言的比较

    C语言作为一种历史悠久的编程语言,自其诞生以来,一直在软件开发领域扮演着重要角色。它以其高效、灵活和可移植性强的特点,成为了系统级编程的首选语言
    的头像 发表于 10-29 17:30 153次阅读

    plc编程语言编程相关技巧有哪些

    PLC(可编程逻辑控制器)编程语言及相关编程技巧是工业自动化领域中不可或缺的知识。 一、PLC编程语言
    的头像 发表于 10-21 16:56 191次阅读

    技术干货驿站 ▏深入理解C语言编程高手必备,全方位解析运算符的核心技能!

    在C语言编程领域中,运算符是实现数据处理与逻辑操作的关键工具。无论是在处理简单的数值计算,还是在构建复杂的逻辑结构时,运算符的使用贯穿始终。作为编程语言的基础组成部分之一,运算符不仅
    的头像 发表于 09-18 15:56 298次阅读
    技术干货驿站 ▏深入理解C<b class='flag-5'>语言</b>:<b class='flag-5'>编程</b>高手必备,全方位<b class='flag-5'>解析</b>运算符的核心技能!

    plc编程st语言怎么编

    PLC(可编程逻辑控制器)编程中的ST(Structured Text)语言是一种高级编程语言,它类似于Pascal或C
    的头像 发表于 08-25 10:05 846次阅读

    PLC的编程方式及编程语言

    在工业自动化领域,PLC(Programmable Logic Controller,可编程逻辑控制器)因其强大的控制功能和灵活的编程方式而得到了广泛应用。PLC的编程方式和编程
    的头像 发表于 06-27 14:08 573次阅读

    abb工业机器人的编程语言是什么

    ABB工业机器人的编程语言主要是RAPID(Robot Application Programming Interface for Development),它是一种高级编程语言,专门
    的头像 发表于 06-16 16:49 2283次阅读

    PLC编程语言和C语言的区别

    在工业自动化和计算机编程领域中,PLC(可编程逻辑控制器)编程语言和C语言各自扮演着重要的角色。尽管两者都是
    的头像 发表于 06-14 17:11 2380次阅读

    PLC常用编程语言有哪些

    在工业自动化领域,PLC(Programmable Logic Controller,可编程逻辑控制器)作为一种核心控制设备,其编程语言的选择对于控制系统的设计、开发和维护具有重要影响。PLC的
    的头像 发表于 06-14 16:58 1140次阅读

    ArkTS语言基础类库-解析

    被设计用来传输和存储数据,是一种可扩展标记语言语言基础类库提供了[XML生成、解析与转换]的能力。 URL、URI构造和解析能力:其中[URI]是统一资源标识符,可以唯一标识一个资源
    发表于 02-20 16:44

    脚本语言编程语言的区别

    脚本语言编程语言是计算机语言的两个主要分类。尽管两者都是用于编写计算机程序的工具,但它们在设计和运行方式上存在一些显著的区别。下面将详细探讨脚本
    的头像 发表于 11-22 14:33 2828次阅读

    Python编程语言属于什么语言

    Python编程语言属于高级编程语言中的一种。它是一种通用、面向对象、解释型编程语言。Pytho
    的头像 发表于 11-22 14:31 1354次阅读

    基于Rust开发的编程语言

    Move 是一门由 Rust 语言开发的一门面向资产的编程语言,最早由 Facebook (现 Meta )投入大量的人力物力开发,用于 Libra (现 Dime )项目,处理全球性大规模支付系统的
    的头像 发表于 11-17 12:30 644次阅读