(文章来源:DeepSci)
要想理解自然语言处理,让我们先来看什么是“自然语言”。通常认为,语言是人类区别其他动物的本质特性。在所有生物中,只有人类才具有语言能力。人类的逻辑思维以语言为形式,绝大部分知识也是以语言文字的形式记载和流传的。
人类自洪荒时代开始,以语音,记号(文字)为载体的信息记录形式,用于个体或集体交流,知识传承。具备复杂语言能力后,人类加快了社会化的发展和知识积累,以跨越时间和个体的集体智慧登上了生物金字塔的顶端。语言、想象力和“八卦”特征,是使智人超越其他物种以及其他人类的“伊甸园禁果”,为人类开启了新的世界。
自然语言的组成部分有:语音、词汇和语法。语音是语言的物质外壳,是最原始形式的语言。而文字,则是记录语言的书写符号系统。用自然语言与计算机进行通信具有明显的实际意义。人们可以用自己最习惯的语言来使用计算机,而不是花大量时间精力去学习各种计算机语言。
从另一个角度,人类希望通过发展NLP来进一步了解人类自身的语言能力和智能机制。实现人机间自然语言通信包括三个步骤:识别、理解、生成。首先是识别,对于计算机来说,这是输入阶段。计算机需要对人类语言(语音)进行识别,语音识别技术是人工智能技术的一大体系。目前语音识别的应用日渐成熟。
比如智能家居,坐在电视机前可以语音遥控想看什么节目。语音识别交互的精准性很重要,比如你想看英剧《神探夏洛克》,可能说成了《神探夏洛特》,那有可能就会被识别成《夏洛特烦恼》。语音识别相对后面两步来说,是目前技术中最成熟的。语音信号对于一种固定的语言来说,单音节的模式类数量相对较少,因此语音识别相对简单,而且已经基本上实现并达到了产品级标准。
难度主要在于后端的基于上下文的语义识别,也就是自然语言理解。当然这个理解的难度对于文本也是一样的,并不一定局限于语音。语音识别?语义识别?傻傻分不清楚。为了更直观地感受语义识别和语音识别的区别,我们可以形象的用人体器官表达。语音技术相当于人的耳朵和嘴巴,负责获取和表达。
语音识别显然就是耳朵的角色。语义技术则相当于人的大脑,负责思考和信息处理。就像你的耳朵非常好使,并不代表你的脑袋聪明。在识别同样的语音后,不同的机器可能会作出不同的反应,这就是机器对于语意理解的区别。类比到人类,比如一个人的能力并不是那么强,并不能代表他的听力有问题,只能说他的处理能力没有那么强,而这往往取决于他的大脑。
(责任编辑:fqj)
-
AI
+关注
关注
87文章
30072浏览量
268337 -
自然语言处理
+关注
关注
1文章
611浏览量
13503
发布评论请先 登录
相关推荐
评论