华为的该项技术当中,语音系统为多个NLP引擎的每一个识别结果进行打分,最后确定一个或多个识别结果以及输出次序,并按次序向用户输出该一个或多个识别结果,可以实现对引擎的筛选,做到优中选优。
华为在2013年1月提出了一种语音处理方法,并提供了系统和终端。该发明可以利用到多个厂商的技术,从而可以根据实际需求得到各种侧重点不同的搜索结果。
图1
图1所示为语音处理方法的系统框图。S110在获取一个录音片段流之后,可以将该录音片段流发送至多个自然语言处理NLP引擎,其中,NLP引擎处理的录音片段流可以由终端直接发送,也可以通过代理服务器获取。
每个NLP引擎收到录音片段流之后即可进行识别,进而获取一个或多个识别结果,并对每一个识别结果进行打分,最后将获取到的识别结果以及每一个识别结果的分数发送给终端。
具体地,在接收到来自于多个NLP引擎中的识别结果之后,打分系统可以对NLP引擎的本次识别结果进行打分。一方面,打分系统可以根据每一个NLP引擎的响应时间、给出识别结果的多少或识别结果的离散程度,对每一次识别结果进行打分,并根据总分对识别结果进行排序。另一方面,用户可以根据实际需求,设定不同的得分权重来控制总得分中各项得分的比例。
S130根据来自于多个NLP引擎的识别结果,确定一个或多个识别结果以及输出次序向用户输出(例如,通过显示器或扬声器向用户输出),供用户选择。
图2
图2所示为终端200的示意性框图,发送单元210将语音发送至多个NLP引擎进行识别,以获取识别结果。
接收单元220接收多个NLP引擎的识别结果之后,由确定单元230对NLP引擎的每一个识别结果进行打分,并确定一个或多个识别结果以及输出次序。
输出单元240根据输出次序向用户输出一个或多个识别结果。
图3
图3所示为终端300的示意性框图,存储器310存储一组程序代码,处理器340调用存储器310存储的程序代码,执行以下操作:
将语音通过发送器330发送至多个NLP引擎进行识别,以获取识别结果;
接收器320接收来自于多个NLP引擎的识别结果;
处理器340对每一个识别结果进行打分,确定一个或多个识别结果以及输出次序;
输出装置360根据输出次序向用户输出识别结果。
图4
图4是语音处理系统400的示意性框图。终端410即为上文介绍的终端200和终端300。图中的多个引擎430接收终端发送的语音后,对语音进行识别,以获取识别结果,并将获取的识别结果发送至终端。代理服务器430用于接收终端发送的语音,并将所述语音转发至多个NLP引擎。
在该发明中,通过将语音发送至多个NLP引擎,使多个NLP引擎分别对语音进行识别,以获取识别结果;接收来自多个NLP引擎的识别结果;根据来自多个引擎的识别结果,向用户输出可供用户选择的识别结果,可以使多个NLP引擎为用户的一段语音进行处理。该发明可以利用到多个厂商的技术,从而得到各种侧重不同的结果。
在上述系统中,系统可以为多个NLP引擎的每一个识别结果进行打分,最后确定一个或多个识别结果以及输出次序,并按次序向用户输出一个或多个识别结果,可以实现对引擎的筛选,做到优中选优。
-
华为
+关注
关注
215文章
34293浏览量
251147 -
语音系统
+关注
关注
1文章
27浏览量
12992
发布评论请先 登录
相关推荐
评论