随着虚拟语音助手的蓬勃发展,目前正在对各个行业产生影响。可能大家都非常熟系苹果的siri、微软的小冰,因为它们都是国际大公司注重的产品,因此,非常受人注目。但是要论虚拟语音助手的可商业化道路,中国的企业要技高一筹。
杭州骇音科技有限公司(以下简称:骇音科技)把虚拟语音助手VIA与耳机进行结合,突然之间,让我们看清耳机的下一步发展趋势。
骇音科技CEO任博昉说:“耳机发展到今天,人们已经不能仅仅满足只是娱乐听歌,它必须承载更多的功能,我们定义人工智能耳机将会是智能手机的控制终端。”
现在人工智能耳机还没有普及开来,所以人们对它还没有概念,但是人工智能耳机却是耳机的发展趋势,今后,人们通过耳机就能够控制手机里的软件,比如“帮我发一条微信”、“帮我查看快递”、“我要去XXX”、“我要买衣服”等等,很多日常生活中的琐事,我们都可以通过语音直接对耳机下达指令,它会一步到位帮我们执行,简化了我们对手机的操作。
或许很多人还是没有概念,当看完这篇文章后,你的概念将会逐渐清晰化。
1号机器人网记者:你们的虚拟语音助手VIA有什么特色?它可以做什么事情?
首先,它是随时随地的待命;不管你处在什么状态,只要跟它说一声“芝麻开门”,它就会被唤醒,然后你只要说出指令,它就会一步到位的执行。
其次,它相当于管家助理,可以帮你解决问题;比如说,今天我有一个重要的会议,需要人提醒,传统的做法,是拿出手机,然后通过各种操作设置,现在只要对着虚拟语音助手VIA说“芝麻开门,帮我记一下X点钟会有一个会议,”到预定时间VIA就会提醒你。
还比如,我要打电话给某人,传统的做法是,拿出手机打开通讯录,搜索名字,再拨打,现在只要对着虚拟语音助手VIA说:“芝麻开门,帮我打电话给XX,”你的电话就直接拨通过去了,不需要再进行手动操作。大大方便了操作的过程。
最后,再强调一点,目前市面上很多虚拟语音助手都是在模拟耳朵,就是当人与它对话时,让它听懂人在说什么。而我们最大的区别就是,我们是通过虚拟语音助手去帮你控制各种各样的软件,比如智能手机里有成千上万的APP,都可以通过虚拟语音助手VIA去控制。
而且,虚拟语音助手VIA还具备学习的功能,任何它不会的操作,只要用户手动去教会它使用一次,接下来,你只需要通过语音,它就可以按照你手动操作的过程去一步到位的执行。
1号机器人网记者:市面上的虚拟语音助手,如苹果、微软等虚拟语音助手都是直接在手机上安装APP,然后通过手机来互动对话,但你们做成了耳机硬件,在人机交互上两者会有怎样的区别?
任博昉:
图:骇音科技人工智能耳机
不管是苹果的siri,还是微软的小冰,它们都是注重机器人的聊天系统,就是让人与机器人对话,让机器人能够像人一样与人类对话,我觉得这个技术发展会非常的漫长,这不是我们想要追求的方向。
我们追求的是语音技术所能带来的便捷服务,如帮我查快递、帮我发微信给某人、打开支付宝支付、我想看XXX电视剧等等,我们强调的是“控制”,直接通过语音来控制各个软件,让我们的生活更加便捷。
而我们把虚拟语音助手VIA装进耳机硬件里,是因为耳机是日常生活中不可替代的设备,我们经常带着耳机玩手机,既然如此,那我们就让手机操作更加便捷好了,不需要再对着手机屏幕手动去操作各种软件。
比如,只要耳机挂在我脖子上,不管我是不是戴着耳塞,这个无所谓,只要耳机是挂在脖子上。那我只需要说:“芝麻开门,我想查看快递?”、“芝麻开门,打开导航,我想去XXX?”、“芝麻开门,打开微信,给XX发一条微信,今晚一起吃饭。”等等只需要动动嘴,就可以执行了。它能帮我们一步到位执行,很方便。
现阶段的语音技术是可以支撑这方面的应用,而且我们已经做了大量的印证,也实现了产品的量产。
通过耳机,我们可以把指令更清晰的传达给虚拟语音助手,如果是对着手机讲,一是操作复杂化了;二是在一些嘈杂的场所,语音识别准确率会大大降低,如果我是通过耳机,不管我是走在马路上,还是在餐厅里,或是在工地上,我只需要正常说话,它都能够清晰的听清我下达的指令。这就是最大的区别。
1号机器人网记者:通过测试你们的人工智能耳机,可以通过语音直接控制手机里的各种软件,从使用结果来看,确实挺方便,但是每次说话都要说“芝麻开门”才能唤醒工作,这也很麻烦,你们现在有没有更好的执行方式?
任博昉:这是现阶段语音技术最好的展示形式,举个例子来讲,我们4个人坐在一起讨论,你要跟一个人说话,要么朝着他的脸,要么指着他说话,要么就叫他的名字,但机器人不一样,它不知道你是在跟谁说话,所以我们必须要用暗号的方式,让它知道你是在跟它说话。
因此,我们在前面加一个引子,如“芝麻开门”,作为一个唤醒词,如果你不给它起一个头,它不知道你什么时候开始说话,所以必须要有一个唤醒词;当你唤醒它后,说话又非常长也不行。因为太长的指令,它识别误差非常大,因此,没有准确率可言。
如果我们唤醒它之后,加简短的指令,控制在3秒左右,我们测试的结果是准确率可以达到97%左右,虚拟语音助手执行指令就非常准确,而且高效,这是目前我们通过各种尝试后,得出的最佳使用方式。
等以后语音技术取得更大的突破后,如机器人可以识别哪些是指令,哪些是废话的时候,那我们的唤醒方式就不用重复的去讲,只需要起一个头,在一个语境内,我们的所有指令都可以一步到位执行。
1号机器人网记者:我觉得你们的做法比较明智,把语音助手和耳机结合在一起,耳机是现代人的硬需求,可以谈谈人工智能耳机与普通耳机会有怎样的差别?今后人们通过耳机会有怎样的生活方式?
任博昉:我认为耳机与虚拟语音助手结合是大势所需,两者结合后,我们可称之为“人工智能耳机”。
随着智能手机里涌现出越来越多的应用软件,耳机原本只是人们用来听歌的产品,我认为接下来人们对耳机的需求将不仅仅只是听歌而已,如果仅仅只是听歌已经不能满足人们对高科技产品的期待。
我认为人工智能耳机是必然的发展趋势,我可以通过人工智能耳机随时随地控制智能手机,我甚至不用打开手机,通过耳机就能了解我想了解的资讯,以及我想要做什么事情?通过语音就可以完成,这是更便捷的生活方式。
举个例子来讲,脖子上挂着骇音科技的人工智能耳机之后,我只要说:“芝麻开门,给XX发条微信,今晚我们一起吃饭。”就完事了,不用再拿出手机触屏操作。待对方收到信息后,回复微信,通过人工智能耳机,你就能够听得到对方的回复。
还比如:“芝麻开门,我想买件衣服,”它就帮我打开手机淘宝,然后跳转到衣服的页面,供我挑选。
甚至说“芝麻开门,我想去世界之窗,”它就帮我打开高德地图,直接把路径导航规划好,我在行走过程中的导航播放会通过人工智能耳机反馈给我。
所以,今后人工智能耳机将不仅仅是听歌使用,而是智能手机的控制终端。
下一步,我们还可以做到语言的互通,举个例子,“芝麻开门,给吉姆发条短信,我很感兴趣你的项目,一切按你说的操办。”这条信息会自动翻译成英文发到他的智能手机里,他在美国看到信息后,用英语回复的内容,将会自动翻译成中文传到我的智能手机里。届时世界上不同人种的沟通将不会有语言障碍,所以世界将会更加的平坦。
1号机器人网记者:从技术的角度去讲,你们认为虚拟语音助手下一步的发展方向是怎样?
任博昉:虚拟语音助手发展会有两大因素推动,第一个是大数据;第二个是智能硬件。
我认为未来虚拟语音助手可以是大脑连接互联网的通道,比如未来有更多的大数据互通的时候,将会产生巨大的信息流。届时虚拟语音助手可以提供更加具有针对性的服务。
比如:当我出门的时候,它会跟我讲,今天会有局部暴雨,出门注意安全,就不用再麻烦发布黄色预警,因为是局面暴雨,有些区域是没有下雨的,因此,信息的接收会更有针对性。
而且,当我戴上耳塞时,耳机就是我连接世界的桥梁,它会实时播放一些我感兴趣或我关注的资讯,我遇到什么不懂的事情,我可以直接问系统,系统会帮我解答相关的问题。
其次,虚拟语音助手的载体不仅仅是耳机,未来还可以与各种智能硬件结合,它会以各种各样的形态来满足不同人的需求。
所以,我认为虚拟语音助手的发展要把握这两个方向,因此,后续技术发展需要投入很大的资金去运作,我们也希望能够有更多的资本方和资源方加入到我们这个行列,让人工智能耳机更快的普及开来。
1号机器人网记者:最后一个问题,耳机算是虚拟语音助手的载体之一,在虚拟语音助手+智能硬件的思路上,你们还有什么新的想法?如果把时间调到未来十年后的场景,你认为那时的人们通过虚拟语音助手可以实现这样的生活方式?
任博昉:未来虚拟语音助手+智能硬件肯定是多种多样的,从我们的角度去讲,我们还是注重人工智能耳机的研发,但未来我们会考虑不同形态的耳机。
如便携音箱,因为长时间戴耳塞,人会受不了,而且在与客户聊天的时候,戴着耳塞也不礼貌,所以我们也制作了耳机的另外一种形态,“便携音箱”。当然,这个设备还需要再优化,但是便携音箱的不同就是在于,你只要把它挂在脖子上就可以了。非常的美观,也可以当做装饰物。
便携音箱的亮点就是,你戴在身上,你旁边的人是听不到它的声音,但它的声音你是可以清晰的听到。这就大大提升了它的用途。
随着5G的带来,我认为未来人们在线能力会越来越强,可以全天候时时刻刻的在线,所以你信息获取的效率会很高,几乎你的大脑与互联网是畅通的。
当你戴上便携音箱时,它会时时刻刻为你播放资讯,而且是你关注的资讯,打个比方说,今天美国总统特朗普出台一个政策,它会对哪些行业有影响?目前走势如何?等等信息不断播报给你。如果你是股民,它还可以告诉你,你持有的股票目前走势如何?现在是否要买进还是卖出。你只要回答“是”或“不是”。
如果是十年后的未来,我想象中的场景是,比如:我要回家,“芝麻开门,我要回家,”这时无人驾驶汽车自动行驶过来停在我面前,我上车,它送我到家。
如我要出门,无人驾驶汽车自动停在我家门口,我只要说,我想去哪里?它就自动将我送达。我下车,它可以自己找车位停车。
如果是按照优步的设想,未来无人驾驶汽车都是共享的,所以未来汽车都不用买了。总之,当我们时时刻刻在线时,我们的生活将会变得非常的便捷,前段时间看到一篇报道,说YouTube宕机一小时,就有人报警,如果未来服务器宕机一小时,那将是重大的事件,等于是让我们回到原始社会。
当然,这个话题扯的有点远,但我认为未来的场景可能会是这样的。
-
智能手机
+关注
关注
66文章
18407浏览量
179642 -
耳机
+关注
关注
28文章
2998浏览量
81103 -
人工智能
+关注
关注
1789文章
46576浏览量
236902
原文标题:骇音科技:人工智能耳机将会是智能手机的控制终端
文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论