0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别成主流!Alexa,你能保守秘密吗?

MEMS 来源:YXQ 2019-08-03 11:28 次阅读

我们都习惯了便捷的智能扬声器,比如在家中使用的亚马逊Echo和手机上的Siri等语音助手,然而,除了方便,我们是否应该更关注它们对隐私的影响?当我们将数据交给亚马逊、谷歌或其他一些大公司后,我们的数据和对话是否会被泄露?

语音识别成为主流

对语音识别最早的尝试出现在20世纪60年代,但直到20世纪90年代,这项技术才在电脑上实现并变得普及。Siri在iPhone 4S上的首次亮相为市场带来了真正的巨变,而这竟然已经是2011年的事情了。

今天,许多产品和设备上都设有语音控制的“虚拟助手”,例如苹果的Siri和谷歌访问助手。事实上,现在有六分之一的美国人拥有智能扬声器。目前,虽然亚马逊凭借在其Echo扬声器和其他设备上运行的Alexa引领市场,但它依然面临着强劲的竞争对手,比如谷歌、苹果和其他公司

当然,采用语音界面的不只是智能扬声器和移动设备,还有智能显示器,他们通常包含与智能扬声器相同的语音助手界面和AI功能,例如亚马逊的Echo Show。语音控制也被添加到智能电视和汽车,以及家用恒温器等普通电器中,而微软已将Cortana作为Windows系统的核心部分。

语音识别热潮背后的技术是在高性能云服务器上运行的人工智能(AI)和人工神经网络(ANN)。在本地设备中还需要一些复杂的信号处理,例如远场拾音,它可以从背景噪声中提取语音。

隐私问题

我们都知道技术有用,但一旦这些设备能收听、处理和响应我们的语音,那么会发生什么?微软最近的一项调查显示,41%的语音助手用户存有隐私方面的担忧。

通常,大多数智能扬声器会接收您的问题或指令音频,并将其上传到自己的服务器进行处理。这意味着您询问或告知扬声器的任何内容至少暂时由服务提供商存储。

虽然智能扬声器总是在“听”,但只有在听到“唤醒词”时才会上传音频,例如“Alexa”。但有些建议说,在实际使用中,扬声器可能会将你说的其它话误认为唤醒词,在违背你意愿的情况下开始录音和上传。

另一个值得关注的领域是服务提供商的员工对录音和数据的访问权限。最近的新闻报道称亚马逊有专门的人员听取录音以提高质量,这似乎合乎逻辑,但也带来了一些理论上的风险。另一方面,我们已经习惯了大公司存储我们的网络浏览历史和聊天消息,添加语音真的有什么不同吗?

有人担心这些员工会将语音数据链接到我们的其他个人详细信息,包括位置。了解你居住的地方对于提供本地化推荐很有用,例如您所在城市的最佳餐厅,但这确实会引发对于隐私的担忧。

本地处理

解决这些隐私问题的一种方法是将云处理与更多的本地AI处理相结合。这可以通过使用能够理解指令并做出相应响应的专用处理器来实现。

对于控制智能家居的许多交互,是可以无需与云进行任何通信的。而在需要交换信息的情况下——例如,当用户提出问题或者请求控制诸如Spotify或互联网广播电台之类的网络应用程序时,智能扬声器可以只将元信息(而不是实际对话)发送到云。

随着语音激活和控制被添加到更多的消费产品中,已经足够成熟的神经网络处理器可以部署到嵌入式应用程序中,并且可以用于本地计算,而无需将数据发送到云,这将有助于减轻许多人的隐私担忧。

虽然云公司更喜欢收集原始对话以建立数据库,但如果家用设备能发挥安全网关的作用,限制哪些信息可以与云共享,用户将更有可能信任语音服务。

这里的透明度至关重要:设备制造商需要向消费者表明哪些数据将在本地进行处理,哪些会发送到云。当然,关于这一问题的争论亦存在一个积极的角度:不难想象,设备供应商会使用其本地处理能力作为一个差异化因素,说服消费者购买具有更多“仅限本地”功能的智能扬声器。

OEM可以做什么?

提高公众信心的另一个方法是提供“从设计着手保护隐私”的功能,以便用户可以看到设备在提供信息保密。例如,亚马逊的Echo Show 5智能显示器带有覆盖摄像头的物理快门。所有智能扬声器设备都设有一个静音按钮,用于禁用麦克风。

无论硬件功能如何,无论我们的技术能力或经验水平如何,软件都必须提供让我们信任的用户体验。一个重要的步骤是为用户提供明确的路径,让用户能够设置隐私偏好,以及随时删除所有录音和历史记录。

保护隐私的另一个步骤是确保“唤醒词”提取(在本地执行)尽可能准确,以便消费者确信他们可以在不回避语音界面的情况下谈论私密话题。随着更强大的处理器和更复杂的算法在语音控制设备中趋于普遍,智能扬声器也能够可靠地确定用户是否在请求它们的帮助。

结论

未来的语音界面只会更加普及,那些能够提供优质产品和隐私保护的供应商拥有广阔商机。消费者想要便捷,有关其他技术产品的证据表明,如果供应商能够证明隐私可以得到保护,消费者会很乐意与语音控制设备进行交谈,就像在智能手机上打字一样。

最后,我刚刚问我Echo扬声器中的Alexa:“你能保守秘密吗?”它回答:“你可以放心地告诉我你想让我知道的秘密。”听上去有些含糊,但这是一个很好的起点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112535
  • Alexa
    +关注

    关注

    2

    文章

    196

    浏览量

    23276

原文标题:浅析语音界面带来的隐私问题

文章出处:【微信号:MEMSensor,微信公众号:MEMS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ASR与传统语音识别的区别

    ASR(Automatic Speech Recognition,自动语音识别)与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比: 一、技术基础 ASR : 基于深度学习算
    的头像 发表于 11-18 15:22 284次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 254次阅读

    WTK6900FC语音识别模块

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月25日 17:35:07

    唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、识别准确率高,但依赖稳定网络。
    的头像 发表于 07-22 11:33 364次阅读

    请问ESP-VA-SDK中怎么获取alexa技能响应返回的内容?

    目前在基于 ESP32-Vaquita-DSPG 开发板调研 alexa 控制相关的开发流程,目前需求是希望可以在 开发板 上获取通过 alexa 语音控制,返回的响应内容。 目前翻阅了大量资料文章,好像没有找到相关的内容,是
    发表于 06-13 07:13

    同样的语音识别芯片,告诉,我们厉害在哪里?

    语音识别芯片
    WT-深圳唯创知音电子有限公司
    发布于 :2024年05月30日 17:04:58

    离线语音识别与在线语音识别有什么不一样?

    离线语音识别与在线语音识别有什么不一样? 离线语音识别和在线
    的头像 发表于 12-12 14:36 1150次阅读

    离线语音识别,“自然说”为产品赋

    相比于云端语音识别,离线语音识别技术具有更高的识别准确率和更快的响应速度。因为离线语音
    的头像 发表于 12-11 11:20 446次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>,“自然说”为产品赋<b class='flag-5'>能</b>

    电阻的秘密——必须知道的电阻参数

    电阻的秘密——必须知道的电阻参数
    的头像 发表于 12-06 14:31 816次阅读
    电阻的<b class='flag-5'>秘密</b>——<b class='flag-5'>你</b>必须知道的电阻参数

    情感语音识别的应用与挑战

    一、引言 情感语音识别是一种通过分析人类语音中的情感信息实现智能化和个性化人机交互的技术。本文将探讨情感语音识别的应用领域、优势以及所面临的
    的头像 发表于 11-30 10:40 617次阅读

    亚马逊Alexa部门再次裁员,传统智能语音助手已来到终章

    生成式AI所带来的强大竞争压力。   引领一个时代的Alexa ,正在走向艰难转型   20世纪50年代的早期,当时美国科学家们开始研究语音识别技术。这种技术经历了多个阶段的发展,从简单的词汇量有限、孤立词的
    的头像 发表于 11-28 01:22 1573次阅读

    影响语音芯片识别率的因素概述

    语音芯片识别率是指芯片对人类语音信号的识别能力。在实际应用中,语音芯片识别率的高低直接影响了用户
    的头像 发表于 11-27 10:21 545次阅读

    离线语音识别及控制是怎样的技术?

    引言:随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连接,
    的头像 发表于 11-24 17:44 1107次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>及控制是怎样的技术?

    离线语音识别及控制是怎样的技术?

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连
    发表于 11-24 17:41