0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海岸语音石伟:声矢量技术带入消费级市场还远远不够 我们的目标是整条语音技术链条

h1654155972.5709 来源:电子发烧友网 作者:工程师谭军 2018-07-14 09:19 次阅读

互联网发展至今,面对人工智能大时代的到来,智慧、高效、便捷的人工智能研发应用,发展智能产业成为科技行业工作的重中之重。协会特派记者走进深圳海岸语音技术有限公司,对石伟总经理进行了智能语音行业相关专访。

深圳海岸语音技术有限公司创始人、总经理 石伟

记者:智能语音作为人工智能应用最成熟的技术之一,科技巨头、初创公司纷纷布局,海岸语音是怎样定位与布局?

石伟:从人机交互形式出发,语音识别无疑是人工智能产品与用户之间,最便捷有效的交流形式。语音交互技术链条较长,包括语音识别前端处理、语音识别、语义理解、语音合成等环节。在语音识别方面,百度、科大讯飞、谷歌等技术领先。我们主要做语音识别前端处理的技术,是一家专注于智能听觉感知技术的人工智能初创企业,面向物联网和人工智能时代,提供软、硬件结合加云端引擎的一体化智能听觉感知技术解决方案。

记者:海岸语音的产品及应用有哪些?

石伟:有别于传统的标量麦克风技术,我们产品所采用的是声学矢量传感技术,可同时测量声场的声压信息和方向信息,该技术最早源于潜艇的矢量水听器,在空气中的应用极少。我们团队历经 8 年研发,打造出 AI 时代必不可少的“机器耳朵”:VecSense ™ 智能声矢量传感器。该传感器是世界首款消费级声矢量传感器,可以应用在机器人智能音箱、家电等诸多领域。

记者:海岸语音的核心竞争力体现在哪些方面?

石伟:把产品做小、成本做低(几美元左右)是我们研发的方向。目前 VecSense ™ 智能声矢量传感器比一毛钱硬币还小三分之一,性能高、成本低、体积小的特性使其在智能语音、机器人、智能家居无人机、穿戴式设备以及智能车载等领域都有广阔的应用前景。

作为 AI 时代机器必备的器件之一,“机器耳朵”需要更多的信息实现其智能的特性,这是传统的标量麦克风所面临的局限性。虽然在声学传感器的发展史上,各大研究机构尝试了通过多种方式获取除了声压信息以外的声音方向信息,但这些技术都具有各类不同的缺陷,使其无法在消费级产品中使用。

我们在小尺寸的单颗传感器封装内实现平面 360°声音定向,并内置多种语言 / 音频智能算法。不仅在听音辨位、抑制干扰、远场拾音方面表现出超强的性能,因其独特的信号特性还能做到出色语音分离,让智能机器同时听懂多个说话人的指令。

在数量、尺寸、功耗和成本方面,一颗 VecSense ™传感器对应四至八颗传感器组成的麦克风阵列,显然具有突出的优势:尺寸减少 70%,功耗降低 90%,同时成本可降低 90%。

记者:海岸语音发展过程中有遇到哪些困难?

石伟:目前我们产品还未正式推向市场,产品还在不断地优化,找到行业典型应用是将要面临的一大挑战。在未来推向市场的时候,产品的正式落地希望能够找到知名度较高的产品或厂商背书,进一步打开市场。

记者:石总怎么看待科技巨头与初创公司在智能语音领域的发展模式?

石伟:科技巨头主要打造开发者生态系统,使用算法平台吸引开发者,实现数据的快速积累、产品的快速迭代。目前,在国内智能语音领域,科大讯飞是做得比较完善,一整条产业链相关技术产品都有涉及,并将自身语音技术植入相关合作伙伴的产品中,以推动智能语音和人工智能技术在家居、车载、可穿戴等领域的落地。

初创公司目前以垂直领域和细分场景为突破口,切入产品场景应用。初创企业不应求大、求全,而是结合自身优势做最“性感”的技术和产品。

记者:海岸语音未来有些什么规划?

石伟:海岸语音目前专注语音识别前端处理,未来将从前端向一整条语音技术链条进行渗透,实现音频和视频融合的人机交互。我们会将底层的技术打包为完整的交互解决方案,服务 B 端客户。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1210

    浏览量

    55443
  • 人工智能
    +关注

    关注

    1792

    文章

    47458

    浏览量

    239113
  • 智能语音
    +关注

    关注

    10

    文章

    789

    浏览量

    48819

原文标题:对话 | 将声矢量技术带入消费级市场—专访深圳海岸语音技术有限公司总经理石伟

文章出处:【微信号:SRA2009,微信公众号:深圳市机器人协会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    (Text-To-Speech,文本转语音技术将文本转换为语音进行播报。 当然除了基本的文本输入和播报功能外,我们增加了
    发表于 01-06 15:33

    语音识别技术在医疗领域的应用

    语音识别技术在医疗领域的应用已经越来越广泛,为医疗服务带来了诸多便利和效率提升。以下是对语音识别技术在医疗领域应用的介绍: 一、语音病历
    的头像 发表于 11-26 09:35 416次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音
    的头像 发表于 11-26 09:20 578次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 860次阅读

    请问有移动设备上用的2.1道的语音功放芯片吗?

    请问有移动设备上用的2.1道的语音功放芯片吗?前端是左右声道差分音频输入。电源电压 大概3~5V。
    发表于 10-15 07:54

    语音降噪 -音频技术的一个重要话题

    语音降噪技术在提高语音清晰度和用户体验方面发挥了重要作用。通过选择合适的技术和优化配置,可以有效解决背景噪声、回声和音质保真等问题。未来,随着深度学习和人工智能的发展,
    的头像 发表于 09-13 16:20 3032次阅读
    <b class='flag-5'>语音</b>降噪 -音频<b class='flag-5'>技术</b>的一个重要话题

    人工智能的语音识别技术详解

    随着科技的飞速发展,人工智能(AI)技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用前景,引起了社会各界的广泛关注。本文将详细介
    的头像 发表于 07-01 11:39 1376次阅读

    基于助听器开发的一种高效的语音增强神经网络

    。虽然模型压缩技术是一个活跃的研究领域,但我们是第一个证明其有效性的RNN语音增强,使用剪裁和权重/激活的整型量化。我们演示了状态更新跳跃
    发表于 06-07 11:29

    标贝语音识别技术在金融领域中的应用实例

    随着语音识别技术与文本挖掘、自然语言处理等技术的不断融合,智能语音交互技术在金融领域中爆发了出巨大的应用潜力。标贝科技根据自身与金融领域合作
    的头像 发表于 05-16 16:55 640次阅读
    标贝<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>在金融领域中的应用实例

    车内语音识别技术在智能驾驶中的应用与前景

    一、引言 随着智能驾驶技术的快速发展,车内语音识别技术逐渐成为智能驾驶领域的研究热点。语音识别技术为驾驶员提供了更加便捷、安全的驾驶体验,同
    的头像 发表于 02-19 11:46 863次阅读

    车内语音识别技术:智能驾驶的革新之源

    一、引言 随着科技的飞速发展,智能驾驶已经成为现代交通领域的热门话题。作为智能驾驶的关键技术之一,车内语音识别技术正在改变我们对驾驶的认知。它不仅提高了驾驶的便捷性和安全性,也为驾驶者
    的头像 发表于 02-19 10:10 482次阅读

    语音合成技术在智能驾驶中的创新与应用

    一、引言 随着智能驾驶技术的不断发展,人机交互变得越来越重要。语音合成技术作为人机交互的重要手段,在智能驾驶中发挥着越来越重要的作用。本文将探讨语音合成
    的头像 发表于 02-01 18:09 680次阅读

    语音合成技术在智能驾驶中的应用与展望

    一、引言 随着科技的飞速发展,语音合成技术逐渐成为人机交互领域的重要分支。在智能驾驶环境中,语音合成技术更是发挥着不可或缺的作用。它不仅简化了人机交互过程,还为驾驶员提供了更加便捷、安
    的头像 发表于 02-01 17:50 550次阅读

    语音数据集:智能驾驶中车内语音识别技术的基石

    一、引言 在智能驾驶中,车内语音识别技术发挥着越来越重要的作用。语音数据集作为这一技术的基石,其质量和规模对语音识别的性能有着至关重要的影响
    的头像 发表于 01-31 16:07 570次阅读

    恩智浦发布新一代智能语音技术组合的语音识别引擎

    恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Intent引擎,以及您如何在应用中使用它。
    的头像 发表于 01-26 09:15 786次阅读
    恩智浦发布新一代智能<b class='flag-5'>语音</b><b class='flag-5'>技术</b>组合的<b class='flag-5'>语音</b>识别引擎