0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI+语音创造新价值

931T_ctiforumne 来源:工程师李察 2019-04-28 10:28 次阅读

到目前为止,您可能已经为Enterprise Connect 2019填写了评论,并且考虑到会议令人印象深刻,广泛的报道随处可见。EC19已经结束了,但我在这里有一篇观点文章,你不会在其他任何地方看到它,而且它只是松散地与该事件有关。

语音技术是EC19更有趣的主题之一--而不仅仅是因为我谈到了它--如果你想知道都谈到了什么,我有两个不同的例子可以分享,那是我为我的演讲所做的研究。

像其他任何事情一样,这个主题只有在以某种方式思考它时才有意义。我通过解释人工智能AI)和语音是如何在非常不同的轨迹上的两个不同主题来开启我的演讲。人工智能是超级大肆宣传的,最热的话题,并且同时是面向各个方向的。没有重心,每个供应商都在尝试加入人工智能元素或人工智能赋能--无论销售什么。其中一些努力将取得成果,一些将悄然消失--语音是人工智能轨道的合理应用之一。

另一方面,语音技术非常成熟,迄今为止主要是功能性的,与音频转录和语言翻译有关的用例。现在,想象一下维恩图(Venn Diagram)和两者之间的重叠空间,这就是我看到新价值具有潜力的地方。AI是语音识别的新转折,由于各种原因,它将事物提升到一个全新的水平。

除了在语音准确性方面做出渐进但非常明显的改进之外,AI还将语境,意图,情感等带入等式,并提升语音的价值,实际上是用于协作等用例。这是一个单独的主题,对于这篇文章而言,我只想用我在演讲中提到的具体例子来说明发生了什么。

Otter.ai--Seeing is Believing-实时转录

我之前已经引用过这个例子,但它也适用于这篇文章。Otter.ai是AI Sense的独立产品,是实时转录产品的领先示例,我认为它很快将成为协作平台的标准功能。经常转录是在事实发生之后,但实时是在当下,并且正在成为使会议更具包容性的一种方式。

除了不必记笔记--因此在会议期间有更多的参与--这还有助于听力受损或无法跟随英语演讲的参与者与其他人保持同步。考虑与多文化参与者会面,其中英语不是母语,但也要考虑具有强烈口音的发言者,即使是讲英语的参与者也很难跟随。

我很厚颜无耻,但是在这里我想到的是Austin Powers的这个场景,当时他正在和他的爸爸一起玩耍。不仅是英语口音很大,甚至说英语的人都需要字幕,但是还有一层俚语解码--而这是另一个AI问题,我确信Otter的人们都在努力工作加以实现。

回到协作环境,实时转录和实时翻译的结合创造了另一个引人注目的用例。这种情况的变化已经存在了一段时间,我们在微软的EC19主题演讲中看到了一个很好的例子。单独地,这些功能中的每一个都令人印象深刻,但是当你展示它们一起工作时--正如微软所做的将一位中国演讲者的演讲翻译成英语一样--这是非常神奇的。

然后是AI部分,这是很多新价值的来源。Otter's Teams应用程序允许使用扬声器标记,并且所有文本都可搜索,很容易找到一个人说话的所有地点,甚至是两个特定人互相交谈的地方,或添加搜索词以便随时查找正在讨论转录中出现的这个词。搜索的可能性是无穷无尽的,这使得转录成为会议的有力增值项。

其他重要功能包括自定义语言参考,以便转录引擎能够准确地跟踪您的行业或特定项目的特定术语或缩略词。Otter。ai与大多数主要协作平台集成,因此它是您已经使用的增值服务。还有双因素身份验证可确保您的工作空间的安全性,特别是对于那些远程加入会议的人来说,他们的身份难以确定。

这些功能非常酷,但除非转录准确性很高,否则它们都不重要--不仅仅是为了阅读,还有实际上当你真正付出最多的注意力时。对于Otter.ai而言,准确性是一种自豪感--就像我一直在谈论的每个语音文本播放器一样--如果你看看该团队的背景,那么你一定相信血统论的正确存在。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音
    +关注

    关注

    3

    文章

    385

    浏览量

    38068
  • AI
    AI
    +关注

    关注

    87

    文章

    31148

    浏览量

    269478
  • 人工智能
    +关注

    关注

    1792

    文章

    47438

    浏览量

    238985

原文标题:AI+语音创造新价值

文章出处:【微信号:ctiforumnews,微信公众号:CTI论坛】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    科技云报到:从大模型到云端,“AI+云计算”还能讲出什么新故事

    科技云报到:从大模型到云端,“AI+云计算”还能讲出什么新故事
    的头像 发表于 01-07 13:27 78次阅读

    服务客户,创造价值 | Aigtek安泰电子2024年终复盘

    服务客户,创造价值 | Aigtek安泰电子2024年终复盘
    的头像 发表于 01-06 18:47 78次阅读
    服务客户,<b class='flag-5'>创造价值</b> | Aigtek安泰电子2024年终复盘

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    一、DEMO思路 在这个HarmonyOS NEXT原生应用DEMO中,我们将使用ArkTS开发语言创建一个简单的AI智能语音播报应用。 该应用能够接收用户输入的文本,并使用TTS
    发表于 01-06 15:33

    高通发布骁龙X Plus 8核平台,助力Windows 11 AI+ PC体验

    此前,在2024年柏林国际电子消费品展览会(IFA 2024)前夕,高通技术公司宣布推出骁龙X Plus 8核平台,扩展其骁龙X系列产品组合,为更多人带来多天电池续航、出色性能和AI赋能的Windows 11 AI+ PC体验。
    的头像 发表于 11-08 11:02 416次阅读

    鲲云科技和启源芯动力入选2024年度“AI+安防”十大标杆项目

    下,甄选出了一批具有高价值、标杆性的 2024AIIA “AI+安防”专项案例,包括标杆案例 10 个、优秀案例 15 个、典型案例 25 个。
    的头像 发表于 10-27 10:12 569次阅读

    共创AI+时代——2024中国移动全球合作伙伴大会

    10月11-13日,2024中国移动全球合作伙伴大会在广州琶洲保利世贸博览馆拉开帷幕,为期三天的大会以“智焕新生共创AI+时代”为主题。RISC-V国际人才培养认证中心主任蒋学刚出席参观了本次
    的头像 发表于 10-16 08:09 452次阅读
    共创<b class='flag-5'>AI+</b>时代——2024中国移动全球合作伙伴大会

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 编辑 视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能
    发表于 06-18 17:33

    软通动力成功承办知识城AI+产业生态大会

    等近300位代表齐聚一堂,共同探讨和解读“AI+”在千行百业中的创新价值,以及带来的应用场景和商业机遇。
    的头像 发表于 06-14 14:57 565次阅读

    粤港澳大湾区AI+智能传感器科技创新研讨会成功举办

    随着人工智能技术的飞速发展,智能传感器作为关键部件,在各行各业的应用日益广泛。为加强粤港澳大湾区内AI+智能传感器产业的交流与合作,推动智能传感技术的商业化应用与发展。深圳市人工智能产业协会AI+
    的头像 发表于 05-14 08:24 1129次阅读
    粤港澳大湾区<b class='flag-5'>AI+</b>智能传感器科技创新研讨会成功举办

    神州信息发布AI原生产品九天揽月“AI+

    近日,神州控股、神州信息、神州数码集团联合主办的数云原力®大会2024盛大启幕,神州信息常务副总裁于宏志在会上隆重发布了面向金融行业的AI原生产品——九天揽月“AI+”。这款产品标志着神州信息在人工智能技术领域的又一次重要突破。
    的头像 发表于 05-11 09:22 507次阅读

    AI+工业互联网”赋能新型工业化的路径分析

    横看成岭侧成峰,探索“AI+工业互联网”技术赋能新型工业化的路径,还要从技术视角、产业视角、应用视角综合分析。
    的头像 发表于 03-14 10:57 1208次阅读

    大企业如何推进AI

    要推动AI技术却不能为技术而技术、领导不要过于强调AI,而是要坚持价值驱动的原则、坚持做实用的技术、做解决实际问题的技术,在创造价值的过程中推动技术的发展。
    的头像 发表于 02-25 09:36 408次阅读

    车内语音识别数据在智能驾驶中的价值与应用

    车内语音识别数据在智能驾驶中的价值与应用 一、引言 随着智能驾驶技术的不断发展,车内语音识别数据在智能驾驶中的应用越来越广泛。车内语音识别技术不仅提高了驾驶的便捷性和安全性,还为智能驾
    的头像 发表于 02-19 11:47 617次阅读

    语音数据集在智能驾驶中的价值与应用

    一、引言 在智能驾驶的背景下,语音识别技术已经成为人机交互的重要手段。而语音数据集作为语音识别技术的基石,对于提升语音识别的准确性和效率具有关键作用。本文将详细探讨
    的头像 发表于 01-31 17:08 441次阅读

    AI语音与机器视觉开发应用系统

    一、简介 AI语音与机器视觉开发应用系统是一款集成AI语音、机器视觉、深度学习基础、嵌入式Linux于一体的高端教学科研实验平台。 整个教学平台由实验箱高性能嵌入式主板够成,高性能嵌入
    的头像 发表于 01-26 11:24 422次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>语音</b>与机器视觉开发应用系统