0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软黄学东:企业应用最后一个痛点是会议中的语音

DPVg_AI_era 来源:未知 作者:胡薇 2018-05-23 16:07 次阅读

昨天下午,微软全球技术院士黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

在昨天的微软人工智能大会上,微软全球技术院士黄学东展示了微软多项语音、翻译等技术,微软Build大会上的“黑科技”全球首创AI会议系统再次被演示。

昨天下午,黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

新智元根据现场速记进行整理,部分内容有删节。

黄学东:评价谷歌没有什么意思,微软的“全武功”最有意思

问:您一直关注语音技术,现在很多搜索引擎还是通过输入文字来进行交互,什么时候我们能够看到像语音识别或图像技术真正改变到搜索引擎现在的状况?

黄学东:搜索引擎现在很复杂,我做语音之前做过搜索引擎,后台要完全了解所有的文件内容和关键是字是什么东西,还要匹配用户意图,找到相应的文本,它也有很多人工智能深度学习的技术。

语音识别在现在的媒体阶段,是文本输入还是语音输入还是图像输入?基本上还是一个相对比较松的耦合。语音进步的主要标杆是把波形转换成文字,这个过程中中文字也可以有不同的选择,因为语音识别不是完全的准确,就像搜索引擎一样,有第一个好结果,有第二好结果、第三结果,把整个结果给搜索引擎,搜索引擎在搜索的时候可以搜索不仅仅是第一好的结果,而且把语音识别第二好的结果也考虑进去。现在工业界的状态基本上是这样。

问:麦克风阵列部分经常在语音识别场景下遇到噪音问题,微软可以解决这个问题吗?还是说未来我们可以有更好的方法?

黄学东:我们有麦克风阵列的核心技术,并且已经有长足的进步,在业界是领先的。再加上360度的摄像头,这两者的结合让会议“AI神器”达到了很高的高度。不管是讲了什么话,各方面的指标都上了一个台阶。今后,我们的前景非常非常乐观。

问:之前谷歌Duplex打电话号称已经通过了图灵测试,你对这个怎么评价?

黄学东:不敢评价。媒体上很多评价说他们在作假,很多人质疑谷歌,让谷歌发言人出来认证,他们不出来认证,也不说话。

微软会议“AI神器”在多人自由交谈的情况下能知道谁在说话,而且知道说了什么话,做了现场演示。不仅做了中文,还做了英文,这是我们要表达的微软在语音识别业界的领导地位,是全武功,那个武是武力的“武”,不是一二三四五的五。

所以说批评谷歌没有什么意思,我们的“全武功”最有意思。

不仅能支持全双工,而且能支持“全武功”

问:上午微软展示了人工智能的系统,有哪些东西是微软从底层基础研发到开放再到产品的生产制造?有哪些是把底层的技术开放给伙伴,他们基于平台和技术做产品的研发和人工智能应用产品?

黄学东:首先,这些是研究的演示,微软从来不预先宣布我们产品什么时候出来、以什么方式出来。我们产品有几个东西可以讲,第一是我们的认知服务,语音这一部分云的API、模型、服务,有一套新的规律,这是在微软Build大会上已经宣布了的。

第二是定制服务增加了语音合成,想要换成自己想要听的声音,可以上传三个小时、十个小时,越多质量越好,可以定制到你想要的声音。所以我们全线语音和翻译都实现了量身定制。

现在如果你是开发商要开发自己的音箱,可以用微软刚刚推出来的MSDDK,这是我们和ROOBO合作推出来的一个最新解决方案,不仅仅有微软和ROOBO合作推出来的硬件,而且有最新的麦克风阵列,包括四麦线性的和七麦原型的麦克风阵列。这个黑科技是绝对引导业界潮流的,我们不仅能支持全双工,而且能支持“全武功”。

康容:我补充一下,因为微软是一个平台和工具的企业,我们是提供平台和工具,我们的黑科技、研发团队、我们的大咖博士发明的东西,他们渐渐的会落地到我们自己的产品中,也会提供给我们的生态合作伙伴让他们来开发。

微软大中华区副总裁兼市场营销及运营总经理康容

今天早上看到哪一个黑科技会在什么时候落地,很难讲出来,但是迟早会发生。我们会尽快的落地,我们会看市场的需求。所以,我们听到越多的客户和合作伙伴的声音,我们就会加速某某功能尽量落地。我们一系列的很多新东西都会提供给生态一起来合作。

问:ROOBO本身是针对不同的应用场景解决人工智能软硬结合方案的设计,然后去生产销售,过去这几年做这种场景化的人工智能设计,然后再去推广。人工智能产品怎么更成功的被市场接受,让消费者更容易去掏钱买?如何落地和激活?为什么这次和微软合作语音的开发及机会在哪里?微软的技术怎么独特的激活这个市场?

雷宇:其实这两个问题是一个问题。我们知道AI落地没有一个通用AI可以应用到每个垂直领域,这里面最核心的问题是如何产品化。

康容与雷宇(右)

在我们创业过程中我们发现,所有的方案只考虑技术,不考虑内容和服务。这在本质上违反了市场原则,用户永远要的是服务和功能,我觉得技术只是提升它的体验,我觉得这是一个本质的问题。

我们的痛点是在通用AI技术上,没有达到我们满意的效果,所以我们需要和国际上最顶尖的公司进行合作。

微软认知服务是全面性,微软服务本身也是有机体,本身考虑的就很完善。我们和微软的合作,因为我们看到了“明天”的东西,可以少走一些弯路,多模态和多场景的东西必然带来很大的变革。

企业应用最后一个痛点:会议中的语音

问:微软开发出了很好的语音识别等的技术,你们打算用这些技术开发出一些什么样的产品?智能音箱有很多企业都在做,但是具体的有没有什么更好的应用可以为大家更好的服务呢?

黄学东:语音交互过程中,在所有的商业场景中,用电子邮件、微信等等其他的产品都已经数字化了,会议中的语音是现在没有数字化的一个主要媒体,这对生产力的提高、对消费的提高是最后的痛点。在企业的应用中,最后的一个痛点就在这个地方。

会议比较难做,不像全双工,只有两个人在讲话,超过三个人的会议就比两个人会议难很多。如果能做到七八个人开会,都可以转录和翻译,可以变成数字化的形式处理。

问:如何看待目前的人工智能市场?

黄学东:我觉得人工智能造就的“饼”足够大,传统公司和新生公司都可以在这个饼上发挥自己的空间,为用户提供更优质的服务。微软云是提供全球很宽泛的一个平台,它的覆盖力不管是全球语言还是数据中心的覆盖力都应该是引导潮流的。在这样一个平台上,微软的从计算机视觉到自然语言处理,再到语音和搜索、知识表达等服务,都是业界领导潮流的。

所以在这个平台上和人工智能的深度上微软有非常大的优势,所以我们希望在提供这个宽度和深度这样的架构下,有更多的开发商可以在这个平台上开发出我们还没有想到的应用,这个才是平台做的事情。大家要知道微软有广度且有深度,这个情况下开发商应该加入这个平台,在上面创造他们新的价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6566

    浏览量

    103956
  • 人工智能
    +关注

    关注

    1791

    文章

    46859

    浏览量

    237567

原文标题:黄学东:微软“全武功”解决企业会议的痛点

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    精准高效,讯维智能语音转写系统打造智慧会议新体验!

    在快节奏的现代工作环境会议已成为企业沟通、决策和协作不可或缺的部分。然而,传统会议记录方式往往存在效率低下、信息遗漏、人力成本高等问题
    的头像 发表于 11-15 15:27 158次阅读
    精准高效,讯维智能<b class='flag-5'>语音</b>转写系统打造智慧<b class='flag-5'>会议</b>新体验!

    828 企业效率再升级,华为云会议 Flexus 版创新云会议体验!

    积累和华为云原生的公有云架构,为中小企业量身打造了整套高效、安全、智能的云视频会议解决方案——华为云会议 Flexus 版。 快速部署即开即用 在快节奏的商业环境
    的头像 发表于 11-15 15:21 166次阅读
    828 <b class='flag-5'>企业</b>效率再升级,华为云<b class='flag-5'>会议</b> Flexus 版创新云<b class='flag-5'>会议</b>体验!

    神州数码郭为:数字化转型面临三大,中国科技企业出海迎来重要机会点

    数字原生为底层支撑的架构是件任重而道远的事。对此,神州数码董事长郭为表示,目前中国政企在数字化转型的过程主要面临三
    的头像 发表于 07-29 15:03 375次阅读

    四麦语音会议方案

    四麦语音会议方案是种使用四麦克风进行语音捕捉和处理的会议解决方案,旨在提高
    的头像 发表于 07-23 22:37 247次阅读
    四麦<b class='flag-5'>语音</b><b class='flag-5'>会议</b>方案

    有效提升智能会议系统语音识别准确性案例分享

    语音识别技术是在智能会议系统至关重要,准确的智能会议语音识别能力,意味着会议参与者可以通过
    的头像 发表于 06-21 11:15 303次阅读
    有效提升智能<b class='flag-5'>会议</b>系统<b class='flag-5'>语音</b>识别准确性案例分享

    有效提升智能会议系统语音识别准确性案例分享

    语音识别技术是在智能会议系统至关重要,准确的智能会议语音识别能力,意味着会议参与者可以通过
    的头像 发表于 06-21 11:13 439次阅读
    有效提升智能<b class='flag-5'>会议</b>系统<b class='flag-5'>语音</b>识别准确性案例分享

    工业级路由器:解决网络传输的

    工业级路由器专为工业应用场景设计,具备高可靠性、稳定性和带宽,解决实时性要求高、大量数据传输、复杂网络环境等,适用于制造业和能源行业,提升生产效率、产品质量和企业竞争优势。
    的头像 发表于 04-29 11:40 399次阅读

    讯维融合通信系统:解决企业通信的利器

    融合通信系统,作为解决企业通信的利器,正日益受到广泛关注和应用。该系统通过集成多种通信技术和功能,为企业提供了种全面、高效、灵活的通信
    的头像 发表于 04-12 16:27 408次阅读

    数据采集边缘网关解决企业数据采集的关键

    网关 应运而生,成为解决企业数据采集的关键所在。 企业背景与
    的头像 发表于 04-07 13:56 358次阅读

    电梯物联网技术如何解决电梯管理的

    随着物联网技术的不断发展,电梯行业也迎来了新的变革。电梯物联网技术的应用为电梯管理带来了许多新的机遇和优势,同时也有效地解决了传统电梯管理存在的各种。 本文梯云物联网将探讨电梯物联网技术如何解决电梯管理的
    的头像 发表于 03-19 10:09 490次阅读

    高效管理会议空间:了解会议室屏蔽器的作用与应用?|深圳特信电子有限公司.

    高效管理会议空间:了解会议室屏蔽器的作用与应用?|深圳特信电子有限公司在现代商务环境会议室屏蔽器作为种重要的设备,在保障
    发表于 03-11 09:08

    微软Outlook新增&quot;In-person event&quot;功能,提升混合会议体验 

    根据微软的介绍,混合办公已成为后疫情时代不可逆转的趋势,然而如何有效管理线上及线下融合的会议变得极具挑战性。为了解决这个问题,微软推出了“In-person event”功能,旨在协助企业
    的头像 发表于 02-27 11:27 588次阅读

    数据中心机房建设的关键及解决方案

    随着信息技术的飞速发展,数据中心机房已成为企业信息系统的核心。然而,在机房系统的建设过程,投资及运行维护成为项目管理的关键。合理的投资决策和高效的运维管理是确保机房系统经济性和可
    的头像 发表于 02-03 10:26 1184次阅读

    数据中心机房建设的:投资与运维之间的博弈

    在数字化浪潮的推动下,数据中心机房建设成为企业发展不可或缺的环。然而,这一过程中存在系列的
    的头像 发表于 02-03 09:54 681次阅读

    通过Goooood®狗帝 融合CDN解决内容传递

    Goooood®狗帝 融合CDN解决了与内容传递相关的,为企业提供了全面的解决方案,优化性能、增强安全性、扩展全球覆盖范围并实现可扩
    的头像 发表于 01-08 14:36 383次阅读