智能语音作为人工智能的重要入口,近年来得到快速发展,竞争也较为激烈。身为行业领军企业,云知声嗅到市场变革方向,提前布局智慧医疗百亿蓝海市场。与此同时,云知声耗时 3 年成功研发面向物联网的 AI 语音芯片“雨燕”也于 18 年 5 月正式亮相,趁高通、英伟达、英特尔等芯片巨头还未进入语音芯片市场之际,此时正是“雨燕”开疆拓土的好时机。
随着人工智能的持续火热,大量资本涌入,智能语音市场上诞生了一大批明星公司。
而云知声是该领域为数不多的可为家居、车载、教育行业提供从智能语音芯片到软硬件一体化服务的全链条语音技术供应商。并且云知声在医疗行业通过与北京协和医院等合作,共同推动智慧医疗落地。
此外,在万物智联来临之际,云知声自主研发面向物联网 AI 语音芯片——雨燕,弥补通用芯片方案的低能效比及处理数据的算力短板。并将底层人工智能核心 IP——DeepNet 成功升级,可兼容 LSTM/CNN/RNN/TDNN 等多种推理网络,全面迈入融合语音、图像等处理能力的多模态时代。
01
基于“云端芯”战略
的多产业布局
基于语音识别、语义理解等技术,云知声建立“云端芯”产品化战略,并自研开放平台,基于平台向上延伸到医疗、家居、教育、车载领域,向下研发了专有 AI 芯片。
在医疗领域,云知声于 16 年 4 月与北京协和医院达成合作,以语音电子病历为切入点,逐步布局医疗百亿蓝海市场。发展至今,已与数百家医院达成合作,并于 18 年 5 月中标 400 多万元的郑州市中心医院医疗语音录入系统采购项目等。2018 年,云知声的医疗解决方案更是向医疗知识图谱、辅助决策全面升级,其推出的智能质控系统已在多家医院落地。
在家居领域,随着“雨燕”的亮相,产品服务体系逐渐丰富,目前应用在智能音箱、智能电视、智能冰箱等场景,已为格力、美的、海尔等家电厂商提供基于 AI 语音芯片的软硬件一体化服务。
在教育领域,云知声主要提供智能口语检测系统、早教机器人,对接企业主要为一起作业等教育机构。提供 API 接口,以调用量计费。现日均调用量已达 3 亿次,居行业领先地位。
在车载领域,云知声主要提供芯片到智能语音系统整体解决方案,在汽车前装、后装均有布局,并与吉利共同投资成立子公司共同发力多模态 AI 芯片。
02
以语音电子病历切入智慧医疗
随着数据的积累以及深度学习技术的不断发展,国内的语音识别技术最近三年才取得了突飞猛进的进展,识别准确率由 80 %提升至 95 %以上,达到了实用化的通用水平。云知声便以语音电子病历作为切入点开始布局智慧医疗。
从行业本身来看,医疗未来是语音落地的重要行业,云知声布局医疗领域价值度高。
一方面,国内智慧语音医疗市场潜在规模达百亿级别。
据卫计委统计,2017 年底我国现有三级医院 2340 个,其中三甲医院 1360 个。根据公开的中标信息来看,科大讯飞中标 507 万元天水市人民医院智慧医院建设项目,云知声中标 400 多万元的郑州市中心医院医疗语音录入系统采购项目。
因此判断一家三甲医院在智慧医院项目的潜在投入金额为 500 万元左右。同时,随着政府对医院信息化的建设加强,未来三乙医院、二级医院等机构也将加大智慧医院的投入,预计潜在市场规模在百亿级别。
另一方面,从海外智能语音巨头来看,医疗领域对其业绩增长支持力度较大。
以海外智能语音巨头 Nuance 为例,Nuance 在智能语音市场占有率达到 31.6%,位居第一。2016/2017/2018 年度的医疗行业营业收入分别为 9.73/8.99/9.85 亿美元,占总收入比值分别为 50%/46%/48%。
从公司本身来看,云知声在医疗领域的获客能力和技术与场景结合能力较强,促使云知声在医疗领域率先实现落地。
一方面,医疗领域进入门槛高,与三家医院进行试点合作本身就不容易,促使医院付费购买产品难度更高。
云知声在耗时 8-9 个月将协和医院的示范性案例成功落地后,品牌凸显。近年来订单逐渐增加,先后中标台州恩泽医疗中心智能语音录入软件系统项目、福建省立医院医疗智能语音项目、郑州市中心医院语音录入系统项目、镇江市第四人民医院项目。在其他企业还在进行打造典型案例时,率先实现千万级的营业收入。
此外,据云知声 CEO 黄伟透露,云知声目前已与 500 多家医院达成合作(包括已完成测试医院),且多数为三甲医院,客群质量高。众多知名医院的认可有利于提高云知声在行业的知名度。
另一方面,医疗与其他行业差别较大,存在着大量专业术语,对语音识别的算法要求更高。
云知声在医疗垂直领域提供录入软硬件一体的解决方案,基于医疗人工智能和大数据分析进行持续探索,实现智能语音交互的问答和病历查询,进行电子病历录入、健康风险预测和患者分群分析等。
云知声在提供语音电子病历的同时还提供病历质控技术,通过与医学知识图谱相结合,为医生的诊断进行质量控制。
技术方面,云知声对各个科室的业务进行了梳理,整理了超过 50 GB的医疗文本资料,并进行分类、检索等处理。通过不断积累数据,进行分科室语言模型训练自动优化学习,提高产品准确率。
云知声具有独创的语音增强、信道及说话人规整技术,有效拟制环境噪声干扰,能够完美识别正常普通话和有口音的普通话,且录入速度达 200-300 字/分钟,技术已达行业领先地位。
我们认为医院客户黏性较高,付费能力较强,行业仍处于初期发展阶段,云知声的先发优势会愈发明显。此外,在医疗项目建设时,医院会慎重考虑服务方各方面能力,技术、品牌、客户资源成为主要竞争点,云知声有望凭借自身优势在医疗领域占有举足轻重的地位。
03
面向物联网“雨燕”芯片问世
助力公司业绩再增长
从 PC 互联网到移动互联网,再到物联网,终端设备被赋予更多智慧能力,且需求碎片化严重,对于 AI 算力的要求越来越高,原有的通用芯片已经无法满足物联网设备处理数据的需求,AI 芯片发展已势在必行。
18 年 5 月,云知声在北京召开新品发布会,在行业内率先推出了 UniOne 物联网 AI 芯片“雨燕”及系统解决方案。
云知声“雨燕”芯片采用 CPU+uDSP+DeepNet 架构,在计算密度与功耗上占有绝对优势。相较于通用芯片,雨燕在 DSP 任务加速、miniNLP 任务加速、TTS任务加速、内存带宽利用效率、NN 任务提升等核心指标都带来了大幅提升。
在“雨燕”芯片问世之前,云知声以提供智能语音系统为主,按照设备量收取 license 费用,单个设备的 license 费用只有单个设备的 1%-5%,且提供的软硬件一体化产品中芯片需要外购,成本较高。
现在,云知声基于雨燕芯片将丰富公司产品体系,提供软硬件一体化解决方案,提高产品客单价,降低成本,为业绩提供全新动力。且将语音技术整体打包在一个硬件单元之上,系统主控集成便利,品质可靠,产品生产周期大幅下降。
发布芯片后仅四个月,云知声便选择将基于雨燕的解决方案进行开源,于 18 年 9 月正式推出智能家居解决方案。通过云端芯结合,提供给用户面向具体场景的软硬件一体化解决方案,降低客户设计起点及成本。
目前,云知声基于雨燕芯片的全栈解决方案已导入的各类方案商及合作伙伴已超过 10 家,包括美的、京东等,这些厂商对产品有严格的检验标准,也从侧面反映出云知声产品质量较高。
04
与吉利共同投资设立子公司
发力面向车载AI芯片
车载后装市场竞争激烈,同时这个领域存在大量中小企业,付费能力差,因此后装市场规模较小,很难支撑企业业绩增长,车载市场未来竞争的关键是前装市场,前装市场的关键在于如何获取主机厂客户。
18 年 9 月,云知声与吉利宣布共同出资成立一家合资公司,开展面向汽车市场的车规级 AI 芯片研发。
双方将基于云知声的语音识别、语义理解、语音合成、声纹识别以及后续不断拓展的图像 AI 技术,加之云知声在人工智能芯片的研发实力,再结合吉利在车载领域的硬件设施、内容架构等建设经验,发力面向汽车市场的 AI 芯片及基于芯片的整体解决方案,为用户与车之间提供更加智能的交互体验。
目前,云知声多模态人工智能核心 IP-DeepNet2.0 发布,标志着云知声人工智能处理核心由 1.0 语音时代全面迈入 2.0 融合语音、图像处理能力的多模态时代。且 DeepNet2.0 已在 FPGA 上得到验证,未来有望在面向车规级 AI 芯片上落地。
05
各方面表现优秀
产品与资源丰富
爱分析从技术、产品、资源、获客等四个维度对云知声进行评价。
技术:AI Lab 底层研发人员 100 多人,底层平台研发团队规模在行业中处于前列。同时,云知声从 2012 年开始布局语音领域,较早时间进入到医疗、家居、教育、车载等场景,基于场景的算法和数据积累时间长。其次,技术线覆盖语音识别、语义理解、语音合成、声纹识别等技术自研云知声开放平台、AI 芯片,技术链条长。
客群:医疗领域,主要面向三甲医院,付费能力强,客群质量好。车载领域,重点发力前装市场,与主机厂展开合作,AI 芯片等软硬一定化产品潜在出货量高。家居领域服务厂商多为美的、格力等知名家电厂商。
场景理解:专注于医疗、家居、车载领域,技术方案在三个场景内均有较多案例落地。医疗领域与北京协和医院共建医疗知识图谱,并在诸多知名医院开展语音电子病历建设。家居与车载领域通过将智能交互语音算法与 AI 芯片相结合,提供软硬件一体化服务。
获客:以直销自主获客。已在智能语音领域发展 6 年,积累了较多的客户资源,典型客户有北京协和医院、美的、格力、吉利等,客户群体质量较高,能够产生较好的示范效应。
近日,爱分析专访云知声创始人兼 CEO 黄伟,就智能语音发展趋势与云知声业务发展进行了深入交流,现摘取部分内容如下。
06
深入布局智慧医疗
AI 语音芯片有望快速抢占市场
爱分析:云知声近两年发展情况?
黄伟:近两年的发展情况可以用四个字形容,那就是少说多做。我们仍然主要从事医疗、家居、车载、教育领域,但相比于 16 年发生了翻天覆地的变化。无论是从技术链条还是业务深度都有较大发展。
在医疗方面,16 年 7 月份,我们才落地了第一家医疗医院——北京协和医院。现已与 500 多家医院进行合作,且 80% 以上为三甲医院。
在智能家居领域,我们的芯片 15 年开始研发,现在已经成功量产,其中芯片模组出货量已经超过 200 万片。
在车载领域,我们落地的前装车型已经超过30 个车型,并且18年10月份和吉利共同投资成立一家合资公司,预计明年起吉利的每台车都会使用云知声芯片和AI服务。
在教育方面,16 年我们每天只有接近一千万的调用量,而现在每天高峰已经达到 3 亿次,市场占有率和产品服务都有了很大的提升。
爱分析:云知声纯底层平台是否会作为产品对外输出?
黄伟:纯底层平台会作为产品对外输出。我们能够与百度、科大讯飞有强大竞争力的主要原因是我们拥有一个非常完善的底层平台——云端芯一体化。
它是我们在 13 年将机器学习和深度学习算法抽取出来搭建出的一个通用平台,构成了属于自己的类似于 Tensorflow 的 Atalas 。另外,还搭建了异构超算平台 DeepFlow,单个集群链接了超过 1000 个 GPU ,使得云知声在计算能力方面也位居行业前列。
去年年底公司成立了机器翻译团队,18 年 5 月份参加了 WNT2018 机器翻译国际评测,第一次参赛就取得了全球第二名。在产品规划之初,我们并不是针对车载来专门设计云端芯或家居云端芯,所以底层架构应用比较广泛。
16 年我们公司也就 200 人左右,17 年全年中位数 246 人,目前公司 400 多人,研发人员 AI Lab 为 100 多人。其他分为医疗团队,教育团队、家居团队的研发、销售、运维等。商务员工占总员工不到 10 %。
在技术方面我们做了语音识别、自然语言理解、语音合成等,并运用到教育、医疗、家居等领域。他们的共同点在于云端芯一体化底层平台。去年开始,我们开始输出底层能力。目前客户有平安科技、平安好医生等。
爱分析:云知声在医疗领域发展情况如何?
黄伟:我们 12、13 年开始想做医疗,但当时医院没有完成医疗信息化。且当时行业整体智能语音技术水平较低,产品无法广泛使用。15 年时医院信息化建设完成,通用领域的语音识别准确率可以达到 97%,此时结合语音能够较好的切入市场。
15 年还没有一家医院用语音来录入电子病历。医疗行业门槛很高,16 年我们开始做了第一家协和医院,从合作到落地大概耗时 8-9 个月。18 年 4 月份卫计委公布三甲医院的评级标准,将语音录入纳入其中。目前,东软东华都希望我们能够和他们进行合作。
AI+ 医疗一直备受期待。医生的工作任务通常比较繁重,其中一个重要的原因是需要手写病历,一个医生每天至少花 2-3 个小时记录病历,通过语音识别技术可以将书写时间缩短至 1 个小时,大幅提高医生的工作效率。
此外,在临床诊治阶段如口腔临床,医生需要双手持器械检查,待检查完之后需凭记忆书写病历,从而极易出错,通过智能语音系统可以在手术时放开双手,实时记录诊疗信息,从而降低误诊概率。
在医院方面,我们的目标是打造一个智慧医院。打造智慧医院需要大量数据,我们从语音电子病历切入,先产生语音电子病历,再做病历分析,不同场景技术难度不相同。需要通过不断积累数据,再结合实际场景对智能语音模型进行不断滚动优化。
云知声在医疗领域产品标准化程度很高、运营成本低。随着客户数量的增多,规模效应将会越来越明显。我们产品的难点在于如何用标准化产品满足不同客户的需求,这对技术团队的要求很高。
此外,AI+医疗目前很难收费,很多公司都是免费去做,通过打造典型案例进而推广市场。但我们已经每年能在医院行业得到几千万元营业收入,每家医院贡献几十万-几百万元。
在未来医疗领域发展上,云知声想做的是智慧医疗,语音是其中的切入点。真正的智慧医疗是多模态的,包括医生语音电子病历数据、化验数据、阅片数据等。
未来将会是多信息融合的方式,我们将继续发展现有的 NLP 技术、语音技术、图像处理基础上,适时引入第三方合作伙伴,共同研发更加完善的产品以满足用户需求。
爱分析:云知声在智能家居领域竞争优势有哪些?
黄伟:我们的优势在于我们拥有自主研发的 AI 语音芯片,并且技术领先,已经与美的、格力、海尔等知名企业达成合作。
对于芯片来说,研发芯片需要大量资金和时间。平均研发一个芯片时间大约为 2 年。
云知声早在 2015 年就组建了芯片团队,2016 年开始就市场、产品、技术路线以及芯片下游合作方进行评估,2017 年启动芯片产品定义、IP 选型、算法优化以及技术评估工作,并于 2018 年 5 月,第一代面向物联网人机交互场景的 AI 芯片“雨燕”正式亮相。
AI 芯片可以把语音识别整个链条算法连接起来。好处在于体积更小、成本更低,我们芯片的成本大概是通用芯片成本的十分之一,但运算速度是通用芯片的 50 倍。
此外,格力做的是主控芯片,我们的是智能交互芯片,两者是互补的。18 年营业收入中 70%-80% 与芯片相关。
我们的产品包括智能音箱、机器人、以及传统家电设备比如像冰箱空调等。美的、格力等对智能语音系统要求很高,且有自己的检验标准,我们的产品只有足够技术领先才能够完成他们的测试。
18 年的格力订单是去年同期的5倍,足以证明对我们技术产品的信任。
爱分析:公司在车载领域前装和后装是如何布局?
黄伟:在后装市场上,云知声于 13 年开始做了一些成功案例,14 年底由于大部分平板厂商经营失败,将库存平板设备移植到汽车上,所以 5% 的汽车开始使用安卓平板。2015 年 6 月我们把产品推广到市场,现在累计激活设备已有 1800 万台。我们把后装定义为过渡阶段,用于拓展客户、打磨产品。
我们认为车的过渡期为 2 年,从 15 年 6 月份到 17 年,从去年下半年进入前装市场以来,到目前为止累计出货的前装车型超过 30 个。现在的车场合作伙伴有吉利、上汽、通用、广汽等。如果中国每天有上千万用户使用语音的话,前装一定会做成一个标配。
爱分析:公司在教育领域主要对接的客户是哪些?
黄伟:在教育领域,我们主要输出的产品主要为口语测评能力,成长非常快。16 年的时候,我们大概每天 1000 万级的调用量,现在每天差不多有 3 亿次。
我们的产品主要是为企业提供服务,客户是新东方、学而思等教育企业,收费按照调用量收费。后期会延伸至 2C 市场。我们的市场份额 16 年还较少,但现在已经处于行业领先地位。
爱分析:云知声未来定位是什么?
黄伟:云知声未来定位最核心竞争力是AI能力,充分发挥语音和语言方面优势率先落地,同时会储备其他类似于图像能力,并将语音和图像结合起来生产多模态产品。
此外,我们将研发面向智慧车载、智慧城市的专用化芯片,我们认为在每一个垂直领域内,将会有一两个 AI 芯片厂商成为市场主流品牌。
目前云知声多款面向不同方向的芯片也已在研发中,包括适用性更广的超轻量级物联网语音 AI 芯片雨燕 Lite;集成云知声最先进神经网络处理器 DeepNet2.0 ;可面向智慧城市场景提供对语音和图像等多模态计算支持的多模态AI芯片海豚;以及与吉利集团旗下生态链企业亿咖通科技共同打造的面向智慧出行场景多模态车规级 AI 芯片雪豹。
-
人工智能
+关注
关注
1792文章
47425浏览量
238969 -
智能语音
+关注
关注
10文章
786浏览量
48812 -
智慧医疗
+关注
关注
9文章
1067浏览量
46521
发布评论请先 登录
相关推荐
评论