0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高始兴表示给有技术积累的创业公司带来非常大的机会

思必驰 来源:djl 作者:思必驰 2019-08-06 10:16 次阅读

极客公园在上海科技馆举办“2016奇点创新者峰会”,下午举办的内部高峰论坛中,思必驰CEO高始兴也给大家带来了非常精彩的分享。

高始兴表示从工业革命、信息革命,现在人工智能的革命,进入人工智能时代确实对众多的创业公司,特别是技术驱动的,有技术积累的创业公司带来非常大的机会。

以下为演讲实录:

思必驰创立8年左右,在8年时间,基本上或多或少已经成功见证人工智能,特别是语音行业越来越往后加速发展的阶段,我们最早是做教育方面的语音技术,后来专注智能硬件垂直行业做语音技术和产品服务。

早期语音更多是在传统的非常窄的市场去应用,包括呼叫中心。后来Siri发布,引爆整个语音在互联网的市场,吸引了很多眼球,吸引了很多资本,吸引巨头发展,推动整个市场,推动技术的进步。再到智能硬件物联网行业,语音成为刚性痛点的需求,在各个行业,各个垂直产品进行落地,整个行业确实爆发力很强。技术早期还是单点的技术,后来技术的提升,包括语音识别、合成、智能识别等等,包括现在从感知走向认知,对话技术。

以前这个题目有可能有点大,现在人工智能加速渗透到商业、生活的方方面面,语音在各个终端连接了各种各样的服务。早期的时候,还是一个简单的模拟,简单的算法,虽然期望特别大,但是落地特别少。真正再一次掀起一个小浪潮是80年代,在欧洲、日本商业的企业,包括声音网络,遗传算法。但是真正大的技术变革,真正在行业上掀起爆发式应用,还是在近10多年互联网时代,摩尔定律处理能力,大数据、云计算,让能力循环成为可能。现在确实在各个产业上,我们看到更多的应用场景。

语音技术是人工智能的关键

AI从互联网到移动互联网到物联网,现在到智联网,现在它的渗透率,推动率越来越大。早期在互联网、移动互联网,更多还是产品驱动,是一个商业模式驱动。现在在智能硬件物联网,泛人工智能行业,我们看到AI,人工智能驱动,让各种新型商业、新型商业产品成为一种可能。包括现在人工智能创业公司价值体现也越来越多。

从工业革命、信息革命,现在人工智能的革命,进入人工智能时代确实对众多的创业公司,特别是技术驱动的,有技术积累的创业公司带来非常大的机会。我们现在看移动互联网,不说互联网,移动互联网更多还是抢夺存量市场,一片红海甚至血海,现在这个市场行业不是A的就是T的,或者是B的,当然B最近口碑不是太好,但是他们确实在人工智能布局还挺早,挺大。现在在整个巨头占据足够的市场,影响力的时候,我相信在若干个场景能成就很多独角兽,包括技术公司,包括结合行业的一些公司。


如果简单分的话,人工智能行业,语音智能应用在应用层、技术层和技术设施层,应用层,像一些产品类的公司,像暴风和小米,小米用我们思必驰语音技术,包括像人脸商汤,包括现在思必驰语音公司。在技术设施层,包括庆科等一些优秀公司,当然还有巨头公司,在这里面,技术还是核心的驱动力,这里面有一个趋势,我们看到一个是技术层和技术设施层,产品落地,产品服务的整合,我们确实做得还不错,整个大语音在诸多行业,传统行业科大讯飞也在做设施层。再一个,应用层和底层设施技术层融合和整合,像乐视自己在做语音,现在估计有五六十人,服务于它的大生态。还有一个技术层、应用层向后端技术设施层去整合,去联合。比如说一起去做相关的芯片摸索,像京东、小米他们都在做。

现在各个模态人工技术发展特别快,刚才讲的人工识别,体感识别,包括像我们语音识别等等这些,VR、AR进展特别快。我觉得应该在很多场景下,我们在手机端,我们基本上特别是服务场景是打通的,我们通过触摸交互订票、订餐、购物等等这些行为,如果说我们在智能硬件物联网几个场景里面,比如说在开车的时候,我们在家里面对音响和机器人的时候,我们去订张票,语音可能是唯一的入口。第一的,它是很自然,很便捷,还有一个它是唯一能传递复杂信息的。未来,多模态整个人机交互两个趋势非常关键。一个是多模态融合和整合,融合是一个必然。现在人机交互还是被动式,未来在场景数据积累,用户行为数据等等这些,形成能力循环,未来人机交互会变成更多是主动式。未来的机器,从一个简单的秘书,真正成为一个助理。

如果从语音上,实现人对机器的控制,我们喊一嗓子,把空调调高一点,控制电视,调整音量,简单的查询,搜一些歌,未来场景力量,一个生态一定让用户能够enjoy更多的服务,一定需要对话交互,像手机端触摸交互一样,能获取更多的服务。再一个随着情感识别,情绪识别,包括各种的人脸识别等等一些人工智能交互模态的进步整合,未来情绪识别富裕这个机器形态,现在机器人很吓人,未来情感世界会大大解决这个问题。再往后思想交互,我们机器能够自学习,自适应,未来我们进行人机交互的时候,如果你不看到它,不知道对面是一个机器。像去年6、7月份,剑桥和苏黎士理工做实验,母机器人孵化子机器人,而且自己检测这个完备性。

现在在智能硬件物联网上,未来我们让智能设备向我们手机一样,我们随地随时可以去获取很多的服务,订餐、订票,玩游戏等等这些,一定是对话交互, 对话交互分成三类,一类是问答式,有明确的确定和否。第二类是闲聊式,像现在Siri,基本属于闲聊式,一般没有明确的确定和否,没有聊天的本体,再就是任务式对话,任务式像现在估计在座大家都知道,做得非常棒的亚马逊echo,echo基于场景用户去完成一个任务,假设在人机交互里面,说一句我饿了怎么办?如果是问答式,他会回答你你要一天三餐,保证健康。聊天式有可能有很多答案,比如说它会回答,主人你饿了吗?你随便吃一点,陪我聊天呀。如果任务式,结合你的历史信息,甚至结合你的位置,结合你其他历史行为,给你推荐周边的餐厅,有可能你愿意吃辣的,周边推荐湘菜馆,火锅店推荐几家,进而形成对话交互,规划交互一定是近几年的发展趋势。

我们思必驰基于自然语言理解和处理,再一个是我们整合了我们对话逻辑,一软一硬两个产品,我们提供给三个垂直行业,车载、家居、机器人,让每个设备成为智能助理,帮助用户完成任务。

语音是产品创新的关键技术

语音交互一切,语音改变更多,它除了连接一切,交互一切,未来会在产品创新,行业的一些变化,甚至变革上起到很大的推动作用。

几个观点,这个就是当前的一些语音在智能电视上的应用。这个是当时给小米电视,小米电视整个语音交互是用思必驰,这里面用的语音唤醒,我们找的是林志玲模拟她的声音。目前还比较简单,唤醒跟简单的查询。下一步,一定会走向从感知走向认知,不仅仅让人机的交互能够实现控制和简单查询,一定在各个场景里面,整合更多的服务。

再一个,现在移动互联网很多的行业生态,商业模式,在智能硬件物联网领域不一定完全能迁移,会发生一定的变化,甚至是颠覆。比如说搜索,现在PC互联网,移动互联网,我们端是手机,在智能硬件物联网是各个端,不单是端,交互界面都发生变化。再一个用户行为,在PC互联网,移动互联网,人机搜索更多是信息的查询,在智能硬件互联网上,更多还是服务的获取。再一个,就是传统的一些商业模式,像CBC,在新的智能硬件物联网上,新的语音搜索有可能也是CBC,再就是智能语音发展促进产品创新,甚至产品形态的变化,包括其他人工智能的发展。现在说智能终端,智能硬件,硬件的智能化,我觉得大概两类,一类是真正通过人工智能,语音智能提升它的效率,提升它的体验,向一些消费电子,比如说我举的例子,空调,我们跟一些大的消费电子合作,像海尔、美的等等合作,不改变它的产品的属性,但是提升它的体验,我在房间任何一个角度,我在晚上起来以后,或者遥控器找起来不方便,喊一嗓子“我冷了,调一下温”。这个不改变产品整体功能和形态。再就是通过人工智能,语音智能,改变了它的产品的核心功能,甚至拓展了服务,成为一个中心态势,比如说echo,未来像echo设备越来越多。未来像翻译耳机,好像日本公司做的,未来耳机不是打电话,我们出国,甚至假设有方言的话,特别是南方隔一个县,甚至隔一个村就是一个方言,我们戴着耳机就可以自由对话。包括未来的会议,我们现在会议电话还是开会,未来的会议电话加上身份识别,语音识别,它其实就是一个秘书。因为电话只要加了一个通信模块,任何东西都可能成为电话。所以未来有很多产品创新和融合,包括未来我们有可能灯泡,我们插排、插座,有可能我们就是的speaker。

再一个,现在我们看到的智能硬件交互,还是很难完成闭环,未来在智能音响、电视,机器人等上面,加上身份识别或者其他的生物识别,身份能够通过身份密码完成支付,形成一个交易的闭环,这样整个大的生态才能起来。包括一些行业的融合和创新。比如说未来我们在家里,我们通过电视,通过音响,我们在车里,通过车载智能终端学习英语,在家里可以做一些远程医疗等等,包括还有一些创新点子,包括前段时间有人提出来,监测儿童呼声,做一些相应的看护,刚才阿里朋友讲,鉴黄,通过图像识别去鉴黄。在今年年初的时候,有人提出来用声音去鉴黄,就是她的叫声,当然没有做,我觉得都是创新点。包括未来传统的数据结构,未来更多的在智能硬件物联网上,大量、大规模的数据,语音数据,视频数据等等,人脸数据,新型的数据结构,包括一些新型用户画像,包括借助我们设备识别,老人可能Push脑黄金广告,年轻人可能Push一些年轻的产品,可能小孩子Push一些玩具的广告。

还有整个市场出现几百上千的语音助手,包括有一些获得投资的,基本上也都销声匿迹了,在几年前整个语音在通用环境下能做好,这么几年从感知智能走向认知智能,通过对话交流可以打通一个一个信息通道,未来手机可以看成一个端,类似于像智能音响一样,智能电视一样,因此我个人觉得,未来智能手机上,成为新型语音助手。

思必驰还是专注于在智能硬件,物联网,车载、家居、机器人,我们提供人机对话交互的方案、产品和服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能语音
    +关注

    关注

    10

    文章

    781

    浏览量

    48704
  • 信息革命
    +关注

    关注

    0

    文章

    3

    浏览量

    5813
  • 工业革命
    +关注

    关注

    0

    文章

    107

    浏览量

    15798
收藏 人收藏

    评论

    相关推荐

    使用TPA3116D2做功放输出的时候,对FM干扰非常大怎么解决?

    我在使用TPA3116D2这个芯片做功放输出的时候(DC12V供电,增益26dB),发现其对FM干扰非常大。目前的做法是功放在一块板上,FM在另一块板上,两块板用导线的方式相连。在实际调试中,去除
    发表于 10-29 07:30

    OPA1622在播放中将EN接到GND会产生严重的噗声,非常大,为什么?

    OPA1622在播放中将EN接到GND会产生严重的噗声,非常大
    发表于 10-25 07:24

    使用adau1961 codec进行录音,发现录制的音频文件噪声非常大,请问什么办法可以优化吗?

    (1)我这边使用adau1961 codec进行录音,发现录制的音频文件噪声非常大,请问什么办法可以优化么,我这边已经排除MIC导入噪声的可能,实际使用AMIC。 (2)我这边使用tas2505作为pa接speaker播放一个wav文件,发现同样噪声
    发表于 10-12 07:35

    LM6172无论什么电路,噪声都非常大,为什么?

    最近使用这款芯片的时候,无论什么电路,噪声都非常大,甚至在电路中没有任何效果。我采用5V单电源供电,同相端给2.5V参考电压,后来看datasheet发现最低5.5V供电,请问这个有影响吗?应该不至于这么大影响吧
    发表于 08-26 06:07

    TPA3116在播放音乐时,声音非常大时会啪啪响,请问办法解决吗?

    TPA3116在播放音乐时,声音非常大时(已出现截止失真)会啪啪响,请问办法解决么? 用TCD-781曲目测试发现,当播放曲目3,4,5时(17hz/0db正弦波),推挽输出幅度只要超过最大
    发表于 08-13 08:32

    使用opa2836搭了一个简单的电压跟随,衰减非常大的原因?

    使用opa2836搭了一个简单的电压跟随,我输入的1V的正弦波,从1hz到5Khz,按照数据手册来说不会有衰减,但是实际用锁相放大器测试下来,发现衰减非常大 请教大家
    发表于 08-05 06:01

    LOG2112A双通道测试时,电压差异非常大是怎么回事?

    LOG2112A双通道测试时,电压差异非常大,A通道输出1.2V,B通道就只有50mV,单独焊接第一通道:输出电压为-3.358V 单独焊接第二通道:输出电压为-3.063V。有没有什么解决方法,有没有其它芯片能满足设计。
    发表于 08-01 07:00

    研华科技宣布与技术公司达成战略合作,共创边缘智能新未来

    今日,在世界嵌入式展览会上,研华科技宣布与技术公司达成战略合作,携手为边缘计算领域带来变革,共创边缘人工智能生态系多元且开放的新格局。
    的头像 发表于 04-11 09:24 577次阅读

    星宸科技登陆深交所创业

    全球视频监控芯片领域的佼佼者——星宸科技股份有限公司,成功在深交所创业板挂牌上市!星宸科技在SoC设计的全流程中积累了丰富的经验,始终坚持自主研发核心IP,在图像信号处理(ISP)、音视频编解码
    的头像 发表于 03-28 16:15 631次阅读

    思索技术终止创业板IPO

    近日,深交所披露了一则关于东莞市思索技术股份有限公司(简称:思索技术)终止首次公开发行股票并在创业板上市审核的决定。这一决定引发了市场对思索技术未来发展方向的广泛关注和讨论。
    的头像 发表于 03-07 14:25 629次阅读

    科通技术拟在深交所创业板上市

    知名芯片应用设计和分销服务商深圳市科通技术股份有限公司(以下简称“科通技术”)计划在深交所创业板上市,并计划募资20.49亿元。
    的头像 发表于 02-01 15:18 760次阅读

    采集到的ADIS16477-2的imu数据,测试陀螺、加速度计的漂移非常大怎么解决?

    我现在采集到的ADIS16477-2的imu数据,测试陀螺、加速度计的漂移非常大,IMU是放在台面上镜子不动的。 下图第一排陀螺x、y、z的原始数据,第二排分别是5s钟平滑后的数据。 下图第一排
    发表于 12-28 07:25

    DSP28335通过SPI与AD7689通讯,读出的数据变化非常大,也没有规律是怎么回事?

    大家好,我现在用TI的DSP28335通过SPI与AD7689通讯,读出的数据变化非常大,也没有规律(比如0,540,2048,3680,4,1024等等),AD7689配置寄存器是0xF104。请问哪位能指导一下,或者有没有程序参考一下,谢谢!
    发表于 12-08 07:58

    在使用AD9251-40做FPGA控制采集时发现由ADC采集上来的信号非常大的串扰是为什么?

    在使用AD9251-40 做FPGA 控制采集时候发现由ADC采集上来的信号非常大的串扰,怀疑是ADC差分时钟的问题。所用FPGA 型号是EP4CE40F23I7, 采用方式是直接用FPGA IO 口产生LVDS差分时钟输出给ADC,请问一下各位高手这里是否会出问题
    发表于 12-05 07:33

    EVAL-AD5940BIOZ开发板测量10K电阻的阻抗值波动非常大的原因?

    硬件设备用的官方开发板套装,程序烧写的是EDA的程序,然后用SensorPal软件观察数据发现测量10K电阻的阻抗值波动非常大,不知道是什么原因,大家有遇到这种情况吗
    发表于 12-01 07:09