7月5日一早,李彦宏乘坐一辆基于Apollo 技术开发的自动驾驶汽车从百度大厦前往国家会议中心,本次百度AI 开发者大会的进程也随之徐徐展开。路上,李彦宏还和现场的陆奇进行了连线互动:
百度AI开发者大会(Baidu Create 2017)是全球首个专注于AI开发者的盛会,现场有近5000名开发者和生态合作伙伴出席。在此次大会上,百度宣布开放Apollo和DuerOS 两大平台和60项核心AI能力。李彦宏、陆奇在现场发表了演讲。
Baidu Create是百度、也是中国工业界第一次大规模的AI 开发者大会。和历史上的机械化时代、电气化时代、信息化时代一样,AI对社会的影响深度和广度都是空前的,AI将和前三次工业革命一样,让人类进入全新的时代。
百度17年的搜索业务和早期的战略投入,让我们积累了大量的人才、技术和数据资源。技术方面,百度拥有全球领先的大规模神经网络;人才方面,百度目前有超过2000个的AI研发人员,有一流的AI研发中心;数据方面,百度有超过百亿级的定位数据和万亿级的搜索数据。这使百度成为最有能力、最有机会来推动AI的发展的一个公司。
AI的未来是属于开发者,开发者是我们工业驱动力、主驱动力,百度的未来是建立在与开发者共赢基础上。开发者的成功,才是百度真正的成功。这是我们承诺,这也是百度AI平台的核心价值观念。AI时代的机会非常多,但是壁垒还很高,百度要为每一位AI开发者解除障碍、创造机会,提供工具、数据、基础设施,以及良好的开发环境。
“这是一个个人版的开发套件,这是轻量版的开发套件……”在百度AI开发者大会上,百度度秘事业部总经理景鲲接连掏出了三款DuerOS开发套件和一款硬件参考设计。只要接一个电源,接一个麦克风,就能“唤醒万物”。
在景鲲看来:“唤醒万物”的核心三要素是要做好“听清、听懂、满足”。
1.“听清”方面:百度的语音识别准确率达到了97%以上,但这些在AI时代还不够。在AI时代,我们希望把语音放到真正的场景里面,麦克风阵列、回声消除、波束成型、语音唤醒、人像识别等,都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求。
2.“听懂”方面:数据多、技术深是打造对话系统的必然条件,具备这两点才能做好一个真正可以对话的“听懂”系统。百度是具备数据量最大的公司,我们有十亿级的数据和百亿级的知识。在AI时代,要做到听懂用户,实时图谱数据的力量将是一个非常重要的支撑。
3.听懂并满足“听一首XX的歌”这样的用户需求还不够,真正用户想要的是更自然、更复杂的需求,比如“我要听‘我手一杯品尝你的美’这首歌”,比如“想听哥哥的歌”,只有把用户在真实场景中表达的复杂请求做好,才能真正做出一个真正听懂用户需求的产品。
景鲲说:“我们的目标就是要做FreeStyle,让用户最自然地跟设备进行交互。”
他还现场演示了与DuerOS的多轮交互对话:
“找一下本地人气最火爆的家常菜”
“雍和宫附近有吗”
“第二家有什么推荐菜”
“有wifi吗”
“好停车吗”
……
KITT.AI 联合创始人、CTO陈果果
景鲲在百度开发者大会现场宣布:百度将全资收购KITT.AI,把KITT.AI的技术融入道百度平台中,全面、免费、正式地向百度的合作伙伴赋能开放。
KITT.AI专注语音唤醒和自然语音交互技术,是唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并入选了CB Insights人工智能创业100强。
DuerOS将为开发者提供最容易上手的软硬件一体化方案,包括多样化的开发套件和完全开放的参考设计:
1.搭载树莓派。利用科胜讯技术的个人版。即可申请就可以搭载一个个人可以对话的语音设备。
2.轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。
3.标准版。两麦、四麦、六麦、八麦的标准版都可以即可申请。
4.完整一体化的参考设计。如开放电路板设计、开放结构设计、开放麦克风阵列等等。
从4月19日百度宣布Apollo计划之后,在短短两个多月内该计划得到了工业界广泛的正面反应。今天,陆奇正式公布了Apollo整体战略和开放路线图。
Apollo生态设计是基于一个强大理念和宗旨,即Apollo宣言。Apollo宣言有四个基本原则:
1.开放能力。今天的汽车工业正在走向自动驾驶的未来,但最大痛点是技术壁垒太高,任何一家企业都需要多年技术,人才和数据的累积。百度起步较早,有将近4年的相关积累,并且有强大的持续研发能力。百度将把这些能力开放给合作者,让他们很快进入自动驾驶研发。
2.共享资源。任何一个Apollo的合作伙伴都可以使用Apollo技术,同时他们都有机会对Apollo生态做贡献,尤其是贡献有价值的数据资源。Apollo计划的共享原则是:你从Apollo生态中获得的,将远远多于你所贡献的。贡献的越多,获得的更多。Apollo受益,合作伙伴更受益。
3.加速创新。这是Apollo的核心所在,因为AI的技术核心是数据+能力。数据的累积、能力的迭代、技术更新的速度是整个工业的关键。Apollo生态会将越来越多的数据资源汇总在一起,这样Apollo每天开过的路就越多,测试的场景会越来越多,而且这个迭代、创新的速度将会不断的加快。未来Apollo的创新速度和创新能力将超过任何一个封闭体系,Apollo自动驾驶能力一定会领先整个工业。
4.持续共赢。百度的商业模式将基于百度的算法、数据、大规模计算等核心能力,聚焦提供一系列高价值的商业化核心服务。百度所提供的能力,将是目前汽车工业所没有、可互补的。每个合作伙伴都可以聚焦在自己的核心能力上,用Apollo来加速创新,获取更多的商业价值。
Apollo的核心技术框架由四层组成:
一、中间是软件平台。Apollo开放了一系列重要模块,重点是以下四大模块。
1、自定位模块:使用百度业内领先的高精地图,加上多种传感器融合,让每一辆车都可以低成本、全天候地精准定位。
2、感知模块:感知是当前自动驾驶工业创新的重点,运用顶尖的人工智能技术能看清和看懂路况,包括每一个障碍物、行人、车辆。
3、车辆规划控制:Apollo模型运用AI和大数据,采取最安全的驾驶策略做到精确的车辆控制,也能适应不同国家的交通路况。
4、运行框架:它的核心是安全、可靠、实时控制,并能同时支持Intel和NVIDIA的芯片。
二、最上层是服务平台。Apollo一系列重要的开放能力都汇聚于此。重点包括:
1、高精地图服务,这是自动驾驶的千里眼。
2、仿真引擎。百度在快速累积海量的数据,能让开发者日行百万公里
3、安全服务。百度将为开发者持续提供高度的安全服务。
另外,DuerOS服务将为每一辆车提供智能化的车内用户体验。
三、参考硬件平台和参考车辆平台。
Apollo硬件平台支持从CPU到GPU到FPGA各种计算硬件,也支持从GPS、IMU、摄像头,到激光雷达等各种传感器。同时,Apollo提供的黑盒子能够记录和保存所有的数据信号,使得合作伙伴可以更安全、有效地预防和处理车辆事故。
把所有的模块加在一起,Apollo能让每一个开发者从 0 到 1, 快速组装一辆属于自己的自动驾驶车。今天正式对外开放Apollo 1.0,它将有三种不同的开放形式:开放代码、开放数据和开放能力。百度的合作伙伴AutonomouStuff的一位工程师,根据百度今天发布的软件框架、结合推荐的硬件组合方案,只用了三天时间就改造完成了一辆自动驾驶汽车。
百度今天正式对外开放的是Apollo 1.0。百度开放了封闭场地循迹自动驾驶能力、自定位能力和端到端等非常有价值的数据。更为重要的是,Apollo会快速地开放越来越多的能力,每周都会更新,每两个月左右都有新的版本和总体能力的提升。
点击查看大图
接下来百度的具体计划是,到今年9月份,Apollo将会开放固定车道自动驾驶能力和开放部分的仿真引擎数据;到今年年底,Apollo将开放一系列新的能力,使车辆能够在简单城市路况下,完成自动驾驶任务,同时会开放更多的数据及数据上传的接口;2018、2019、2020年,Apollo会加强开发能力,加速开放速度,直到最后实现完全自动无人驾驶。
陆奇宣布Apollo生态正式诞生,初始合作伙伴超过50个,阵容豪华,包括:
1.13家优秀的中国汽车制造商和两家世界一流的汽车制造商——福特和戴姆勒。
2.世界一流的汽车零部件供应商和和芯片公司、传感器公司、地图公司、云服务公司、创业公司、研究机构。
3.中国众多的城市合作伙伴。
陆奇说:今天的Apollo已经是世界上最强大自动驾驶生态。
Apollo的主战场在中国,它将给中国汽车工业提供最好的创新生态。“我们有信心也有能力,在未来的3-5年内让中国的自动驾驶站在世界前沿。”陆奇说。
Apollo也是世界的。百度今天宣布,已经成立Apollo美国子公司和新加坡子公司。“我们将在美国、新加坡和当地合作伙伴一起发展自动驾驶汽车业务。这将是中国近代史上,第一次用中国的技术来引领一个巨大工业的全球发展。
1.最完整:百度AI平台是由百度大脑和百度智能云组成,这是中国最完整、最全面的AI平台。百度大脑是百度AI平台的核心,智能云是百度AI平台的基础。
2.最开放:百度为开发者提供60种强大的、可组合的AI能力,这个数量远远超过其他平台。包括语音识别,图像识别,人脸识别,视频理解,自然语言处理等,不管是质量和数量都是业界领先的。百度语音识别API年增长 300%,图像识别API月增长 200%。百度PaddlePaddle是国内第一个开源的深度学习计算平台。
3.最前沿:百度将会开放一系列新的AI能力。在百度大脑,将提供远场语音识别、视频理解、增强现实、机器人视觉、自然语言处理平台等;在百度智能云,将提供新的更简单易用的云开发平台。同时,百度为企业客户提供AI-Stack,这是一个具备AI特性的混合云方案。
4.最有活力、最具生命力:百度自己是最大的AI开发者,也是百度AI平台的最大使用者。百度绝大部分应用比如搜索、信息流等都在使用百度AI平台;百度使用AI平台与与合作伙伴开发了一系列的AI解决方案和智能云生态,比如智能客服、智能销售、金融大脑、医疗大脑、教育大脑、出行大脑等等。另外,百度AI平台也在不断的激发有创意的、有深远社会意义的新的场景和应用。例如使用AI寻人,帮助老人找回失落多年的亲人,使用人脸就在机场马上登机等。
这一切应用都会持续推进百度AI平台的发展。最重要的是,百度AI平台的核心技术经过了长期的积累,以及大量用户实际应用的考验,所以最有活力,最有生命力。
一、推出“AI Star计划”。在3年内帮助培养10万名AI工程师人才,通过资金、培训、市场、政策等配套措施,为AI 开发者提供全方位的扶持。
二、举行第13届“百度之星”大赛。“百度之星”在中国科技行业极具影响力,历届大赛参赛学生数累计已超过20万。今年大赛将以 “Create for more (岂止创造)”为主题,在传统的“程序设计大赛”上新增“开发者大赛”,让更多开发者能有机会参与进来,用最强、最好的AI能力来做创新。
三、携手长江产业基金助力开发者成功,成立Apollo基金和DuerOS基金,推动中国AI的发展。
1.NVIDIA方面:百度与之达成的合作领域包括四个方面:在Apollo上合作开发自动驾驶技术,NVIDIA将提供Apollo的参考计算硬件;在PaddlePaddle 深度学习平台上,NVIDIA将专门投入研发团队使PaddlePaddle将来成为中国最强的深度学习平台;在DuerOS 和百度智能云上,NVIDIA做深度的合作为开发者提供更好的GPU支持。
2.英特尔方面:英特尔AI产品集团CTO Amir Khosrowsashi介绍,百度和英特尔已经进行了十年的合作,主要有三个合作方面:百度大脑;百度智能云;DuerOS。双方的合作将让英特尔在中国有更大的发展空间,百度也将得到更好的结果。Amir表示,英特尔非常重视中国的开发者。今天大会的宗旨是为开发者创造,英特尔也是如此。
李彦宏今天乘坐了两辆不同的无人车,从百度大厦到达国家会议中心会场。
第一辆是百度和博世共同打造的一辆SUV,这辆车能够在高速封闭道路上实现自动驾驶。第二辆是在国家会议中心门口换乘的一辆黑色轿车,这辆车除了定位系统,并没有其他的雷达和传感器,可以根据人工驾驶的轨迹,实现在封闭园区规定线路上的自动驾驶。
而这辆黑色轿车,就是Apollo计划第一阶段开放的自动驾驶能力,是Apollo计划的起点,为合作伙伴提供最系统、成熟、门槛最低的方案。这辆车就是前面提到AutonomouStuff的工程师用百度开放的技术花了三天时间改造完成的。
PC互联网时代,开发者都是从头开始做,创造了一个伟大的互联网传奇。
移动互联网时代,技术领域没有太多的创新,对于开发者来说,施展空间并不是很大。
AI时代的到来,让技术创新重新焕发了生机,PC互联网时代的个人英雄主义行不通了。AI时代的创新需要算法和数据的双轮驱动,优秀的算法可以产生越来越多有价值的数据,有价值的数据又会反过来推进算法的进一步提升和改进。这样无限的循环使得过去几年的AI技术不断超越人们的想象。
在古代,人和人之间的沟通是非常低效的,相隔万里的人无法共享成果。今天是一个完全不一样的时代,我们没有必要每个人再“重新发明一遍轮子”。AI大潮到来的时候,我们可以把所有的东西放进“聚宝盆”,只要你去共享、参与,你就能获得更多。AI是通往未来的必由之路,开放会让我们所有人获得更多。
四个开发者的故事,告诉我们世界应该变的更智能
为什么坐飞机,要记着带身份证还要过排队过安检,要各种各样的等待,不能直接刷一下脸就过去呢?我们已经在南阳实现了这一点。为什么机场都应该不能应该像家人一样,认识你、欢迎你?每一次新的电器出现的时候,为什么要拿着长长的说明书研究?为什么家庭遥控器要有那么多的按钮,难以记住它们的功能?这些用AI的力量都可以解决。因为AI,世界会变得更简单。
这,是开发者的黄金岁月,我们坚信开放能创造最好的时代!
评论
查看更多