近年来,人工智能技术(AI)一直是各行各业的讨论焦点,与物联网、分布式数据库、5G、自然语言处理等等热词一同涌现在时代的浪潮前沿。然而,当各行各业关注于这些时代热词,探索研发新的AI场景时,却常常忽视了最成熟也很重要的AI技术——知识图谱。
或许你说不出知识图谱的具体定义,但其实处于信息时代的我们早已离不开它。当你打开百度,搜索某个字怎么念,或者今年高考的高校录取分数线,其结果的联想就来自于知识图谱的构建;当你打开淘宝或者今日头条,其中按照你的兴趣爱好定制的个性化推荐内容,背后也是知识图谱在发挥作用……
而现在,互联网巨头们重新认识到在数据之上的知识的重要,纷纷在知识图谱上暗暗较劲。
在百度新春内部演讲中,李彦宏说,“知识图谱(包括需求图谱、用户画像等等),这些东西都是百度整个人工智能当中非常基础的构件,也是我们相对于其他任何一家公司的优势所在。”在AI World 世界人工智能大会上,百度副总裁、AI技术平台体系(AIG)总负责人王海峰也避开万众瞩目的众多热词,将重心聚焦于知识图谱上。
除了百度,谷歌、阿里、华为等玩家也在积极部署知识图谱。谷歌将语音搜索、Google Assistant、Google Lens、Google Home诸多软硬件产品均接入谷歌知识图谱,以构建更大的知识网络,阿里也利用自己的电商优势捕获海量数据形成更有效的用户画像并入自己的知识网络,并联合清华大学、中科院等机构组建高级知识图谱研究团队……
那究竟知识图谱是什么?它又与人工智能有着怎样的联系呢?
中文知识图谱(Chinese Knowledge Graph) ,最早起源于Google Knowledge Graph。Knowledge Graph是在2012年由谷歌提出的,用于增强其搜索引擎功能的知识库。
知识图谱本质上是一种语义网络。其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。知识图谱是一种结构化的语义知识库,其基本组成单位是“实体-关系-实体”的三元组,以及实体及其相关属性-值对,通过实体间的关系构成网状的知识结构,每一个节点均为实体,实体具有属性-值对,同时实体与实体之间通过关系相互连接,构成一个特定领域的知识网络。
简而言之,知识图谱就是通过不同知识的关联性而形成的网状的知识结构。形成知识图谱的过程实际上就是加工信息、建立认知、理解所应用的领域的过程。人类证实因为有了获取知识、形成知识的能力才可以不断进步;同样,知识是人工智能的基石,知识图谱对于人工智能的价值也正是在于它可以让机器具备认知能力。
另外,知识对于AI的价值,王海峰的总结是,两者结合可以正循环:“有了知识的人工智能会变得更强大,可以做更多的事情。反过来,因为更强大的人工智能,可以帮我们更好地从客观世界中去挖掘、获取和沉淀知识,这些知识和人工智能系统形成正循环,两者共同进步。”
更具体而言,知识图谱可以说是AI应用行业的先决条件。目前,人工智能已受到各行各业的关注,不只是BAT在战略投资人工智能,金融、汽车、零售、娱乐、制造等等行业都在积极拥抱人工智能技术。然而,人工智能要在行业中得到应用,首先必须要对行业建立起认知,只有真正理解了行业和场景,才能实现智能化。也就是说,只有建立了行业知识图谱,才能给出行业AI方案。
例如在金融行业。众所周知,金融是百度最先商用的AI场景,正如李彦宏曾说:“金融的数据化本质,加上业务规则清晰,使它成为人工智能最佳的应用场景。”金融的知识相对垂直,因此也非常适合与知识图谱技术结合。在五年前,百度就已将知识图谱应用在股票领域,旗下产品股市通通过数据、信息与股票的关系,以及股票与股票之间的关系,在股票领域首创知识图谱,实现智能选股。不只是百度金融(现度小满)在应用知识图谱,整个金融行业都在将知识图谱应用在个人征信、贷款风控、保险销售、保险策划、金融指数、反欺诈、客户管理管理、智能客服等领域,出现了不少提供金融AI技术或者是金融知识图谱服务的创业公司,百度金融(现度小满)也一直在积极地推进智能金融科技的开放,包括金融知识图谱的开放。
除了金融领域,咨询也是知识图谱应用的典型场景。
随着内容创作进入自媒体时代,目前内容分发信息流日益流行,而信息流的基础就是个性化推荐技术。要做好个性化推荐技术只需做好两点:一个是理解用户的阅读兴趣;另一个是理解资讯内容。然而两点要做到都不容易,理解用户的前提是足够多的用户兴趣数据,理解内容的前提则是知识图谱,平台必须要有一定的“认知”才知道不同内容意味着什么,适合哪些兴趣的用户,而不是简单的关键词匹配。
举个例子,一个文章内容是马云最新演讲解读,是将其推荐给电商行业人士,还是希望获得成功的年轻人,还是李彦宏等企业家们?每个人都可能感兴趣,如何推荐就要结合对内容的认知,以及对用户兴趣以及当前场景的理解,这时知识图谱就派上用场了。特别是在视频领域,要理解内容不是靠文字识别,而是要靠机器视觉技术,对内容本身的理解难度更高,知识图谱在这时则显得更为重要。
现在,今日头条、百度、一点资讯、搜狐、网易、企鹅、UC、微博等等都在做信息流。百度世界大会上宣布百度信息流月活超过6亿,相比去年5月刚推出时日均阅读量提升105倍,短视频日均播放量提升169倍,这个成果,与知识图谱的优势密不可分。
王海峰在演讲中也指出,“人工智能与传统产业融合的过程中,要想为这个行业提供更好的服务,就需要对这个行业进行定制化,要有行业知识,这时候就需要在通用知识图谱的基础上,有相应的行业知识图谱,进而帮助这个行业提升生产力,帮助这些行业、产业升级。”
从王海峰的逻辑,我们窥见一条未来人工智能走向应用的必经之路:
机器通过人工智能技术与用户的互动,从中获取数据、优化算法,更重要的是构建和完善知识图谱,认知和理解世界,进而服务于这个世界,让人类的生活更加美好。
-
人工智能
+关注
关注
1791文章
46882浏览量
237633 -
自然语言处理
+关注
关注
1文章
614浏览量
13511 -
知识图谱
+关注
关注
2文章
132浏览量
7696
发布评论请先 登录
相关推荐
评论