0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据已逐渐成为了机器学习竞争中最关键的区分点

电子工程师 来源:lq 2019-01-08 11:49 次阅读

人工智能的三大发展要素已经是老生常谈了。算法、算力和数据对机器学习的重要性和声望不亚于“谦哥”的喝酒、烫头和抽烟。

那些热衷竞争实施机器学习的公司现在惊讶地发现,其实,实施一些算法使机器变得对某一数据或问题更加智能并不困难。毕竟,这年头“即插即用”又很稳健的算法编程解决方案简直“烂大街了”。例如,从开源机器学习框架谷歌TensorFlow,到微软Azure Machine Learning以及亚马逊SageMaker,应有尽有。

所以,数据已逐渐成为了机器学习竞争中最关键的区分点。一个原因是高质量数据并不常见;另一原因是数据尚未商品化,公司企业之间存在着信息不对称。

希望借助AI一臂之力的企业需要寻求外部数据源,甚至这样的数据甚至可能需要他们自己创建。

有用的数据:有价值、又很稀少

数据逐渐变成竞争中的区分点是因为许多公司根本没有他们需要的数据。尽管几十年来,公司都在使用通用的会计准则这样的系统化方法来评估自己,但是这种评估方法一直关注于实体资产与金融资产,也就是实物和钱。2013年甚至给资产定价理论颁了一个诺贝尔奖,强化了已有的对实体或金融资产重要性的认知。

但是,今天最有价值的那些公司贸易对象是软件或网络,而不仅仅是实体或金融资产。在过去的40年内,资产类型的重心有了很大的变化:1975年,83%的有形资产占整个市场绝大部分份额;而2015年时市场中84%的资产是无形资产。今天的公司巨头们不再生产咖啡壶也不再售卖洗衣机,他们转而提供应用程序,软件等等。这样的转变造成了会计记账的对象和实际产生价值的对象极其不匹配。

结果就是有用数据的缺少已经成为了一个问题。市面价值与账面价值的差别越来越大。公司们正在试图利用机器学习辅助重要的商业决策来改善这一差别。有时,机器学习甚至会取代一些昂贵的咨询顾问们,而最后他们经常会意识到算法所需的数据压根不存在。所以实际上,那些闪瞎人眼的先进AI系统最后依旧只是在同样老旧的数据上试图实施新技术。

和人类一样,除非有人教,机器学习系统并不会精通任何领域。不过比起人类,机器会需要更多的信息来进行学习,并且它们确实比人类读取数据的速度更快。因此,表面上公司间会互相竞争谁拥有更好的机器学习程序员以及谁先启动AI项目,在幕后其实是对于数据新颖度和广泛度的竞争。

比如说在金融领域,可供选择的数据来源远远超过了传统证券交易报告以及投资者展示等。数据还可以来源于社交网络情感分析或者获批专利数量等。

这些数据源的重要性主要基于两点原因。首先,传统数据局限于传统资产,在当今无形资产当道的时代,覆盖面上远远不够。第二,并没有任何必要在市场上所有人都在分析的数据上使用机器学习方法。所有对此感兴趣的人都早已经尝试过分析产业趋势、利润率、增长率、息税前利润、资产周转率以及资产回报率和其它上千个常见的变量与股东回报率之间的相关性。

在所有人都在分析的数据上试图发现相关性并不会帮助公司取胜。相反,希望使用AI取胜的公司需要寻找新数据集之间的联系,因此他们可能必须自己创建那些新数据集来评估无形资产。

谨慎思考:你想知道什么?

创建数据比仅仅把销售点与顾客信息两个表聚合到一起然后丢进数据库复杂得多。大多数企业错误地相信通过这样一种权宜的方法能够预测或区分出他们关心的信息:把所有能找到的数据都大费周章地聚合到一起然后指望能够找到一丝希望之光。

尽管机器学习有时会突然发现某些从未有人意识到的事物从而使所有人都大吃一惊,但它并不能够持续稳定提供这样的洞察。这并不意味着这项工具很垃圾,这意味着我们需要更明智地使用它。但说起来容易做起来难:比如,在我们研究外部数据市场时,我们发现大多数新数据提供者依旧在关注实体与金融资产。

许多企业遗漏的一步是提出一项真正重要的假设。机器学习真正体现优越性之处在于,它们能够通过采用人类已经拥有的见解,这可以来自于经验法则、广泛认知或者几乎完全不被理解的相关性,来建设一种速度更快、更易于理解、更易于扩展且更低错误率的方法。

为了这样使用机器学习方法,不应向系统塞进任何你能找到的数据。你仅仅输入被谨慎思考过的一组信息,希望它能够学习并拓展,得到比人类掌握的更多的信息。

有意义的机器学习来自于不同的数据

以下是为希望搭建有影响力、有价值的机器学习应用的公司提出的三点建议:

1.成功的AI在于与众不同的数据。在你的竞争对手都已经掌握的数据上你是得不出什么新颖信息的。审视企业内部,找出只有你们知道并理解的信息并以此创建一个独特的数据集。机器学习算法确实需要大量的数据支持,但这并不意味着模型需要考虑大量变量。你应当把关注点放在企业已经具有独特之处的数据上。

2.有意义的数据比全面的数据好。你可能就某问题上拥有大量详尽数据,但它们可能压根没什么用。如果你的公司根本不会在决策过程中随时使用这些信息,那这样的数据八成对机器学习也没有什么价值。专业的机器学习工程师会询问许多困难的问题来找出什么才是真正重要的领域,以及那些领域将如何对该应用程序输出结果产生影响。如果这些问题对你太难了,那么你并没有为得到实际价值而仔细思考。

3.应当从你已知的信息出发。最善于利用机器学习的公司会从一个独特的视角出发,来找到与他们重要决策最为相关的因素。这将会指导他们去收集何种数据以及使用何种技术。就基于你们团队已经拥有的一部分知识之上进行拓展这个问题来着手是比较简单的,这也将为你企业创造更多价值。

很明显这个时代已经是“软件吃掉了整个世界”了(这个形容来源于软件工程师Marc Andreessen)。但它们依然很饥饿!软件们需要一份包含崭新数据与科技的食谱来持续创造价值。

没有人希望落后于这样的洞察、机器与外部数据的转变。那么,请从内部审视企业开始,去发掘你独特的见解以及你可以而且应该得到的有价值的外部数据来源。通过这些步骤,你才能够发现保持企业竞争力的相关洞见。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4622

    浏览量

    93057
  • AI
    AI
    +关注

    关注

    87

    文章

    31133

    浏览量

    269470
  • 机器学习
    +关注

    关注

    66

    文章

    8425

    浏览量

    132771

原文标题:业界 | 机器学习竞争其实是一场数据上的竞争

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    在屏幕上如何区分点击了哪个带有clicklistener的自定义容器呢

    我有一个带有 clicklistener 的自定义容器,我在屏幕上添加了两个。如何区分点击了哪个自定义容器?void CustomContainer::boxClickHandler(const
    发表于 12-19 06:27

    多层陶瓷载板逐渐成为多晶封装主流

    多层陶瓷载板逐渐成为多晶封装主流陶瓷载板出现之前,提到载板,往往都认为是树脂材质的印刷载板,近几年印刷载板用的树脂也持续出现改善,已经从传统的低成本、易加
    发表于 10-04 09:36 19次下载

    无线Mesh逐渐成为智能电网无线通信主流

    通信设备需要在更加苛刻的环境下稳定运行等,这些要求促使无线Mesh逐渐成为智能电网中无线通信系统的主流技术。
    发表于 02-25 10:27 1342次阅读
    无线Mesh<b class='flag-5'>逐渐成为</b>智能电网无线通信主流

    如何区分深度学习机器学习

    深度学习与传统的机器学习最主要的区别在于随着数据规模的增加其性能也不断增长。当数据很少时,深度学习
    发表于 10-27 16:50 1964次阅读
    如何<b class='flag-5'>区分</b>深度<b class='flag-5'>学习</b>与<b class='flag-5'>机器</b><b class='flag-5'>学习</b>

    视觉导航方案正在逐渐成为不可或缺的辅助方案

    机器人导航技术逐渐成熟,在大型商用机器人领域,虽然主流方案商都是采用激光雷达导航方案为主,但是视觉导航方案也逐渐成为不可或缺的辅助方案。
    的头像 发表于 04-18 11:45 4779次阅读

    机器学习集成与机器视觉 成为工业4.0关键基础

    集成了机器学习机器视觉的系统可应用在多个制造业范畴,机器视觉透过传感器搜集数据机器
    发表于 07-11 10:50 1576次阅读

    三相无刷舵机将会逐渐成为发展主流

    人形机器人正在带动机器人舵机的发展,至去年以来,机器人舵机是越做越小,对技术的要求越来越高,最新的趋势是三相无刷舵机将会逐渐成为发展主流,它的寿命将是有刷电机的三倍以上,而且工作效率更
    的头像 发表于 11-22 09:59 6054次阅读

    为什么说机器学习竞争是一场数据上的竞争

    数据逐渐变成竞争中的区分点是因为许多公司根本没有他们需要的数据
    的头像 发表于 02-05 08:48 1359次阅读

    随着人们对人工智能的热度不断上升 AI+逐渐成为全球关注的热点

    2019年的美国消费电子展(CES)在1月8日开幕,超过18万名人齐聚拉斯维加斯参加,全球科技再次进入大众的视野中。近几年来人们对人工智能和机器学习的热度不断上升,本次CES展会的11个场馆均从不同方面展示了AI的各种实现方法,AI+也
    发表于 01-13 08:51 3634次阅读
    随着人们对人工智能的热度不断上升 AI+<b class='flag-5'>逐渐成为</b>全球关注的热点

    AI芯片攻坚战已然打响 深度学习技术逐渐成为主流

    近年来,随着人工智能和大数据产业的发展,数据量呈现爆炸性增长的态势。深度学习技术因其识别精度高、适应性强、可灵活部署等方面的优势,逐渐成为人工智能的主流技术。
    发表于 12-05 14:53 753次阅读

    AI和机器学习关键的环节:必不可少的物联网

    人工智能和机器学习正彻底变革着我们周围的一切事物,成为如今最炙手可热的话题。但作为其中最关键的一环,物联网(IoT)却常常被人们忽略。
    的头像 发表于 07-06 09:46 2178次阅读

    科技技术热潮下,慢病管理逐渐成为互联网医疗行业的主流方向

    随着民众健康需求不断提升,慢病管理逐渐成为互联网医疗行业的主流方向。
    的头像 发表于 09-07 11:38 2334次阅读
    科技技术热潮下,慢病管理<b class='flag-5'>已</b><b class='flag-5'>逐渐成为</b>互联网医疗行业的主流方向

    新能源车领域布局锋芒显露,新能源汽车逐渐成为主角

    在各大车展上,新能源汽车逐渐成为“主角”,特别是跨国车企,在新能源车领域的布局锋芒现。据悉,本次广东车展,跨国车企参展的新能源车数量上升至60台,在本次展出的新能源车总数中占比超42%。
    发表于 11-24 10:03 1830次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它
    的头像 发表于 11-16 01:07 447次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生
    的头像 发表于 12-25 11:54 124次阅读