0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习和区块链的结合可创造强大的机器之能

zhKF_jqr_AI 来源:未知 作者:胡薇 2018-04-13 10:57 次阅读

对于区块链人工智能而言,2018年仍是它们风口正劲的一年。在过去的一年中,我们目睹了击败专业围棋选手的AI程序AlphaGo,也见证了区块链在全球范围内的强势发展。那么当我们把区块链和需要大量训练数据的机器学习模型结合在一起后,普通开发者能否打破科技巨头的垄断,创造出真正的AGI呢?

且不论区块链和人工智能行业中存在的泡沫。如果我们能建立一个基于区块链的机器学习市场,那它就结合了两大优势:一是私人化的机器学习,即允许在不透露用户敏感隐私数据的情况下训练模型;二是区块链的激励机制,它会优先选择最佳数据和模型,并使其变得更智能。它们共同作用的结果就是一个开放的市场:任何人都能在里面出售数据,同时保证数据的安全性;而开发者则可以通过激励机制为算法筛选优质数据。

构建这样一个系统是极具挑战性的。虽然一些关键的区块还没有人做出来过,但如果只是构建一个简单的初始版本,这在现在已经不是一件难事。我们现还处于Web 2.0时代,这是个数据都被市场、大公司垄断的时代,也是个不公平的时代。如果我们建立了这样一个市场,那它就能真正开启数据和算法的全面公开竞争,提前让每个人迈入Web 3.0时代。简而言之,在这样的市场中,我们的数据和算法都能被直接货币化。

起源

这个灵感来自2015年查德· 努梅莱的采访对话。Numer.ai是一个向参赛者开放大量加密数据机器学习竞赛平台,被称为金融市场的Kaggle。它也是一家对冲基金,利用数据科学家训练出的模型进行资本运作。把加密后的市场数据分发下去后,Numer.ai会从竞赛中挑选出最好的模型放入“元模型”中,如果“元模型”表现良好(盈利),那相关数据科学家就能从中得到分红。

像这样让数据科学家们参与竞争的方法似乎是一个可行的思路,既然Numer.ai能把原本完全分散的各个模型整合在一起用于对冲基金,那从理论上来说,同样的做法也适用于其他任何领域。

尝试

作为一个示例,我们可以先试着创建一个完全分散的系统,并把它用于用于加密货币零散交易,这事实上也是区块链的一个潜在应用场景。

数据(DATA):数据提供者分类数据,并把它们提供给建模人员。

模型构建(MODELS):建模人员筛选出合适的数据,并创建模型。为了防止数据泄露,系统要保证训练过程的安全性,上图的结构就允许模型在不暴露底层数据的情况下进行训练。模型也被分类。

元模型构建(METAMODELS):元模型的构建需要考虑各模型的分类算法,在这基础上重新整合。——当然,这一步只是个可选项,你也可以不把所有模型都放在一个篮子里。

分配收益/损失:经过一个周期后,我们在加密货币交易中赚取利润/亏损了,这时各模型就要承担利润/损失分成。这不是一个一刀切的过程,有些模型只提供部分积极/消极贡献,而有些模型则全部是积极/消极贡献,系统会考虑这些因素,并依据它们的智能程度进行奖惩。这之后,模型会转向数据提供者,并执行类似的股权分发/削减。

可验证计算:每个步骤的计算可以是集中式的,也可以用安全多方计算。它能不断进行验证。

为什么这个系统如此强大?

它能吸引全球最佳数据。这个系统中最有效的部分在于它吸引数据的激励措施,因为数据往往是大多数机器学习任务的最大限制因素之一。通过开放式的激励机制,比特币在全球范围内吸引了大量算力,同理,一个设计合理的激励机制也能为机器学习模型带来世界上最好的数据。如果还像现在这样去检索上百万个源上的封闭数据,我们什么都做不了。

算法间的竞争。我们现在还无法拥有这种算法、模型之间全面公开竞争的机会,但我们确实需要它们。试想一下,如果Facebook的新闻推送算法不是一家独大,那它还会闹出“数据泄露”的丑闻吗?

奖励透明。在这种机制下,数据提供者和建模人员能看到自己所做贡献的价值,并能亲身参与计算验证,这很有可能会提高他们的参与度。

自动化。元模型构建完成后,它会进入一个行动闭环,这时系统是完全自动的。换句话说,这样的自动化能降低贡献者心中的疑虑。

网络效应。数据提供者和数据科学家之间多面的网络效应能使系统不断进行自我强化。系统表现越好,它吸引的资金就越多,相应的它的潜在支出也就越多——越来越多的数据提供者和数据科学家会争相参与其中,并使系统变得更智能。而更智能的系统又会吸引更多的资本,这就步入了一个良性循环。

安全计算

安全计算允许模型在数据上进行训练而不会泄露数据本身。目前被工业界和学术界广泛使用的安全计算方法主要有以下三种:同态加密(HE)、安全多方计算(MPC)以及零知识证明(ZKPs)。除去各自的特点,这三种方法中又以安全多方计算目前在机器学习数据加密中应用得最广泛,因为同态加密计算过慢,而机器学习又显然不是零知识证明的对标场景。

也正是因为这一点,安全多方计算在计算机科学研究中一直处于前沿位置,它的技术瓶颈在于计算效率太低,但近年来这种情况也在逐渐好转。

终极推荐系统

为了说明个性化机器学习模型的潜力,我们可以想象一个名为“终极推荐系统”的应用程序,它会监控你在设备上执行的所有操作:浏览记录、在各应用中的操作、手机图片、位置数据、消费记录、可穿戴传感器、短信等。它控制着你的所有设备,包括你放在家里的相机,甚至你未来会买的相机。在这些数据基础上,它再向你推荐该访问哪个网站、看哪篇文章、听哪首歌或购买哪件商品

这个推荐系统很高效,比Google、Facebook等其他科技巨头现有的AI推荐算法智能得多,因为它对你本人有非常深刻的了解。但你完全不用担心自己的隐私被泄露了,因为它只从你的数据中学习,而除了它,没有其他的第三者知晓你的情况。以前加密货币交易系统也推出过类似的服务,它通过个人用户在某个在线市场上的访问情况推荐可用加密货币交易的商品,甚至还会因用户贡献数据而给予奖励。

谷歌的federated learning和苹果的differential privacy都是朝个性化机器学习模型迈出的第一步,但他们在赢得用户信任这条路上还任重道远,因为这两家公司都把模型的个性化对象——用户个人排除在了安全性检查、数据存储以外。

当前的区块链和机器学习

对于这一切来说,现在还很早,早到只有很少的人在做相关的工作,而他们中的大多数人都抱着在这块大蛋糕上咬下第一口的想法。

Algorithmia Research曾建立过一个基于区块链的机器学习模型结构,它把元模型的准确率设置为高于某个回测阈值。

由Algorithmia Research创建的机器学习模型的简单构造

而Numer.ai则在这个基础上分三步走:首先对数据加密(不完全使用同态加密),其次是把众包模型结合进元模型中,最后是根据未来表现奖励模型,而不是回测某个具体的目标。数据科学家必须将Numer.ai用做分红指标的加密货币Numeraire看成游戏币,它只会随未来发生的事增多、减少,而不会受已有事实影响(测试时的性能)。但是它的一个缺点是目前只是简单地分发数据,缺乏对数据科学家目标意识的鼓励。

之前Ocean曾做过一个关于数据的区块链市场,但只是个雏形,目前该领域还没有出现非常成功的案例。

还有一些人在探索计算机网络安全领域的区块链应用。如Openmined正在创建一个多方计算网络,用于在Unity之上培训机器学习模型,该网络可以在任何设备上运行,包括家用游戏机。

总而言之,这样一个迷人市场的最终状态会是参与者彼此共享同一个元模型,它按数据提供者、建模人员的智能贡献比例分配所有权。这个模型将被标记化,并随着时间的推移向“股民”分发“股息”,甚至可以被全体“股东”支配。这是一种互相拥有的蜂巢式思维。

启示

综合全文,就基于区块链技术的机器学习市场这个想法,我们可以得到以下几点启示。

首先,分散式机器学习市场可以破除目前科技巨头对数据的垄断。在过去的20年中,这些大型公司利用互联网来创造价值、实现商品化和标准化,并搜集了大量专用数据用于巩固和加强他们的网络效应。这样做的结果就是,价值创造从数据被转移到了算法上。

科技领域的标准化和商品化周期,数据垄断网络时代即将终结

换句话说,他们也为AI创造了一种直接的商业模式:喂数据→训练。

其次,这些公司创造了世界上最强大的AI系统,通过直接的经济激励,最好的数据和模型被他们收入囊中,而他们的实力也通过网络效应的良性循环进一步增强。随着Web 2.0时代的到来,大公司的作为使数据垄断实现了商品化,而这似乎又成了突破这种垄断局面的新切入口。虽然几年内数据领域的局面不会有太大变化,但这看起来是个正确的方向。

第三,正如之前提到的“终极推荐系统”,我们现有的搜索推荐算法的出发点是完全颠倒的。大公司是为了增加产品竞争力而制定个性化推荐,而不是出于用户需要,专门开发真正精准的推荐算法。这就带来了另一个机遇,就是每个人都可以拓展个人市场,挖掘完全自定义的数据,并把它们放进自己的模型中。

第四,Google和Facebook等公司通过机器学习开发了大量受欢迎的应用,有了这样一个市场,我们可以实现在不泄露个人隐私的前提下获得同样好,甚至更好的技术体验。

第五,机器学习研究可以更快地推进,因为任何工程师都可以访问开放的数据市场,而不仅仅是大型Web 2.0公司的一小部分工程师。

挑战

虽然愿景很美,但在通往Web 3.0的路上,我们还要面对很多挑战。首先一个技术上的重要难题就是安全计算方法的效率还是太低了,这大大拉高了机器学习的计算成本。

我们在文章中多次提到把模型结合进元模型。对于单个模型而言,为它找一组特定的测试集是很容易的,但我们不能把同样的做法生搬硬套到元模型上,因为涉及复杂的分类算法,目前要实现这一点还很难。

虽然市场能解决数据问题,但这些数据的清理工作和格式化工作还是十分繁琐的。我们现在有不少自动化工具,一些小企业也愿意接众包的活,但这还是太复杂了。

最后就是最讽刺的一点,我们花一整篇文章讲述了如何构建一个广义上的商业模式,但一旦涉及实际落地,可能它还不如直接开一个数据市场来得简单有效。而其中的加密手段也无非就是市场管理层面的工作。

结论

总而言之,个性化机器学习和区块链的结合可以在各种应用中创造更强大的机器之能。随着时间的推移,它甚至还能解决重大的技术挑战。它的潜力是巨大的,它的价值观也是符合用户需要的。但它们又是可怕的——它们引导自我存在、自我强化,消费私人数据,并且几乎不可能关闭——这也是现在加密货币缓慢渗透每一个行业所带来的警示。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47244

    浏览量

    238376
  • 机器学习
    +关注

    关注

    66

    文章

    8414

    浏览量

    132612
  • 区块链
    +关注

    关注

    111

    文章

    15562

    浏览量

    105985

原文标题:基于区块链的机器学习市场

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 74次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    和经验积累,使机器人能够自主发现工艺规律,优化作业参数。家庭服务机器人则采用混合任务规划策略:将预训练的基础技能与实时规划相结合,灵活应对开放环境中的各种情况。 第9章深入探讨了元学习
    发表于 12-24 15:03

    【「具身智能机器人系统」阅读体验】+初品的体验

    学习资源,以培养更多的专业人才。随着具身智能机器人技术对社会的影响越来越大,该书还可以向公众普及相关的知识,以提升社会对新技术的认知和接受度,从而为技术的发展创造良好的社会环境。 随着具身智能
    发表于 12-20 19:17

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 396次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 450次阅读

    使用机器学习和NVIDIA Jetson边缘AI和机器人平台打造机器人导盲犬

    Selin Alara Ornek 是一名富有远见的高中生。她使用机器学习和 NVIDIA Jetson 边缘 AI 和机器人平台,为视障人士打造了机器人导盲犬。 该项目名为 I
    的头像 发表于 11-08 10:05 395次阅读

    LIBS结合机器学习算法的江西名优春茶采收期鉴别

    以庐山云雾茶和狗牯脑茶的明前茶、雨前茶为对象,研究激光诱导击穿光谱结合机器学习的茶叶鉴别方法。将茶叶茶,水数据融合可有效鉴别春茶采收期,且数据融合后表现出更好的稳定性和鲁棒性,LIBS结合
    的头像 发表于 10-22 18:05 246次阅读
    LIBS<b class='flag-5'>结合</b><b class='flag-5'>机器</b><b class='flag-5'>学习</b>算法的江西名优春茶采收期鉴别

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    Al大模型机器

    和迭代来不断改进自身性能。它们可以从用户交互中学习并根据反馈进行调整,以提高对话质量和准确性。定制性与整合性: AI大模型机器人可以根据特定需求进行定制和整合,以满足不同场景和应用的要求。它们可以与其
    发表于 07-05 08:52

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入
    的头像 发表于 07-02 11:22 619次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1353次阅读

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    我的项目使用 POSC62 MCU 进行开发,由于 UDB 模块是需求的重要组成部分,所以我选择了PSoC™ Creator IDE 来进行项目开发。 但现在,由于需要扩展,我不得不使用机器学习模块
    发表于 05-20 08:06

    机器学习怎么进入人工智能

    人工智能(Artificial Intelligence,AI)是一门涉及计算机、工程、数学、哲学和认知科学等多个领域的交叉学科,旨在构建智能化计算机系统,使之能够自主感知、理解、学习和决策。如今
    的头像 发表于 04-04 08:41 311次阅读

    四足机器人ANYmal展新技能:跑酷

     该团队通过将机器学习与基于模型的控制相结合,升级了ANYmal的算法,使之能够精确感知并跨越碎石堆中的缝隙/凹坑,从而敏捷地在各种复杂地形间穿行游刃有余。
    的头像 发表于 03-14 14:26 429次阅读

    基于MCX微控制器的机器学习解决方案

    随着人工智能(AI)技术的发展,如何在MCU上实现机器学习创造更多边缘AI的新用例,一直是嵌入式开发社区的热点话题。
    的头像 发表于 01-05 09:18 752次阅读
    基于MCX微控制器的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>解决方案