您好,欢迎来电子发烧友网! ,新用户?[免费注册]

您的位置:电子发烧友网>源码下载>数值算法/人工智能>

云机器学习服务精彩回顾

大小:0.3 MB 人气: 2017-09-30 需要积分:1

  Amazon,Microsoft,Databricks,Google,HPE和IBM的机器学习工具在广度、深度及易用性上都具备优势。

  

  图源:Shutterstock

  机器学习具有多种形式,其中最纯粹的一种可以为分析师提供一组数据探索工具、ML模型选择、稳健的解决方案以及将此方案用于预测的使用方法。

  Amazon,Microsoft,Databricks,Google和IBM的云服务都提供预测API,来进行多重管控。HPE Haven OnDemand还提供了一个有限的预测API,用于解决二元分类问题。

  然而,并不是所有的机器学习问题都必须从头开始解决。有些问题可以用在一个足够大的样本中,通过训练使其广泛适用。例如,“canned”方案就能够有效解决语音识别、语音合成、文本分析及人脸识别中存在的问题。不用惊奇,许多云机器学习提供商都会利用一个API,让开发者在应用程序内能实现这些功能。

  这些功能可以识别美式英语口语(和其他一些语言)并将其转录。但对于给定的说话者而言,给定的服务能否奏效将取决于他的方言和口音,以及该服务在类似方言和口音上的受训程度。Microsoft Azure,IBM,Google和Haven On Demand都启动了语音识别服务。

  机器学习也存在多种问题。例如,回归问题试图从观察结果中预测一个连续变量(例如销售情况),分类问题试图通过一组给定的观测值预测种类(例如垃圾邮件)。但是仍然有一些相对完整的工具包,像Amazon,Microsoft,Databricks,Google,HPE和IBM所提供的工具,就可以用来解决一系列的机器学习问题。

  本文将简要地介绍六个商业机器学习方案,还会贴出五个完整实验结果。不幸的是,Google三月份所宣布的——基于云计算的机器学习工具和应用程序,还没能使Google Cloud Machine Learning达到公共可用的程度。

  Amazon Machine Learning

  Amazon一直致力于研究大众化的机器学习平台,用来服务那些熟悉业务问题的分析人员,无论他们是否理解数据科学或机器学习算法

  一般来说,要使用Amazon Machine Learning需要经过三个步骤:首先,在S3中清理和上传CSV格式数据;然后,创建、训练和评估ML模型;最后,创建批处理或实时预测。每一步都是迭代的,在整个过程中也同样如此。所以机器学习并不是一个简单、静态的万能药,即使Amazon已经实现了算法优选。

  Amazon Machine Learning支持三种模型:二元分类、多级分类和回归——一个算法适用一种类型。为了优化,Amazon Machine Learning使用SGD(Stochastic Gradient Descent),将多个连续的训练数据进行传递,并更新功能权重使之成为小批量格式,让损失函数最小化。损失函数反映了实际值和预测值之间的区别,而且梯度下降优化方法只适用于连续、可微的损失函数,例如物流损失函数和平方损失函数。

  Amazon Machine Learning将逻辑回归(物流损失函数+SGD)用于二元分类。

  Amazon Machine Learning将多项逻辑回归(多项物流损失函数+SGD)用于多级分类。

  Amazon Machine Learning将线性回归(平方损失函数+SGD)用于回归。

  云机器学习服务精彩回顾

  在使用Amazon Machine Learning训练和评估二元分类模型后,可以选择分数阈值来实现想要的错误率。这里在默认0.5的阈值上有所增加,就可以生成一套更强的引线,有利于更快达到营销和销售目的。

  Amazon Machine Learning决定了机器学习是任务解决型而不是目标数据型。例如,预测数值目标变量的问题,意味着回归;预测非数字目标变量的问题时,如果只有两个目标就是二元分类,如果有两个以上则是多级分类。

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

      发表评论

      用户评论
      评价:好评中评差评

      发表评论,获取积分! 请遵守相关规定!