AutoML是一项技术,客户可以携带数据并离开模型而不必担心训练机器学习模型所涉及的复杂工作流程。它大大简化了基于成熟算法的数据准备,特征工程,模型选择和超参数调整的方法。
基于公共云的ML平台即服务(PaaS)产品(例如Azure ML,IBM Watson Studio和Google Cloud AI)具有AutoML组件。AWS迟迟未将AutoML功能引入其SageMaker平台。自2019年发布SageMaker AutoPilot以来,亚马逊一直在不断改善其托管ML平台的AutoML功能。
通过最近添加的SageMaker JumpStart,AWS现在拥有完整的AutoML功能,涵盖了回归,分类,视觉和自然语言处理领域。
尽管AWS并未正式称呼Amazon SageMaker Autopilot和JumpStart服务AutoML,但它们是Azure AutoML和Google Cloud AutoML的替代产品。
Amazon SageMaker Autopilot针对诸如销售预测,推荐系统,呼叫中心路由和广告优化之类的方案,这些方案依赖于通常存储在CSV文件,关系数据库和NoSQL数据库中的数据集。
基于XGBoost和Linear Learner算法,Autopilot非常适合处理线性回归,逻辑回归以及二元或多元分类问题。通过添加深度学习算法,Autopilot可以处理不可线性分离的复杂数据。
Amazon SageMaker Autopilot的主要与众不同之处在于,自动生成笔记本是AutoML工作流程的一部分。客户只能创建一个Autopilot作业来生成笔记本,而不是运行整个过程。这些笔记本基于在数据科学界流行的标准开源Juypter笔记本。开发人员和数据科学家可以下载笔记本,以了解数据准备工作的完成方式以及为每个候选人构建的单独管道所使用的算法。
在re:Invent 2020上宣布的Amazon SageMaker JumpStart是Amazon SageMaker Studio的最新成员,后者是面向AWS客户的集成ML开发平台。尽管Amazon SageMaker Autopilot处理通常以表格格式存储的结构化数据,但SageMaker JumpStart专注于视觉和NLP域。
Amazon SageMaker JumpStart包含三个组件-开源模型部署,解决方案和基于较小的定制数据集的现有开源模型构建的定制模型。
亚马逊利用TensorFlow和PyTorch提供的官方模型动物园来提供开源模型部署。只需单击一下,即可在SageMaker Studio中提供150多个模型。AWS下载模型,在SageMaker中注册它们,并公开一个端点进行推断。
例如,您可以一键显示ResNet或MobileNet SSD模型以进行图像分类和对象检测。部署模型后,SageMaker会将您指向带有示例代码的Jupyter Notebook,以调用推理端点。
部署使用公共数据集(例如ImageNet或CIFAR-100)训练的现有计算机视觉模型可能对企业不是很有用。他们需要使用与特定业务问题保持一致的自定义数据集进行训练的模型。例如,组织可能需要识别在接待区没有面具的人。没有公开可用的模型可以可靠地检测没有面罩的面部。
责任编辑:lq
-
机器学习
+关注
关注
66文章
8381浏览量
132431 -
数据集
+关注
关注
4文章
1205浏览量
24648 -
自然语言处理
+关注
关注
1文章
614浏览量
13511
发布评论请先 登录
相关推荐
评论