0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种工具将AutoML方法的分析和控制权给到用户手中

DPVg_AI_era 来源:lq 2019-06-23 09:59 次阅读

MIT、香港科技大学和浙江大学的研究人员开发了一种交互式工具,首次实现让用户对自动化机器学习(AutoML)系统的工作方式和流程进行查看和控制,提高系统定制化程度,向打开机器学习“黑盒子”的目标迈进了一大步。

为特定任务设计机器学习模型(如图像分类,疾病诊断和股市预测等)是一个艰巨而耗时的过程。研究人员首先要从多种不同的算法中进行选择来构建模型。然后在模型开始训练之前,手动调整“超参数”,确定模型的整体结构。

近期出现的自动机器学习(AutoML)系统可以对算法和超参数进行迭代式的测试和修改,并在此过程中选择最适合的模型。但系统的运行机制是不透明的,相当于一个“黑盒子”,也就是说系统选择了什么技术、什么模型,用户是看不见的。因此,用户就可能不信任模型给出的结果,而且很难根据自己的搜索需求来对系统进行定制。

定制化AutoML工具:模型自选,超参数自调

近日,在ACM CHI计算系统中人的因素会议上,麻省理工学院,香港科技大学和浙江大学的研究人员共同研发出一种工具,将AutoML方法的分析和控制权给到用户手中。

该工具名为ATMSeer,它将AutoML系统、数据集和有关用户任务的一些信息作为输入,然后在用户友好型的界面内实现可视化搜索过程,界面中还能提供更多关于模型性能的深入信息。

“使用ATMSeer,用户可以自己选择和观察AutoML系统是如何工作的,”该研究论文的共同作者之一Kalyan Veeramachaneni说道,他是麻省理工学院信息与决策系统实验室(LIDS)的首席研究科学家,负责将数据引入AI团队。 “用户可以只选择一些性能最好的模型,或者结合其他因素或某些领域的专业知识,来指导AutoML系统去搜索某些特定模型。”

在对AutoML新手的案例研究中,研究人员发现大约85%使用ATMSeer的人对系统选择的模型充满信心。几乎所有参与者都表示,该工具让使用AutoML系统变得更舒服了。

ATMSeer会生成一个用户友好的界面,显示有关所选模型性能的深入信息,以及可调整的算法和参数的选项。

ATMSeer自动机器学习定制化工具的用户友好型交互界面

“数据可视化是实现人与机器之间更好协作的有效方法。ATMSeer体现了这一理念,”论文合作者之一、香港科技大学的Wang Qianwen说。 “ATMSeer主要会让机器学习从业者受益,无论他们从事什么领域,专业水平如何,都能获益。ATMSeer可以缓解手动选择机器学习算法和调整超参数的不便。”

便捷可视化工具实现“可视即可调”

ATMSeer工具的核心是一款定制的AutoML系统,名为“自动调整模型”(ATM),由Veeramachaneni等研究人员在2017年开发。与传统的AutoML系统不同的是,ATM在尝试拟合模型时会对所有搜索结果进行完整的编目。

ATM将任何数据集和编码预测任务作为输入。系统随机选择算法类别,比如神经网络,决策树、随机森林和逻辑回归,并选择模型的超参数,如决策树的大小或神经网络层数等。

然后,系统针对数据集运行模型,迭代式调整超参数,并衡量模型性能。ATM利用掌握到了模型性能来选择另一个模型。最后,由系统针对任务输出几个表现最理想的模型。

诀窍在于,每个模型基本上可以被视为带有一系列变量的数据点:这里说的变量包含算法,超参数和性能。在此基础上,研究人员设计了一套系统,在指定的图形和图表上绘制数据点和变量。以此为起点,开发了一系列新技术,能够实时重新配置数据。 “亮点在于,使用这些工具,你能够可视化的任何东西,都可以修改。”史密斯说。

类似的可视化工具专门用于分析一种特定的机器学习模型,并能够在有限的搜索空间内实现定制化。“因此,这些工具可以为分析和观察AutoML的运行流程提供了有限的支持,还需要对许多搜索模型的配置进行分析。相比之下,ATMSeer支持分析使用各种算法生成的机器学习模型。”

将AutoML控制权交给用户,使用体验和信心明显提升

ATMSeer的可视化界面由三部分组成。用户可以通过控制面板上传数据集和AutoML系统,并启动或暂停搜索过程。下图是一个概览面板,显示了基本统计数据,如搜索的算法和超参数的数量,还有按降序排列的最佳模型的“排行榜”。Veeramachaneni表示:“如果你不是特别在意技术细节的专家,这可能是你最感兴趣的点。”

ATMSeer包含一个“AutoML Profiler”,其中的面板包含有关算法和超参数的深入信息,这些信息都可以进行调整。面板可以将所有算法类别表示为直方图形式,用条形图显示算法性能分数的分布,范围为0到10,具体取决于其超参数。用一个单独的面板呈现散点图,显示不同超参数和算法类型的性能折衷。

对没有AutoML经验的机器学习专家的案例研究表明,让用户掌握控制权确实有助于提高AutoML应用的性能和效率。对生物学、金融等不同科学领域的13位研究生的研究也表明,确定用户对AutoML的搜索的自定义关键有三点:搜索的算法数量、系统运行时间以及查找表现最好的模型。研究人员表示,这些信息可用来为用户量身定制系统。

研究人员表示,目前对AutoML的应用缺乏足够的灵活性。“现在所有这些信息都集中在一个地方,如果人们能够清楚看到幕后发生的事情,有能力控制这些流程,未来对AutoML的应用将跨入一个崭新的阶段。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 可视化
    +关注

    关注

    1

    文章

    1171

    浏览量

    20871
  • 机器学习
    +关注

    关注

    66

    文章

    8366

    浏览量

    132343

原文标题:MIT、浙大等打造AutoML可视化工具:模型自选、超参数自调

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一种简单高效配置FPGA的方法

    本文描述了一种简单高效配置FPGA的方法,该方法利用微处理器从串行外围接口(SPI)闪存配置FPGA设备。这种方法减少了硬件组件、板空间和成本。
    的头像 发表于 10-24 14:57 302次阅读
    <b class='flag-5'>一种</b>简单高效配置FPGA的<b class='flag-5'>方法</b>

    SensiML开源AutoML解决方案-Piccolo AI发布

    SensiML强大的Analytics Studio软件开发工具的开源版本-Piccolo AI发布了!Piccolo AI遵循AGPL许可,面向个人开发者、研究人员和AI爱好者,旨在AutoML
    的头像 发表于 07-22 16:53 711次阅读

    rup是一种什么模型

    的起源可以追溯20世纪90年代初,当时Rational Software公司开始开发一种新的软件开发方法。这种方法的目标
    的头像 发表于 07-09 10:13 1130次阅读

    数据采集方法有哪些?工具有哪些?

    数据采集是数据分析和数据科学的基础,它涉及从各种来源收集、整理和存储数据的过程。以下是些常见的数据采集方法工具,以及它们的特点和应用场
    的头像 发表于 07-01 15:35 1156次阅读

    功率分析仪的使用方法和注意事项

    功率分析仪是一种用于测量电能参数的专业仪器,广泛应用于电力系统、电力设备测试、能效评估等领域。它通过对高精度电压、电流信号的采集,得到高精度的功率等相关数值,为工程师和技术人员提供了强大的测量和分析
    的头像 发表于 05-11 16:09 2074次阅读

    一种用于微液滴中单细胞无标记分析的液滴筛选(LSDS)方法

    基于液滴的单细胞分析一种非常强大的工具,可用于以单细胞分辨率研究表型和基因组异质性,从而解决各种生物问题。
    的头像 发表于 03-26 11:17 486次阅读
    <b class='flag-5'>一种</b>用于微液滴中单细胞无标记<b class='flag-5'>分析</b>的液滴筛选(LSDS)<b class='flag-5'>方法</b>

    放大电路有哪三基本分析方法?举例说明

    放大电路是电子电路的重要组成部分,它起到放大信号的作用。在设计和分析放大电路时,有三基本的分析方法:传输特性分析、小信号
    的头像 发表于 02-25 15:56 2519次阅读

    gis中常用的空间分析方法

    详细介绍GIS中常用的空间分析方法,包括空间插值、缓冲区分析、空间统计、领域分析、网络分析和多
    的头像 发表于 02-25 13:44 4910次阅读

    mapgis如何区属性赋值

    MapGIS是款功能强大的地理信息系统软件,它提供了丰富的功能和工具,使用户能够对地理数据进行快速、高效的管理和分析。其中个重要的功能就
    的头像 发表于 02-23 17:49 2018次阅读

    主导 AI,马斯克寻求更大控制权;应对法案,苹果拆分 App Store 谋生存

    ,以及这些变革如何塑造我们的未来世界。 马斯克欲掌控特斯拉 AI 的未来,要 25% 投票 特斯拉 CEO 埃隆·马斯克近日表示,如果不能达到至少 25% 的投票控制权,他可能会在特斯拉之外开发 AI 产品。作为特斯拉最大单
    的头像 发表于 01-16 20:55 783次阅读
    主导 AI,马斯克寻求更大<b class='flag-5'>控制权</b>;应对法案,苹果拆分 App Store 谋生存

    一种扩展Spring控制反转的绝妙方法

    类型等于JSON,我就用JSON解析器,那如果新加个类型的解析器,是不是调用的客户端还要修改呢?这显然太耦合了,本文就介绍一种方法,服务定位模式Service Locator Pattern来解决,它帮助我们消除紧耦合实现及其依赖性,并提出
    的头像 发表于 01-10 09:41 393次阅读

    常用的远程控制软件介绍

    远程控制软件是一种能够让用户从远处获得本地控制权的软件。它可以让用户只需要使用台主机就可以
    的头像 发表于 12-13 10:45 2144次阅读
    常用的远程<b class='flag-5'>控制</b>软件介绍

    一种产生激光脉冲新方法

    等离子体中脉冲压缩的概念 英国和韩国的科学家提出了一种产生激光脉冲的新方法,其功率是现有激光脉冲的1000多倍。 科学家们使用计算机模拟联合研究,展示了一种压缩光的新方法,以充分提高光
    的头像 发表于 12-07 06:32 458次阅读
    <b class='flag-5'>一种</b>产生激光脉冲新<b class='flag-5'>方法</b>

    一种简单的方法振荡器相位噪声转换为时间抖动

    电子发烧友网站提供《一种简单的方法振荡器相位噪声转换为时间抖动.pdf》资料免费下载
    发表于 11-23 15:15 0次下载
    <b class='flag-5'>一种</b>简单的<b class='flag-5'>方法</b>来<b class='flag-5'>将</b>振荡器相位噪声转换为时间抖动

    一种产生激光脉冲的新方法

    英国和韩国的科学家提出了一种产生激光脉冲的新方法,其功率是现有激光脉冲的1000多倍。
    的头像 发表于 11-20 16:56 530次阅读
    <b class='flag-5'>一种</b>产生激光脉冲的新<b class='flag-5'>方法</b>