0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Python开源机器学习建模库PyCaret,发布了2.0版本

数据分析与开发 来源:量子位 2020-08-27 15:31 次阅读

Python开源机器学习建模库PyCaret,最近发布了2.0版本。

这款堪称调包侠神器的模型训练工具包,几行代码就能搞定模型编写、改进和微调。 从数据预处理到模型效果对比,PyCaret都能自动实现。 所以,PyCaret长啥样,2.0的版本又做了什么改进? 一起来看看。

机器学习库的炼丹炉

PyCaret说白了,有点像一个机器学习库的炼丹炉。 以下是它熔进来的部分库:

数据处理:pandas、numpy…
数据可视化:matplotlib、seaborn…
各种模型:sklearn、xgboost、catboost、lightgbm…

嗯…sklearn直接就给封装进去了,调用很方便。 然后,PyCaret这个炼丹炉,自带功能“按键”(定义了一些函数),包括数据预处理、模型训练、模型集成、模型分析、模型测试等。 只需要写上几行Python代码,这些功能“按键”就会被按下,PyCaret自动帮你实现。 至于实现过程中需要调用什么基本库,哪些可以放弃丝毫不需要考虑。 从下图来看,仅仅是预处理阶段,就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能。

如果要实现必需的预处理功能,需要多少行代码来调用? 答案是0行。 因为,当使用setup()进行初始化时,PyCaret将自动执行机器学习必需的数据预处理步骤,包括缺失值插入、分类变量编码、标签编码、数据集拆分等。 例如,在数据处理前,你发现数据集有空缺的地方(下图中NaN部分)。

别怕,PyCaret会自动分析数据,进行缺失值插入。

预处理后,PyCaret还贴心地帮你准备了各种模型。 从模型训练、选用到测试,只有你想不到的,没有它做不了的。 如果已经将数据处理好,并交给PyCaret,一个compare_models函数就能训练库中的所有模型,进行结果比较后,标出最佳模型。 如下图,各种模型指标的最优值会被一键标黄,就看你怎么选择了。

选好后,想对模型进行一点优化?一个tune_model函数就能帮你搞定。 或者,不想仅仅选用一个模型? PyCaret也准备了模型集成的函数,blend和stack任你选。 除此之外,模型参数的分析(包括可视化)也只需要几行代码就能实现,功能非常强大。

最后,PyCaret还能为新数据提供迭代预测结果,下面的效果,同样只需要几行代码就能完成。

那么,这次PyCaret增强,进行了什么改进呢?(项目见传送门)

PyCaret 2.0增强版

这是PyCaret 2.0的6大特色,有些在1.0就有了,有些功能如实验日志,看起来是更新后新加入的功能。

实验日志,对于模型的调整不可或缺。 例如,想要将训练过程中模型的精度变化可视化,通常我们会在模型中加入生成日志文件的函数,生成一个更直观的时间-精度变化图。 PyCaret 2.0加入了实验日志的功能,自动帮你跟踪模型实验过程中的各项指标,以及生成视觉效果等。 不仅如此,在2.0中,模型生成到预测的所有工作流程,现在可以被设计了。 也就是说,你可以设置一条自定义流水线,在这个过程中,从训练到测试,所有模块的功能都会被自动化完成。 甚至,PyCaret 2.0还提供了机器学习模型前端软件的搭建工具。 以及,PyCaret 2.0现在几乎支持所有算法的并行处理,xgboost和catboost模型也支持GPU训练。

除此之外,还有一些新的程序功能,等待你去发现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4780

    浏览量

    68540
  • 机器学习
    +关注

    关注

    66

    文章

    8408

    浏览量

    132580
  • python
    +关注

    关注

    56

    文章

    4793

    浏览量

    84634

原文标题:调包侠神器2.0发布,Python机器学习模型搭建只需要几行代码

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《中国汽车芯片联盟白名单》2.0版本发布,覆盖300多家厂商的超1800款产品

    》(简称“联盟白名单”)的2.0版本。   联盟白名单1.0版本发布于2024年4月18日,此次的2.0
    的头像 发表于 12-05 00:04 3391次阅读
    《中国汽车芯片联盟白名单》<b class='flag-5'>2.0</b><b class='flag-5'>版本</b><b class='flag-5'>发布</b>,覆盖300多家厂商的超1800款产品

    USB4 2.0版本的重大更新

    USB版本一直很多,可以说是五花八门,但是随着接口的日渐统一,USB的版本可以说减少了很多,到了USB4,只剩下USB-C接口,为何还有一个2.0版本,我们往下详解。
    的头像 发表于 09-09 14:37 602次阅读

    如何帮助孩子高效学习Python:开源硬件实践是最优选择

    显著提升孩子的学习兴趣和对Python原理的理解。本文将探讨为何使用Raspberry Pi(树莓派)或Unihiker(行空板)等开源硬件是孩子们掌握Python的最佳途径。 让孩子
    的头像 发表于 09-06 09:49 310次阅读

    Python建模算法与应用

    Python作为一种功能强大、免费、开源且面向对象的编程语言,在科学计算、数学建模、数据分析等领域展现出了卓越的性能。其简洁的语法、对动态输入的支持以及解释性语言的本质,使得Python
    的头像 发表于 07-24 10:41 531次阅读

    opencv-python和opencv一样吗

    不一样。OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件,它提供
    的头像 发表于 07-16 10:38 1166次阅读

    天数智芯主导的DeepSpark开源社区发布百大应用开放平台24.06版本

      近日,由上海天数智芯半导体有限公司(以下简称“天数智芯”)主导的DeepSpark开源社区正式发布百大应用开放平台24.06版本。 百大应用开放平台作为国内领先的AI和通用计算应
    的头像 发表于 07-03 16:56 1071次阅读
    天数智芯主导的DeepSpark<b class='flag-5'>开源</b>社区<b class='flag-5'>发布</b>百大应用开放平台24.06<b class='flag-5'>版本</b>

    深度学习常用的Python

    深度学习作为人工智能的一个重要分支,通过模拟人类大脑中的神经网络来解决复杂问题。Python作为一种流行的编程语言,凭借其简洁的语法和丰富的支持,成为了深度学习研究和应用的首选工具。
    的头像 发表于 07-03 16:04 629次阅读

    在Arduino开发环境,使用2.0以后版本开发板以后,效率极其低下是什么原因?

    用虚拟机安装了 2.0.4版本。此2.0.4版本使用过程中,出现一些问题: 起初,我发现同一段程序,使用2.0.4版本的执行效率要比1.0.6版本
    发表于 06-13 07:41

    LwIP v2.0版本更换为v2.1.2版本后接收不到数据怎么解决?

    请教下,吧 LwIP v2.0 版本更换为 v2.1.2 版本后接收不到数据,是怎么回事啊 ?? 之前使用 v2.0
    发表于 04-23 08:20

    python 学习:在内网中 python-numpy 安装方法,升级pip3版本的指令

    \\\\numpy-1.26.4-cp311-cp311-win_amd64.whl 内网中升级pip 升级版本的指令: python.exe -m pip install --upgrade pip--proxy \"http://gateway.schneider.z
    发表于 04-22 17:18

    天数智芯主导DeepSpark开源社区百大应用开放平台24.03版本正式发布

    近日,由上海天数智芯半导体有限公司(以下简称“天数智芯”)主导的DeepSpark开源社区正式发布百大应用开放平台24.03版本
    的头像 发表于 03-28 10:58 1119次阅读
    天数智芯主导DeepSpark<b class='flag-5'>开源</b>社区百大应用开放平台24.03<b class='flag-5'>版本</b>正式<b class='flag-5'>发布</b>

    升级STM32CubeMX到6.10版本,结果侧面升级和安装SDK点击无效怎么解决?

    升级STM32CubeMX到6.10版本,结果侧面升级和安装SDK点击无效,账户登录也点击出不来,重装6.9.2版本就都可以。
    发表于 03-08 06:27

    SAP HANA 2.0 SP07版本新功能特性汇总

    的HANA 2.0 SP06版本建议今年下半年尽快升级到HANA 2.0 SP07版本。那么HANA 2.0 SP07新
    的头像 发表于 02-19 09:22 518次阅读

    DeepSpark开源社区发布百大应用开放平台23.12版本

    近日,上海天数智芯半导体有限公司(以下简称“天数智芯”)领导的DeepSpark开源社区正式推出了百大应用开放平台23.12版本。这一版本作为国内领先的AI和通用计算应用开发及评测平台,致力于甄选与行业应用深度耦合的
    的头像 发表于 01-04 14:58 922次阅读

    天数智芯DeepSpark开源社区正式发布百大应用开放平台23.12版本

    近日,由上海天数智芯半导体有限公司(以下简称“天数智芯”)主导的DeepSpark开源社区正式发布百大应用开放平台23.12版本
    的头像 发表于 12-29 15:13 1039次阅读
    天数智芯DeepSpark<b class='flag-5'>开源</b>社区正式<b class='flag-5'>发布</b>百大应用开放平台23.12<b class='flag-5'>版本</b>