Python开源机器学习建模库PyCaret，发布了2.0版本-电子发烧友网

Python开源机器学习建模库PyCaret，最近发布了2.0版本。

这款堪称调包侠神器的模型训练工具包，几行代码就能搞定模型编写、改进和微调。从数据预处理到模型效果对比，PyCaret都能自动实现。所以，PyCaret长啥样，2.0的版本又做了什么改进？一起来看看。

机器学习库的炼丹炉

PyCaret说白了，有点像一个机器学习库的炼丹炉。以下是它熔进来的部分库：

数据处理：pandas、numpy…
数据可视化：matplotlib、seaborn…
各种模型：sklearn、xgboost、catboost、lightgbm…

嗯…sklearn直接就给封装进去了，调用很方便。然后，PyCaret这个炼丹炉，自带功能“按键”（定义了一些函数），包括数据预处理、模型训练、模型集成、模型分析、模型测试等。只需要写上几行Python代码，这些功能“按键”就会被按下，PyCaret自动帮你实现。至于实现过程中需要调用什么基本库，哪些可以放弃丝毫不需要考虑。从下图来看，仅仅是预处理阶段，就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能。

如果要实现必需的预处理功能，需要多少行代码来调用？答案是0行。因为，当使用setup()进行初始化时，PyCaret将自动执行机器学习必需的数据预处理步骤，包括缺失值插入、分类变量编码、标签编码、数据集拆分等。例如，在数据处理前，你发现数据集有空缺的地方（下图中NaN部分）。

别怕，PyCaret会自动分析数据，进行缺失值插入。

预处理后，PyCaret还贴心地帮你准备了各种模型。从模型训练、选用到测试，只有你想不到的，没有它做不了的。如果已经将数据处理好，并交给PyCaret，一个compare_models函数就能训练库中的所有模型，进行结果比较后，标出最佳模型。如下图，各种模型指标的最优值会被一键标黄，就看你怎么选择了。

选好后，想对模型进行一点优化？一个tune_model函数就能帮你搞定。或者，不想仅仅选用一个模型？ PyCaret也准备了模型集成的函数，blend和stack任你选。除此之外，模型参数的分析（包括可视化）也只需要几行代码就能实现，功能非常强大。

最后，PyCaret还能为新数据提供迭代预测结果，下面的效果，同样只需要几行代码就能完成。

那么，这次PyCaret增强，进行了什么改进呢？（项目见传送门）

PyCaret 2.0增强版

这是PyCaret 2.0的6大特色，有些在1.0就有了，有些功能如实验日志，看起来是更新后新加入的功能。

实验日志，对于模型的调整不可或缺。例如，想要将训练过程中模型的精度变化可视化，通常我们会在模型中加入生成日志文件的函数，生成一个更直观的时间-精度变化图。 PyCaret 2.0加入了实验日志的功能，自动帮你跟踪模型实验过程中的各项指标，以及生成视觉效果等。不仅如此，在2.0中，模型生成到预测的所有工作流程，现在可以被设计了。也就是说，你可以设置一条自定义流水线，在这个过程中，从训练到测试，所有模块的功能都会被自动化完成。甚至，PyCaret 2.0还提供了机器学习模型前端软件的搭建工具。以及，PyCaret 2.0现在几乎支持所有算法的并行处理，xgboost和catboost模型也支持GPU训练。

除此之外，还有一些新的程序功能，等待你去发现。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4780

浏览量
68540
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132580
python

python

+关注

关注
56

文章
4793

浏览量
84634

原文标题：调包侠神器2.0发布，Python机器学习模型搭建只需要几行代码

文章出处：【微信号：DBDevs，微信公众号：数据分析与开发】欢迎添加关注！文章转载请注明出处。

《中国汽车芯片联盟白名单》2.0版本发布，覆盖300多家厂商的超1800款产品

》（简称“联盟白名单”）的2.0版本。联盟白名单1.0版本发布于2024年4月18日，此次的2.0

发表于 12-05 00:04 •3391次阅读

USB4 2.0版本的重大更新

USB版本一直很多，可以说是五花八门，但是随着接口的日渐统一，USB的版本可以说减少了很多，到了USB4，只剩下USB-C接口，为何还有一个2.0版本，我们往下详解。

发表于 09-09 14:37 •602次阅读

如何帮助孩子高效学习Python:开源硬件实践是最优选择

显著提升孩子的学习兴趣和对Python原理的理解。本文将探讨为何使用Raspberry Pi（树莓派）或Unihiker（行空板）等开源硬件是孩子们掌握Python的最佳途径。让孩子

发表于 09-06 09:49 •310次阅读

Python建模算法与应用

Python作为一种功能强大、免费、开源且面向对象的编程语言，在科学计算、数学建模、数据分析等领域展现出了卓越的性能。其简洁的语法、对动态输入的支持以及解释性语言的本质，使得Python

发表于 07-24 10:41 •531次阅读

opencv-python和opencv一样吗

不一样。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了

发表于 07-16 10:38 •1166次阅读

天数智芯主导的DeepSpark开源社区发布百大应用开放平台24.06版本

近日，由上海天数智芯半导体有限公司（以下简称“天数智芯”）主导的DeepSpark开源社区正式发布了百大应用开放平台24.06版本。百大应用开放平台作为国内领先的AI和通用计算应

发表于 07-03 16:56 •1071次阅读

深度学习常用的Python库

深度学习作为人工智能的一个重要分支，通过模拟人类大脑中的神经网络来解决复杂问题。Python作为一种流行的编程语言，凭借其简洁的语法和丰富的库支持，成为了深度学习研究和应用的首选工具。

发表于 07-03 16:04 •629次阅读

在Arduino开发环境，使用2.0以后版本开发板库以后，效率极其低下是什么原因？

用虚拟机安装了 2.0.4版本。此2.0.4版本使用过程中，出现了一些问题：起初，我发现同一段程序，使用2.0.4版本的执行效率要比1.0.6版本

发表于 06-13 07:41

LwIP v2.0版本更换为v2.1.2版本后接收不到数据了怎么解决？

请教下，吧 LwIP v2.0 版本更换为 v2.1.2 版本后接收不到数据了，是怎么回事啊？？之前使用 v2.0

发表于 04-23 08:20

python 学习：在内网中 python库-numpy 安装方法，升级pip3版本的指令

\\\\numpy-1.26.4-cp311-cp311-win_amd64.whl 内网中升级pip 升级版本的指令： python.exe -m pip install --upgrade pip--proxy \"http://gateway.schneider.z

发表于 04-22 17:18

天数智芯主导DeepSpark开源社区百大应用开放平台24.03版本正式发布

近日，由上海天数智芯半导体有限公司（以下简称“天数智芯”）主导的DeepSpark开源社区正式发布了百大应用开放平台24.03版本。

发表于 03-28 10:58 •1119次阅读

升级了STM32CubeMX到6.10版本，结果侧面升级和安装SDK库点击无效了怎么解决？

升级了STM32CubeMX到6.10版本，结果侧面升级和安装SDK库点击无效了，账户登录也点击出不来，重装6.9.2版本就都可以。

发表于 03-08 06:27

SAP HANA 2.0 SP07版本新功能特性汇总

的HANA 2.0 SP06版本建议今年下半年尽快升级到HANA 2.0 SP07版本。那么HANA 2.0 SP07新

发表于 02-19 09:22 •518次阅读

DeepSpark开源社区发布百大应用开放平台23.12版本

近日，上海天数智芯半导体有限公司（以下简称“天数智芯”）领导的DeepSpark开源社区正式推出了百大应用开放平台23.12版本。这一版本作为国内领先的AI和通用计算应用开发及评测平台，致力于甄选与行业应用深度耦合的

发表于 01-04 14:58 •922次阅读

天数智芯DeepSpark开源社区正式发布百大应用开放平台23.12版本

近日，由上海天数智芯半导体有限公司（以下简称“天数智芯”）主导的DeepSpark开源社区正式发布了百大应用开放平台23.12版本。

发表于 12-29 15:13 •1039次阅读

搜索历史

Python开源机器学习建模库PyCaret，发布了2.0版本

评论

《中国汽车芯片联盟白名单》2.0版本发布，覆盖300多家厂商的超1800款产品

USB4 2.0版本的重大更新

如何帮助孩子高效学习Python:开源硬件实践是最优选择

Python建模算法与应用

opencv-python和opencv一样吗

天数智芯主导的DeepSpark开源社区发布百大应用开放平台24.06版本

深度学习常用的Python库

在Arduino开发环境，使用2.0以后版本开发板库以后，效率极其低下是什么原因？

LwIP v2.0版本更换为v2.1.2版本后接收不到数据了怎么解决？

python 学习：在内网中 python库-numpy 安装方法，升级pip3版本的指令

天数智芯主导DeepSpark开源社区百大应用开放平台24.03版本正式发布

升级了STM32CubeMX到6.10版本，结果侧面升级和安装SDK库点击无效了怎么解决？

SAP HANA 2.0 SP07版本新功能特性汇总

DeepSpark开源社区发布百大应用开放平台23.12版本

天数智芯DeepSpark开源社区正式发布百大应用开放平台23.12版本