0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

统一Excel和Python的神器数据分析工具

人工智能与大数据技术 来源:Python数据科学 作者:Python数据科学 2021-01-27 16:38 次阅读

经常给大家推荐好用的数据分析工具,也收到了铁子们的各种好评。这次也不例外,我要再推荐一个,而且是个爆款神器。

Excel和Jupyter Notebok都是我每天必用的工具,而且两个工具经常协同工作,一直以来工作效率也还算不错。但说实在,毕竟是两个工具,使用的时候肯定会有一些切换的成本。

最近,在逛GitHub突然发现了一款神器「PyXLL-Jupyter」,它可以完美将Jupyter Notebook嵌入到Excel中!是的,你没听错,使用它我们就可在Excel中运行Jupyter Notebook,调用Python函数,实现数据共享。

一、安装

首先,想要在Excel中运行Python代码,需要安装PyXLL插件。PyXLL可以将Python集成到Excel中,用Python替代VBA。

先用 pip 安装 PyXLL。

pip install pyxll

然后再用PyXLL独特的命令行工具安装Excel插件。

》》 pyxll install

安装好了PyXLL在 Excel中的插件,下一步就是安装pyxll-jupyter软件包了。使用pip安装pyxll-jupyter软件包:

pip install pyxll-jupyter

安装完毕后,启动Excel,将在PyXLL选项卡中看到一个新的Jupyter按钮。

6e3a00a4-6001-11eb-8b86-12bb97331649.png

单击此按钮可在Excel工作簿的侧面板中打开Jupyter Notebook。该面板是Excel界面的一部分,可以通过拖放操作取消停靠或停靠在其他位置。

在Jupyter面板中,你可以选择一个现有的Notebook或创建一个新的Notebook。创建一个新的Notebook,选择新建按钮,然后选择Python 3。

6e6e7c08-6001-11eb-8b86-12bb97331649.png

二、使用方法

这样做有什么用处呢?

1、Excel和Python共享数据

比如,我们要将数据从Excel导入Python。

由于Excel和Python已经在同一进程中运行了,所以在Python中访问Excel数据以及在Python和Excel之间切换非常快。

更牛X的是,pyxll-jupyter还单独附带了一些IPython魔法函数,输入后一键即可完成同步。

%xl_get

6eb4f804-6001-11eb-8b86-12bb97331649.png

将Python中的数据移到Excel,也是同理,非常简单。

无论是使用Python先加载数据集,再传输到Excel,还是其它形式,从Python复制数据到Excel非常容易。

%xl_set

6f31fee4-6001-11eb-8b86-12bb97331649.png

当然,%xl_get和%xl_set都附带参数选项可以自定义导入导出规则。

2. 在Excel中使用Python绘图

PyXLL的另一大用处就是它集成了几乎所有主流的可视化包,因此我们可以在Excel中利用这些可视化包随意绘图,包括matplotlib、plotly、bokeh和altair等。

%xl_plot

6f9dee9c-6001-11eb-8b86-12bb97331649.png

同样,使用魔法函数%xl_plot在Excel中可以绘制任何的Python图。任何一个受支持的可视化包也可进行绘图然后传递图形对象到Excel中,比如上图中使用pandas的绘图效果就很好。

%xl_plot df.plot(kind=‘scatter’)

3. 从Excel调用Python函数

使用Excel离不开函数,而当我们需要一些复杂功能时,自带函数未必能满足我们的需求。

通过PyXLL,我们可以直接在Excel中调用Python函数,并对其进行实时测试。这就避免了Excel和Jupyter之间的来回切换成本,有点像dataframe的apply用法,写个函数直接与Excel完美融合。

函数写好后,还可将其添加到PyXLL Python项目中。这样以后每次都可以复用实现相同功能,简直不要太香!

from pyxll import xl_func @xl_func def test_func(a, b, c): return (a * b) + c

比如,输入以上代码在Jupyter中运行后,Python函数将立即可被Excel工作簿调用。

不只是简单的函数,还可以将整个数据作为pandas的DataFrames传给函数,并返回任何的Python类型,比如numpy array、DataFrames,甚至还可以通过给@xl_func装饰器一个签名字符串来告诉PyXLL输出什么类型。例如,以下函数:

from pyxll import xl_func # 装饰器签名告诉 PyXLL 如何转换函数参数和返回的值 @xl_func(“dataframe df: dataframe《index=True》”, auto_resize=True) def df_describe(df): # df 是一个从数据集里创建的 pandas DataFrame 传递给函数 desc = df.describe() # desc 是新的 DataFrame(PyXLL转换为一组值并返回给Excel所创建的) return desc现在可以编写复杂的Python函数来进行数据转换和分析,但是可以协调在Excel中如何调用或排序这些函数。更改输入会导致调用函数,并且计算出的输出会实时更新,这与我们期望的一样。

4. 替代VBA

VBA脚本所需的功能函数,在Python中均有相同的API。这对于熟悉Python但不熟悉VBA的同学绝对是个好消息。

官网还给出了和VBA功能一样的API说明文档。

https://www.pyxll.com/docs/userguide/vba.html

Jupyter Notebook在Excel中运行,整个Excel对象都可用,所有操作就像在VBA编辑器中编写Excel脚本一模一样。

由于PyXLL在Excel进程内运行Python ,因此从Python调用Excel不会对性能造成任何影响。当然,也可以从外部Python进程调用Excel,但这通常要慢很多。在Excel中运行Jupyter Notebook,一切变得就不一样了!

使用PyXLL的xl_app函数获取Excel.Application对象,该对象等效于VBA中的Application对象。弄清楚如何使用Excel对象模型进行操作的一种好方法是记录VBA宏,然后将该宏转换为Python。

下图中尝试将当前选择单元格更改颜色。

700c2f10-6001-11eb-8b86-12bb97331649.png

三、总结

PyXLL将完美融合Python和Excel,实现了以下功能,为表格数据处理提升一个全新的高度。

Excel和Python共享数据

在Excel中使用Python绘图

从Excel调用Python函数

替代VBA脚本

不得不说这个工具是真的香,喜爱Python的同学可以不用学习VBA了,Python脚本打天下。

原文标题:再见 VBA!神器工具统一 Excel 和 Python

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6890

    浏览量

    88826
  • python
    +关注

    关注

    56

    文章

    4782

    浏览量

    84451

原文标题:再见 VBA!神器工具统一 Excel 和 Python

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LLM在数据分析中的作用

    随着大数据时代的到来,数据分析已经成为企业和组织决策的关键工具数据科学家和分析师需要从海量数据
    的头像 发表于 11-19 15:35 135次阅读

    eda与传统数据分析的区别

    EDA(Exploratory Data Analysis,探索性数据分析)与传统数据分析之间存在显著的差异。以下是两者的主要区别: 分析目的和方法论 EDA 目的 :EDA的主要
    的头像 发表于 11-13 10:52 207次阅读

    raid 在大数据分析中的应用

    的具体应用: 、提高性能 并行读写 :RAID技术通过并行读写多个磁盘,可以显著提高数据的读写速度。在大数据分析环境中,数据读写速度是影响分析
    的头像 发表于 11-12 09:44 155次阅读

    SUMIF函数在数据分析中的应用

    在商业和科学研究中,数据分析项基本且关键的技能。Excel作为最常用的数据分析工具,提供
    的头像 发表于 11-11 09:14 228次阅读

    网络爬虫,Python数据分析

    电子发烧友网站提供《网络爬虫,Python数据分析.pdf》资料免费下载
    发表于 07-13 09:27 1次下载

    数据分析除了spss还有什么

    Sciences)是款非常流行的统计分析软件,但除了SPSS之外,还有许多其他数据分析工具和方法。 引言 数据分析
    的头像 发表于 07-05 15:01 542次阅读

    数据分析工具有哪些

    数据分析个涉及收集、处理、分析和解释数据以得出有意义见解的过程。在这个过程中,使用正确的工具至关重要。以下是
    的头像 发表于 07-05 14:54 760次阅读

    数据分析有哪些分析方法

    数据分析种重要的技能,它可以帮助我们从大量的数据中提取有价值的信息,从而做出更明智的决策。在这篇文章中,我们将介绍数据分析的各种方法,包括描述性
    的头像 发表于 07-05 14:51 531次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为种强大的工具,通过训练模型从
    的头像 发表于 07-02 11:22 544次阅读

    首批!数势科技SwiftAgent完成中国信通院大模型驱动的智能数据分析工具专项测试

    驱动的智能数据分析工具》 标准及测试简介 中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合50余家企业的100余位专家共同编制
    的头像 发表于 05-24 19:04 330次阅读
    首批!数势科技SwiftAgent完成中国信通院大模型驱动的智能<b class='flag-5'>数据分析</b><b class='flag-5'>工具</b>专项测试

    求助,关于AD采集到的数据分析问题

    问题描述:使用AD采集个10Hz到2MHz的脉冲,脉冲底部可能大于零,由采集到的数据分析出该脉冲的上升时间,幅值和占空比。 备注:在分析的时候已经知道脉冲的频率,精度为2X10^-5. 在
    发表于 05-09 07:40

    态势数据分析系统软件

    智慧华盛恒辉态势分析软件系统的功能描述、部署环境、界面使用、技术支持及些常见问题及其解决办法等。为数据态势分析软件系统的管理人员和使用人员提供说明。 智慧华盛恒辉态势
    的头像 发表于 04-22 11:36 404次阅读

    labview读取excel数据中的每个数据

    如何使用 LabVIEW 读取 Excel 数据,并对其中的每个数据进行处理。 Excel种常用的电子表格软件,广泛用于
    的头像 发表于 12-26 11:19 3541次阅读

    Python利用pandas读写Excel文件

    使用pandas模块读取Excel文件可以更为方便和快捷。pandas可以将Excel文件读取为个DataFrame对象,方便进行数据处理和分析
    的头像 发表于 12-16 11:22 1274次阅读
    <b class='flag-5'>Python</b>利用pandas读写<b class='flag-5'>Excel</b>文件

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为
    发表于 12-05 09:36