0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个助你事半功倍的数据挖掘工具!

数据分析与开发 来源:数据分析与开发 2023-01-10 15:53 次阅读

Pandas模块当中,对于表格数据的分组操作(groupby)和透视表(pivot_table)的制作一直都是比较常见的,今天小编为大家分享一个数据分析的利器,能够自动为我们完成上述提到的一系列操作,并且带有GUI界面,所以使用起来非常的方便。

PivotTableJS

看名字我们就能知道,该模块是专门用来生成透视表(pivot_table),而且是用JavaScript代码来构建的,由于其有GUI界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。

当然我们先用pip命令来安装该模块,代码如下

pipinstallPivotTableJS

加载数据集

那么首先,我们先来加载数据集,这里导入Pandas模块


	

importpandasaspd df=pd.read_csv("employee_dataset.csv") df.head()

output

8d475dee-9014-11ed-bfe3-dac502259ad0.png

牛刀小试

这里我们尝试来调用pivottablejs模块当中的pivot_ui方法,只需两行代码


	

frompivottablejsimportpivot_ui pivot_ui(df)

output

8d62737c-9014-11ed-bfe3-dac502259ad0.png

这里可能需要等待1-2分钟左右的时间来供其加载,随后我们就能看到如上图所示的窗口,窗口中包括了表格当中的每一列的字段、可视化图表的各种形式等等

8d75f33e-9014-11ed-bfe3-dac502259ad0.png

同时我们也可以拖拽指定的列到空白的窗口中,对其进行分组统计以及透视表的制作,如下图所示

8d907862-9014-11ed-bfe3-dac502259ad0.gif

而要是我们想要进行可视化操作,只需要在下拉框中选中,例如我们想要绘制的是直方图,

8da72364-9014-11ed-bfe3-dac502259ad0.gif

分组统计

接下来我们进行分组(groupby)操作,例如我们想要查看一下员工状态(Employee_Status)的分组统计,只需要将该列拖拽至空白的区域即可

8dce976e-9014-11ed-bfe3-dac502259ad0.png

我们可以看到员工分为是全职员工以及实习生,分别是有791位和209位,当然除了计数(count)之外,我们还能够计算平均值、中位数、最大/最小值等一系列统计方法,例如我们想要计算一下全职员工和实习生的平均工资,就可以这么来操作

8df19d0e-9014-11ed-bfe3-dac502259ad0.gif

我们还可以更进一步,将上面的结果进行可视化展示,如下所示

8e10ad8e-9014-11ed-bfe3-dac502259ad0.gif

透视表

对于透视表而言,pivottablejs模块实现起来也格外的简单,我们只需要在上述操作的基础之上,将列拖拽到右边空白的长方形区域当中,例如我们想要看一下分布在不同城市当中不同职位员工的分布,就可以这么来做

8e65f366-9014-11ed-bfe3-dac502259ad0.gif

当然该模块给我们带来的便利和自身所具备的功能远不止此,大家可以安装一下该模块,然后在空余的时间中自行探索。

当然我们看来该模块还存在着一个小小的bug,大家可以尝试用其他版本来试一下,小编在这里用的是0.9.0

审核编辑 :李倩



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2670

    浏览量

    47333
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    24202
  • 可视化
    +关注

    关注

    1

    文章

    1177

    浏览量

    20882

原文标题:介绍一个助你事半功倍的数据挖掘工具!

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    分享keil MDK编译信息增强工具

    今天给大家分享 keil MDK 编译信息增强工具:keil-build-viewer. 1 keil-build-viewer介绍 这是
    的头像 发表于 11-14 11:01 174次阅读

    中科曙光受邀参加第十届中国数据挖掘会议

    近日,国内数据挖掘领域最主要的学术活动之—第十届中国数据挖掘会议(CCDM2024)于山东泰安举行,中科曙光参与并分享了曙光AI构建产学研
    的头像 发表于 08-01 10:43 553次阅读

    数据分析的工具有哪些

    数据分析是涉及收集、处理、分析和解释数据以得出有意义见解的过程。在这个过程中,使用正确的工具至关重要。以下是
    的头像 发表于 07-05 14:54 752次阅读

    数据采集方法有哪些?工具有哪些?

    上收集数据。它通过模拟用户浏览网页的行为,获取网页上的文本、图片、链接等信息。网络爬虫可以应用于各种场景,如市场调研、社交媒体分析、新闻聚合等。 常用的网络爬虫工具有: Scrapy:
    的头像 发表于 07-01 15:35 1185次阅读

    常见的数据采集工具的介绍

    数据采集是数据分析和处理的基础,它涉及到从各种数据源中提取、收集和整理数据的过程。数据采集工具
    的头像 发表于 07-01 14:51 680次阅读

    数据中台工具的选型要点

    数据中台工具扮演着举足轻重的角色。想要全面理解数据中台工具的意义、作用以及应用方式,就必须深入探讨这概念以及相关实践。
    的头像 发表于 04-24 15:07 282次阅读

    自己写了手机端烧录程序工具,把bin文件数据写从0x8000000开始地址,完成后无法启动怎么解决?

    我自己写了手机端类似的烧录工具代替pc端的工具,负责把bin文件写到stm32f4 flash中。但是写完数据后,重新上电不启动。我通过
    发表于 04-01 07:16

    贼拉好用的嵌入式数据可视化工具

    今天给大家分享比较实用的开源、免费的数据可视化小工具:SerialStudio。首先用张图给大家看
    的头像 发表于 03-07 08:09 455次阅读
    贼拉好用的<b class='flag-5'>一</b><b class='flag-5'>个</b>嵌入式<b class='flag-5'>数据</b>可视化<b class='flag-5'>工具</b>

    嵌入式数据可视化工具——Serial Studio

    Serial Studio从名称就可以看的出来,它是款串口(Serial)可视化(Studio)工具:主要用于嵌入式开发者的跨平台数据可视化工具(应用软件,或上位机软件)。
    的头像 发表于 03-04 10:12 5765次阅读

    挖掘机生产装配线无线通讯应用

    、合理地使用工装、专用工具,提高装配质量和生产操作安全性,便于集中管理;大大减轻了劳动强度,适应了上批量,上效益的要求。 挖掘机生产装配线的无线通讯项目共涉及两应用场景,一个是对牵引
    的头像 发表于 02-22 09:44 360次阅读
    <b class='flag-5'>挖掘</b>机生产装配线无线通讯应用

    数据挖掘的应用领域,并举例说明

    数据挖掘(Data Mining)是种从大量数据中提取出有意义的信息和模式的技术。它结合了数据库、统计学、机器学习和人工智能等领域的理论和
    的头像 发表于 02-03 14:19 2901次阅读

    源代码审计怎么做?有哪些常用工具

    。 3、CodeQL:在 CodeQL 中,代码被视为数据,安全漏洞则被建模为可以对数据库执行的查询语句。 4、SonarQube:是用于代码质量管理的开源平台,用于管理源代码的质
    发表于 01-17 09:35

    充分挖掘SiC FET的性能

    充分挖掘SiC FET的性能
    的头像 发表于 12-07 09:30 354次阅读
    充分<b class='flag-5'>挖掘</b>SiC FET的性能

    数据挖掘示波器与传统示波器的区别在哪里?

    数据采集方式:传统示波器通过将模拟信号转换为数字信号进行采集和显示。而数据挖掘示波器主要用于数字信号的采集和分析,例如从数字通信系统、传感器网络等获取的数字信号进行处理和分析。
    的头像 发表于 12-04 14:28 391次阅读
    <b class='flag-5'>数据</b><b class='flag-5'>挖掘</b>示波器与传统示波器的区别在哪里?

    安全挖掘快速多用途工具

    dnsx是快速的多用途DNS工具包,设计用于通过retryabledns库运行各种探测。它支持多个DNS查询、用户提供的解析器、DNS 通配符过滤(如shuffledns等)。
    的头像 发表于 11-30 16:22 573次阅读
    安全<b class='flag-5'>挖掘</b>快速多用途<b class='flag-5'>工具</b>