如你所见,为了阅读我不得不使用matplotlib旋转x轴标题.从外观上来看,显示非常不错.理想情况下,我想格式化y轴刻度,但是在不引入matplotlib的plt.yticks的情况下,我不知道如果做到这一点.
ggplot
ggplot类似于Seaborn,构建于matplotlib,并且旨在以简单的方式提高matplotlib可视化的视觉吸引力.和Seaborn不同的是它是R中ggplot2的接口.鉴于这个目标,部分API不是python,但非常强大.我没有用过R中的ggplot,所以有一个学习曲线.然后我可以开到ggplot的吸引力.此库正在积极的发展,我希望它继续发展并成熟起来,因为我认为这可能是一个非常强大的功能.为了弄清楚一些事情我也学习过几次.在看代码和做了一些google之后,我能明白大部分.来吧,导入模块,读取数据:
import pandas as pd
from ggplot import *
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:>10]
现在我们通过串联一些ggplot命令创建我们的图表:
p = ggplot(budget, aes(x="detail",y="amount")) + \
geom_bar(stat="bar", labels=budget["detail"].tolist()) +\
ggtitle("MN Capital Budget - 2014") + \
xlab("Spending Detail") + \
ylab("Amount") + scale_y_continuous(labels='millions') + \
theme(axis_text_x=element_text(angle=>90))
print p
这似乎有些奇怪,尤其适用print p来展示图表.然而,弄清楚这点比较简单.在进一步深入后,了解如何旋转文本90度以及如何排序x轴标签.我发现最棒的功能是 scale_y_continous,使得标签好看很多.如果你想保存图片,使用ggsave :
ggsave(p, "mn-budget-capital-ggplot.png")
这是最终图像.我知道有很多灰阶.我可以上色,但是没有时间.
Bokeh
Bokeh和之前3个库都不一样,不依赖与matplotlib,并且面向现代网页浏览器生成可视化.它的目的是让交互式网页可视化,所以我的例子非常简单.导入模块,读取数据:
import pandas as pd
from bokeh.charts import Bar
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:>10]
Bokeh一个不同的方面是,我需要明确列出我们想要绘制的值.
details = budget["detail"].values.tolist()
amount = >list(budget["amount"].astype(>float).values)
现在我们可以绘制.这个代码会让浏览器展示包含图表的HTML网页.如果有其他用途,我可以保存为png副本.
bar = Bar(amount, details, filename="bar.html")
bar.title("MN Capital Budget - 2014").xlabel("Detail").ylabel("Amount")
bar.show()
这是png图片:
正如你所看到的,图片非常干净.我没有找到更简单的方法,更容易的格式化y轴.Bokeh有去许多功能但是我没有在这个例子中深入.
Pygal
Pygal用于创建svg图表.如果安装了正确依赖,同样可以保存为png文件.对于易制作交互式图标svg文件是相当有用的.我同样发现创建独特外观和视觉吸引力的图标非常容易.和之前一样,导入模块,并读取数据:
import pandas as pd
import pygal
from pygal.style import LightStyle
budget = pd.read_csv("mn-budget-detail-2014.csv")
budget = budget.sort('amount',ascending=False)[:>10]
我们需要创建图标类型和设置一些基本属性:
bar_chart = pygal.Bar(style=LightStyle, width=>800, height=>600,
legend_at_bottom=True, human_readable=True,
title='MN Capital Budget - 2014')
值得注意的一点是human_readable,对于格式化数据做的非常好.现在我们需要加入数据到图表中.这里和pandas整合不那么紧密,但是我发现直接处理这个小数据集.当有大量的行,性能可能是一个问题.
for index, row >in budget.iterrows():
bar_chart.add(row["detail"], row["amount"])、
现在渲染文件为svg 和png文件:
bar_chart.render_to_file('budget.svg')
bar_chart.render_to_png('budget.png')
我认为svg表现非常好,我喜欢结果图具有独特,赏心悦目的风格.我同样发现很容易弄清楚可以做什么,不可以做什么.我鼓励你下载svg文件,看看在你浏览器中图片的互动性.
Plot.ly
Plot.ly以分析和可视化的在线工具来区分的.有强大的API并且包含python的.浏览网站,你可以发现有非常丰富,交互式的图片.得益于优秀的文档,创建条形图相当简单.你需要遵循文档,获取你API 密钥设置.一旦你这样做,所有工作看上去相当完美.一个需要注意的是,你所做的一切都在网上发布,因此确保你对这点感到OK.有一个选项可以让图表私有,所以你需要设置.Plot.ly和pandas无缝整合.设置导入模块,读取数据:
import plotly.plotly as py
import pandas as pd
from plotly.graph_objs import *
budget=pd.read_csv(“mn-budget-detail-2014.csv”)
budget.sort(‘amount’,ascending=False,inplace=True)
budget = budget[:>10]
设置数据和图表类型.
data = Data([
Bar(
x=budget["detail"],
y=budget["amount"]
)
])
我还决定添加一些额外布局信息.
layout = Layout(
title='2014 MN Capital Budget',
font=Font(
family='Raleway, sans-serif'
),
showlegend=False,
xaxis=XAxis(
tickangle=->45
),
bargap=>0.05
)
最后,绘制数据.这将打开一个浏览器,带有你完成的绘图.你可以使用 py.image.save_as保存本例副本.这是个很cool的功能.你得到丰富的基于网络报告的交互,和保存本地副本用于嵌入文件的能力.
fig = Figure(data=data, layout=layout)
plot_url = py.plot(data,filename='MN Capital Budget - 2014')
py.image.save_as(fig, 'mn-14-budget.png')
检查全交互式版本.你可以看到很多很棒的例子.箱图很吸引人并具有高度交互性.因为文档和pythonAPI,运行非常简单,我喜欢最终产品.
总结
在python生态环境中绘制数据有两面性.好的方面是有很多选择.坏的方面是有很多选择.尝试弄清楚那个适合你,取决于你需要完成什么.在某种程度上,你需要弄清楚用的工具能不能工作.我没有看到明显赢家和输家.下面是我一些想法:
pandas非常方便,但你必须愿意学习matplotlib定制。
Seaborn可以支持一些更复杂的可视化的方法,但仍需要matplotlib知识来调整。颜色方案是不错。
ggplot有很多的承诺,但经过阵痛仍在继续。
Bokeh 是一个强大的工具,如果你想建立自己的可视化服务器,但可能在简单场景有些大材小用。
pygal由于能够产生互动的SVG图形和PNG文件是独一无二的。它并不像基于matplotlib方案灵活。
Plotly产生互动性最强的图形。您可以离线保存,并创建非常丰富的基于网络的可视化效果。
目前的情况是,我会继续观看ggplot图像的进步和使用pygal,在需要交互性的时候使用plotly。随意在评论中提供反馈。我相信,人们将有很多关于这一主题的问题和意见。如果我错过了什么或者有其他的选择了,让我知道。
评论
查看更多