Python教你用 Rows 快速操作csv文件-电子发烧友网

Rows 是一个专门用于操作表格的第三方Python模块。

只要通过 Rows 读取 csv 文件，她就能生成可以被计算的 Python 对象。

相比于 pandas 的 pd.read_csv, 我认为 Rows 的优势在于其易于理解的计算语法和各种方便的导出和转换语法。它能非常方便地提取pdf中的文字、将csv转换为sqlite文件、合并csv等，还能对csv文件执行sql语法，还是比较强大的。

当然，它的影响力肯定没有 Pandas 大，不过了解一下吧，技多不压身。

1.准备

开始之前，你要确保Python和pip已经成功安装在电脑上，如果没有，可以访问这篇文章：超详细Python安装指南进行安装。

**(可选1) **如果你用Python的目的是数据分析，可以直接安装Anaconda：Python数据分析与挖掘好帮手—Anaconda，它内置了Python和pip.

**(可选2) **此外，推荐大家用VSCode编辑器，它有许多的优点：Python 编程的最好搭档—VSCode 详细指南。

请选择以下任一种方式输入命令安装依赖 ：

Windows 环境打开 Cmd (开始-运行-CMD)。
MacOS 环境打开 Terminal (command+空格输入Terminal)。
如果你用的是 VSCode编辑器或 Pycharm，可以直接使用界面下方的Terminal.

pip install rows

2.基本使用

通过下面这个小示例，你就能知道Rows的基本使用方法。

假设我们有这样的一个csv表格数据：

state,city,inhabitants,area
AC,Acrelândia,12538,1807.92
AC,Assis Brasil,6072,4974.18
AC,Brasiléia,21398,3916.5
AC,Bujari,8471,3034.87
AC,Capixaba,8798,1702.58
[...]
RJ,Angra dos Reis,169511,825.09
RJ,Aperibé,10213,94.64
RJ,Araruama,112008,638.02
RJ,Areal,11423,110.92
RJ,Armação dos Búzios,27560,70.28
[...]

如果我们想要找出 state 为 RJ 并且人口大于 500000 的城市，只需要这么做：

import rows

cities = rows.import_from_csv("data/brazilian-cities.csv")
rio_biggest_cities = [
    city for city in cities
    if city.state == "RJ" and city.inhabitants > 500000
]
for city in rio_biggest_cities:
    density = city.inhabitants / city.area
    print(f"{city.city} ({density:5.2f} ppl/km²)")

和 Pandas 很像，但是语法比 Pandas 简单，整个模块也比 Pandas 轻量。

如果你想要自己新建一个"表格", 你可以这么写：

from collections import OrderedDict
from rows import fields, Table


country_fields = OrderedDict([
    ("name", fields.TextField),
    ("population", fields.IntegerField),
])

countries = Table(fields=country_fields)
countries.append({"name": "Argentina", "population": "45101781"})
countries.append({"name": "Brazil", "population": "212392717"})
countries.append({"name": "Colombia", "population": "49849818"})
countries.append({"name": "Ecuador", "population": "17100444"})
countries.append({"name": "Peru", "population": "32933835"})

然后你可以迭代它：

for country in countries:
    print(country)
# Result:
# Row(name='Argentina', population=45101781)
# Row(name='Brazil', population=212392717)
# Row(name='Colombia', population=49849818)
# Row(name='Ecuador', population=17100444)
# Row(name='Peru', population=32933835)
# "Row" is a namedtuple created from `country_fields`

# We've added population as a string, the library automatically converted to
# integer so we can also sum:
countries_population = sum(country.population for country in countries)
print(countries_population) # prints 357378595

还可以将此表导出为 CSV 或任何其他支持的格式：

# 公众号：Python实用宝典
import rows
rows.export_to_csv(countries, "some-LA-countries.csv")

# html
rows.export_to_html(legislators, "some-LA-countries.csv")

从字典导入到rows对象：

import rows

data = [
    {"name": "Argentina", "population": "45101781"},
    {"name": "Brazil", "population": "212392717"},
    {"name": "Colombia", "population": "49849818"},
    {"name": "Ecuador", "population": "17100444"},
    {"name": "Peru", "population": "32933835"},
    {"name": "Guyana", }, # Missing "population", will fill with `None`
]
table = rows.import_from_dicts(data)
print(table[-1]) # Can use indexes
# Result:
# Row(name='Guyana', population=None)

3.命令行工具

除了写Python代码外，你还可以直接使用Rows的命令行工具，下面介绍几个可能会经常被用到的工具。

读取pdf文件内的文字并保存为文件：

# 需要提前安装: pip install rows[pdf]
URL="http://www.imprensaoficial.rr.gov.br/app/_edicoes/2018/01/doe-20180131.pdf"
rows pdf-to-text $URL result.txt # 保存到文件 显示进度条
rows pdf-to-text --quiet $URL result.txt # 保存到文件 不显示进度条
rows pdf-to-text --pages=1,2,3 $URL # 输出三页到终端
rows pdf-to-text --pages=1-3 $URL # 输出三页到终端(使用 - 范围符)

将csv转化为sqlite:

rows csv2sqlite 
     --dialect=excel 
     --input-encoding=latin1 
     file1.csv file2.csv 
     result.sqlite

合并多个csv文件：

rows csv-merge 
     file1.csv file2.csv.bz2 file3.csv.xz 
     result.csv.gz

对csv执行sql搜索：

# needs: pip install rows[html]
rows query 
    "SELECT * FROM table1 WHERE inhabitants > 1000000" 
    data/brazilian-cities.csv 
    --output=data/result.html

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

编辑器

编辑器

+关注

关注
1

文章
808

浏览量
31365
python

python

+关注

关注
56

文章
4812

浏览量
85173
csv

csv

+关注

关注
0

文章
39

浏览量
5877

[下载]教你用Protel DXP的抄板功能

教你用Protel DXP的抄板功能下载地址：http://www.ctpcb.cn/read.php?tid-8329199.html[此贴子已经被作者于2008-10-28 8:36:52编辑过]

发表于 07-21 19:20

[下载]教你用Protel ***的抄板功能

教你用Protel ***的抄板功能下载地址：http://www.ctpcb.cn/read.php?tid-8329199.html

发表于 09-25 09:28

手把手教你用51单片机DIY音乐频谱显示

`手把手教你用51单片机DIY音乐频谱显示`

发表于 08-15 23:13

教你用单片机控制LCD液晶显示器

教你用单片机控制LCD液晶显示器

发表于 08-20 21:25

手把手教你用matlab生成STM32官方IIR滤波器系数

手把手教你用matlab生成STM32官方IIR滤波器系数.pdf手把手教你用 matlab 生成 STM32 官方 IIR 滤波器的系数 (一)本文采用的 matlab 版本为 R2008a，芯片

发表于 08-09 06:05

matlab stm32 参数,手把手教你用matlab生成STM32官方IIR滤波器系数.pdf 精选资料分享

手把手教你用matlab生成STM32官方IIR滤波器系数.pdf手把手教你用 matlab 生成 STM32 官方 IIR 滤波器的系数 (一)本文采用的 matlab 版本为 R2008a，芯片

发表于 08-10 06:51

教你用4路运放亲手打造一个3通道混音器电源

教你用4路运放亲手打造一个3通道混音器电源2019年2月“电源”主题精选干货大盘点！电磁干扰学院推荐 | EMC整改–常用小方法文看懂EMC防护器件之TVS...

发表于 01-03 08:09

教你用Word 2010变体字(三两下就搞定)

教你用Word 2010变体字(三两下就搞定) Word的字体可以帮助你干什么？突出你鲜明的个性？让你的文章更加容易阅读？不管它对你有什么益处，多

发表于 04-03 09:12 •2648次阅读

教你用热像仪检测锂电池

教你用热像仪检测锂电池

发表于 02-07 13:26 •13次下载

如何通过pandas读取csv文件指定的前几行？

今天小编给大家分享一篇Python技术开发方面的文章，如何实现pandas读取csv文件指定的前几行，喜欢Python开发的小伙伴下面就随小编一起来了解一下吧。

发表于 09-19 17:43 •16次下载

一步一步教你用Zview拟合交流阻抗谱

一步一步教你用Zview拟合交流阻抗谱(稳压电源技术参数)-一步一步教你用Zview拟合交流阻抗谱

发表于 08-31 13:03 •7次下载

一步一步<b class='flag-5'>教你用</b>Zview拟合交流阻抗谱

介绍Python中常用的文件读取方法以及应用示例

ython 文件读取是 Python 语言中的基本操作之一。在编写Python 程序时，我们经常需要读取不同的文件，例如文本

发表于 04-27 09:16 •1152次阅读

教你用NE555定时器做个防盗报警器

今天继续给大家分享一个小制作，教你用一个简单的方法做一个防盗报警器，我想大家应该都知道现在无论是电动车上还是汽车上都具备防盗报警器

发表于 11-15 14:33 •2029次阅读

<b class='flag-5'>教你用</b>NE555定时器做个防盗报警器

python解析netflow数据到csv的流程详解

本文主要讲解了linux下通过tcpdump抓取netflow数据包，并将其导入到wireshark进行解析，然后通过wireshark导出数据为json文件，再通过python脚本将其解析为csv

发表于 05-01 11:18 •765次阅读

<b class='flag-5'>python</b>解析netflow数据到<b class='flag-5'>csv</b>的流程详解

如何实现Python复制文件操作

Python 中有许多“开盖即食”的模块（比如 os，subprocess 和 shutil）以支持文件 I/O 操作。在这篇文章中，你将会看到一些用

发表于 07-18 14:53 •509次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Python教你用 Rows 快速操作csv文件

评论