0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么说每个Linux极客都需要了解Sed和Awk

jf_ZqFkd6Up 来源:Linux迷 作者:Linux迷 2022-11-22 11:24 次阅读
sed 和 awk 是每个 Linux 高级用户最喜欢的工具。但它们是什么?以及如何使用它们来处理文本文件?两个最被低估的 Linux 实用程序是 sed 和 awk。尽管它们看起来有点神秘,但如果您必须对大段代码或文本进行重复更改,或者如果您必须分析某些文本,sed 和 awk 是极为有用的。那么,它们是什么?它们是如何使用的?以及,当它们组合在一起时,它们如何使处理文本变得更容易?

什么是sed?

sed 由传奇的计算先驱 Lee E. McMahon 于 1971 年在贝尔实验室开发。该名称代表“流编辑器”。sed 允许您通过一种紧凑而简单但图灵完备的编程语言以编程方式编辑正文或文本流。sed 的工作方式很简单:它将文本逐行读取到缓冲区中。对于每一行,它将在适用的情况下执行预定义的指令。例如,如果有人要编写一个 sed 脚本,将单词“beer”替换为“soda”,然后传入一个包含“99 Bottles of Beer on the Wall”完整歌词的文本文件,它将通过逐行打印该文件,并打印出“99 Bottles of Soda on the Wall”,依此类推。最基本的 sed 脚本是“Hello World”。在这里,我们使用仅输出字符串的 echo 命令来打印“Hello World”。但是我们将它传递给 sed,并告诉它用“LinuxMi.com”替换“World”。一目了然。

		
			
linuxmi@linuxmi:~/www.linuxmi.com$ echo "Hello World" | sed s/World/LinuxMi.com/

		38900f7a-6a13-11ed-8abf-dac502259ad0.png如果您需要进行一些更复杂的编辑,您还可以将 sed 指令组合到文件中。让我们将 A-ha 的“ Take On Me ”的歌词替换为Greg的“I”、“Me”和“My”的每个实例。首先,将歌曲的歌词放入名为linuxmi.com.txt的文本文件中。然后打开您喜欢的文本编辑器,并添加以下行。确保您创建的文件以.sed结尾。

		
s/I/Greg/
s/Me/Greg/
s/me/Greg/
s/My/Greg/
s/my/Greg/
您可能会注意到上面示例中的重复(例如 s/me/Greg/ 和 s/Me/Greg/)。这是因为 sed 的某些版本,例如 macOS 附带的版本,不支持不区分大小写的匹配。因此,我们必须为每个单词编写两条指令,以便 sed 识别大写和非大写版本。这不会完美地工作,就好像您已经手动替换了“I”、“Me”和“My”的每个实例。请记住,我们只是将其用作练习来演示如何将 sed 指令组合到一个脚本中,然后使用单个命令执行它们。然后,我们需要调用该文件。为此,请运行此命令。

		
			
linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.com.txt | sed -f linuxmi.sed
让我们看看这是怎么做的。你可能已经注意到我们这里没有使用 echo。我们使用 cat。这是因为 cat 会打印文件的全部内容,而 echo 只会打印文件名。您可能还注意到,我们使用“-f”标志运行 sed。这告诉它将脚本作为文件打开。
最终结果是这样的:38adde92-6a13-11ed-8abf-dac502259ad0.png还值得注意的是 sed 支持正则表达式 (REGEX)。这些允许您使用特殊而复杂的语法在文本中定义模式。这是一个如何工作的示例。我们将采用上述歌词,但使用正则表达式打印出每行不以“Take”开头的行。

		
			
linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.com.txt | sed /^Take/d

		38d81bda-6a13-11ed-8abf-dac502259ad0.png当然,sed 非常有用。而且与 awk 结合使用时会更加强大。

什么是 AWK?

AWK 与 sed 一样,是一种处理大量文本的编程语言。但是,虽然人们使用 sed 来处理和修改文本,但人们大多使用 AWK 作为分析和报告的工具。与 sed 一样,AWK 最初是在 1970 年代在贝尔实验室开发的。它的名字并非来自程序所做的事情,而是来自每个作者的姓氏:Alfred Aho、Peter Weinberger 和 Brian Kernighan。总而言之,AWK 指的是编程语言本身。在小写中,awk 指的是命令行工具。AWK 通过一次读取一行文本文件或输入流来工作。扫描每一行以查看它是否与预定义的模式匹配。如果找到匹配项,则执行操作。但是虽然 sed 和 AWK 可能有相似的目的,但它们是两种完全不同的语言,具有两种完全不同的设计理念。AWK 更类似于一些通用语言,如 C、Python 和 Bash。它具有诸如函数之类的东西以及更类似于 C 的方法来处理诸如迭代和变量之类的东西。简而言之,AWK 感觉更像是一种编程语言。所以,让我们尝试一下。使用“Take On Me”的歌词,我们将打印所有超过 20 个字符的行。

		
			
linuxmi@linuxmi:~/www.linuxmi.com$ awk ' length($0) > 20 ' linuxmi.com.txt

		38fe5f52-6a13-11ed-8abf-dac502259ad0.png

结合两者

awk 和 sed 结合起来都非常强大。您可以通过使用 Unix 管道来做到这一点。让我们试试这个:我们将使用 awk 列出“Take On Me”中超过 20 个字符的所有行。然后,我们将删除所有以“Take”开头的行。总之,这一切看起来像这样:

		linuxmi@linuxmi:~/www.linuxmi.com$ awk 'length($0)>20' linuxmi.com.txt | sed /^Take/d输出如下:392962d8-6a13-11ed-8abf-dac502259ad0.png

sed 和 awk 的力量

在这篇文章中我们就解释这么多,但希望您现在对 sed 和 awk 的强大功能有所了解。简而言之,它们是一个文本处理引擎。那么,你为什么要关心呢?除了您永远不知道何时需要对文本文档进行可预测的重复更改这一事实之外,sed 和 awk 非常适合解析日志文件。当您尝试调试 LAMP 服务器中的问题或查看访问日志以查看您的服务器是否被黑客入侵时,这特别方便。


审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11324

    浏览量

    209950
  • 编程语言
    +关注

    关注

    10

    文章

    1947

    浏览量

    34845
  • SED
    SED
    +关注

    关注

    0

    文章

    25

    浏览量

    27094

原文标题:为什么说每个 Linux 极客都需要了解 Sed 和 Awk

文章出处:【微信号:Linux迷,微信公众号:Linux迷】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    芯享程半导体发布AWK6809高性能车规级DC-DC芯片

    近日,上海芯享程半导体有限公司正式推出了其最新研发成果——AWK6809高性能车规级同步降压型芯片。这款芯片以其出色的性能、低功耗以及卓越的EMI特性,在工业和汽车市场引起了广泛关注
    的头像 发表于 01-03 14:07 153次阅读

    AWK工具介绍

    awk是什么 awk是一个强大的linux命令,有强大的文本格式化的能力,好比将一些文本数据格式化成专业的excel表的样式。 awk早期在Unix上实现,我们用的
    的头像 发表于 12-17 11:21 137次阅读
    <b class='flag-5'>AWK</b>工具介绍

    Linux三剑客之Sed:文本处理神器

    关于linux三剑客 grep,过滤关键字信息数据。主要是用于查文本内的数据 sed ,对文本数据进行编辑,修改原文件内容 awk,对文件数据过滤,提取,并且能实现,格式化输出 awk
    的头像 发表于 12-16 15:58 262次阅读
    <b class='flag-5'>Linux</b>三剑客之<b class='flag-5'>Sed</b>:文本处理神器

    飞凌嵌入式ElfBoard ELF 1板卡-Linux内核移植之内核简介

    学到本章节,大家应该对Linux操作系统都有了一定的了解,但可能还不知道我们拿到手的内核源码都经历了什么。linux有一个庞大的开源社区,每个人都可以向开源社区提交代码。由于
    发表于 12-13 09:03

    如何掌握Linux文本处理

    目录 sed用法 模式空间与保持空间 sed命令选项 sed命令的基本语法 sed命令选项 基础sed命令 高阶
    的头像 发表于 11-10 13:40 199次阅读

    linux驱动程序如何加载进内核

    需要了解Linux内核的基本概念和API。以下是一些关键概念: 1.1 内核模块:Linux内核模块是一种动态加载和卸载的代码,可以在不重新启动系统的情况下加载和卸载。驱动程序通常以内核模块的形式实现。 1.2 设备模型:
    的头像 发表于 08-30 15:02 527次阅读

    USB 3.2双通道操作:您需要了解的内容

    电子发烧友网站提供《USB 3.2双通道操作:您需要了解的内容.pdf》资料免费下载
    发表于 08-30 10:09 0次下载
    USB 3.2双通道操作:您<b class='flag-5'>需要了解</b>的内容

    要了解下大模型知识

    工作需要,想要了解一下大模型算力建设知识。
    发表于 08-20 15:31

    不只是前端,后端、产品和测试也需要了解的浏览器知识(二)

    继上篇《 不只是前端,后端、产品和测试也需要了解的浏览器知识(一)》介绍了浏览器的基本情况、发展历史以及市场占有率。 本篇文章将介绍浏览器基本原理。 在掌握基本原理后,通过技术深入,在研发
    的头像 发表于 08-12 14:32 369次阅读
    不只是前端,后端、产品和测试也<b class='flag-5'>需要了解</b>的浏览器知识(二)

    不只是前端,后端、产品和测试也需要了解的浏览器知识

    一、我们为什么要了解浏览器? 1. 对于前端开发者 1.浏览器是用户体验的第一线。我们需要了解浏览器的工作原理,才能有效地设计和实现用户界面,确保良好的用户体验。 2.好的产品需要考虑浏览器兼容性
    的头像 发表于 07-01 18:03 489次阅读
    不只是前端,后端、产品和测试也<b class='flag-5'>需要了解</b>的浏览器知识

    学习串口屏需要了解哪些方面的知识

    学习串口屏需要掌握的知识主要包括以下几个方面
    的头像 发表于 06-05 09:41 462次阅读
    学习串口屏<b class='flag-5'>需要了解</b>哪些方面的知识

    选择贴片电容时需要了解哪些问题?

    购买贴片电容时,需要了解以下几个方面: 1、电容类型与规格:贴片电容有多种类型,如陶瓷电容器、铝电解电容器、钽电解电容器、多层陶瓷电容器(MLCC)以及聚合物电容器等。每种类型都有其特定的应用场
    的头像 发表于 03-29 15:45 386次阅读

    CS32L010 Deepsleep 模式下,保留 GPIO/AWK 唤醒,低功耗电流是多少?

    CS32L010 Deepsleep 模式下,保留 GPIO/AWK 唤醒,低功耗电流是多少? 答:大概是1.0uA
    发表于 03-22 11:33

    电源测试需要用到哪些计算公式?

    在电源模块测试过程中不仅要了解测试过程和步骤,对于一些测试项目而言还需要了解其正确的计算测试方法,得到准确的测试结果。
    的头像 发表于 03-13 14:32 550次阅读

    mos管体二管的作用是什么

    的。在功率MOSFET中,这种体二管尤为重要,因为它对器件的性能和可靠性有很大影响。 要了解MOS管体二管的作用,首先需要了解MOSFET的基本结构。一个典型的MOSFET包括源
    的头像 发表于 01-31 16:28 6500次阅读
    mos管体二<b class='flag-5'>极</b>管的作用是什么