文本三剑客-awk

一、awk的介绍

1.1awk的简介

AWK 是一种处理文本文件的语言,是一个强大的文本分析工具

可以在无交互的模式下实现复杂的文本操作

相较于sed常作用于一整个行的处理,awk则比较倾向于一行当中分成数个字段来处理,因为awk相当适合小型的文本数据。

之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符

1.2基本格式

awk -f | -v 脚本文件 文件1 文件.....

1.3awk常见的内置变量

FS∶ 列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
NF∶ 当前处理的行的字段个数。
NR∶ 当前处理的行的行号(序数)。
$0∶当前处理的行的整行内容。
$n∶ 当前处理行的第n个字段(第n列)。
FILENAME∶ 被处理的文件名。
RS∶ 行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’
$NF:最后一段
$(NF-1):倒数第二段

二、打印方法

awk可以将自动将多个空格压缩成一个空格

打印字符串需要加双引号

2.1基础打印

打印其中一列

打印字符串

2.2打印全部

注意:

0 和 1 放置 {} 前,能够起到限制答应的作用(默认为“1”

0是不允许打印读入的内容,1是允许打印的内容

 $0代表整行内容,awk是逐行读取处理,配合$0的效果就是打印文本所有内容

2.3打印行内容及其行号

2.4打印指定行内容

2.5奇偶行打印

2.5.1打印奇数行

先进行awk打印第一行的内容,结束后按照正常顺序打印,但是getline进行跳转,第二行不打印了,最终呈现出奇数行打印

2.5.2打印偶数行

先进行getline跳转至下一行,awk读取跳转后的整行内容,经过逐步跳转读取,形成了只显示偶数行

2.5.3奇偶行打印特殊方式--getline

getline工作过程

1.当getline左右无重定向符号(“<”)或者管道符号(“|”)时,awk首先读取的是第一行,而getline获取的是是光标跳转至下一行的内容(也就是第二行)

原因:getline运行之后awk会改变NF,NR,$0,FNR等内部变量,所以此时读取$0的行号不再为1,而是2。

注意:

FNR:awk当前读取的记录数,其变量值小于等于NR,(比如说当读取完第一个文件后,读取第二个文件,FNR是会从0开始进行,而NR不会)。因此读取两个或两个以上的文件,NR==FNR,可以 判断是不是在读取第一个文件。

2.当getline左右有管道符号或重定向符时,getline则作用定向输入文件,由于文件是刚打开,并没有被awk读入一行,而只是getline读入,所以getline返回的是文件的第一行,而不是跳转至一行输入

2.6条件判断打印

正向判断打印

判断取反打印

还可以直接进行 if 语句判断打印

2.7提取

2.7.1根据$n以及NR提取字段

提取ip地址

提取ipv6地址

2.7.2根据选项-F指定分隔符

以冒号为分隔符,提取第一位即可

2.7.3提取多列内容

以空格符分隔,逗号就是分隔符 

2.7.4提取磁盘已经使用情况,并去除%

第一次以空格为分隔符提取,第二次用-F%分隔提取 

2.7.5匹配以root开头的行

2.7.6匹配以bash结尾的行

2.7.7提取df里面的数字

三、awk的三元表达式

格式:awk     '(条件表达式)?(A表达式或者值):(B表达式或者值)'

四、awk精准筛选

$n (><==)用于对比数值
$n~"字符串"代表第n个字段,包含某个字符串的作用
$n!~"字符串"代表第n个字段,不好含某个字符串的作用
$n=="字符串"代表第n个字段为某个字符串的作用
$n!="字符串"代表第n个字段不为某个字符串的作用
$NF代表最后一个字段

例子:

输出第七个字段包含“bash”所在行的第一个字段和最后一个字段

输出第七个字段不包含“nologin”所在行的第一个字段和最后一个字段

五、内置变量的使用

FS∶ 列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
NF∶ 当前处理的行的字段个数。
NR∶ 当前处理的行的行号(序数)。
$0∶当前处理的行的整行内容。
$n∶ 当前处理行的第n个字段(第n列)。
FILENAME∶ 被处理的文件名。
RS∶ 行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’
$NF:最后一段
$(NF-1):倒数第二段 

5.1NF-当前处理的行的字段个数

5.1.1显示每行有几个字段

5.1.2打印出每行最后一个字段

5.1.3行倒数第二个字段

5.2NR:当前处理行的行号

5.2.1当前处理行的行号

5.2.2NR==n代表行号等于什么

代表取第二行第一个字段

5.2.3NR%2==0取偶数行

5.2.4NR%2==1取奇数行

5.2.5NR==1,NR==4取区间行

5.2.6取UID数值范围$n>1000

六、awk的分隔符

6.1RS指定分隔符

awk 从文件中读取资料时,将根据 RS 的定义把资料切割成许多条记录, 而 awk 一次仅读入一条记录进行处理。内置变量 RS 的预设值是"\n"。

 但是也可以在使用 BEGIN 模式在操作前进行行分隔符的改变。

通过begin模式先在awk命令执行前将分隔符改为  : ,在打印其行号和每一行内容

6.2指定输出的分隔符

6.2.1FS 输入时的列分隔符

6.3awk结合数组运用

6.3.1awk中定义数组打印

变量i读取数组a的下标,可以形成遍历:

6.3.2去重打印数组

七、关系表达式

关系表达式结果为“真”才会被处理

真:结果为非0值,非空字符串

假:结果为空字符串或0值

n=0,第一行为假,不打印

取反

关系表达式打印奇偶数

八、awk脚本

用awk编写脚本

九、试题练习

9.1统计/etc/fstab文件中每个文件系统类型出现的次数

9.2统计/etc/fstab文件中每个单词出现的次数

9.3提取任意字符串中的数字

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/707289.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL已知2商品的总价,求商品的数量

已知商品1和2价格&#xff0c;求商品1的数量&#xff08;商品2的数量自动计算&#xff09;&#xff0c;使得商品总价小于并最接近目标总价的值&#xff1b; 解决&#xff1a; 使用MySQL数据库&#xff1a; -- 创建表 CREATE TABLE products (price_1 INT,price_2 INT,target_p…

回顾程序员18年自己取得的一些成绩有想卖ERP源码的冲动

好久没来csdn发文章&#xff0c;记录自己程序员生涯的心得了&#xff0c;回顾自己2006年湘大信息计算科学专业毕业&#xff0c;当年和班里其他两个同学被招录进富士康&#xff0c;做为新干班签了3年半的合同&#xff0c;在那呆了2年&#xff0c;感觉富士康毕竟是个制造业&#…

HackTheBox-Machines--Bank

文章目录 0x01 信息收集0x02 文件上传漏洞利用0x03 权限提升方法一&#xff1a;SUID提权方法二&#xff1a;配置不当提权 Bank 测试过程 0x01 信息收集 1.端口扫描 发现 ssh(22)、DNS(53)、HTTP(80) 端口 nmap -sC -sV 10.129.29.200访问 80 端口&#xff0c;页面为Apache2 U…

翻译《The Old New Thing》- Stupid debugger tricks: Calling functions and methods

Stupid debugger tricks: Calling functions and methods - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20070427-00/?p27083 Raymond Chen 2007年04月27日 一个比较笨的调试技巧&#xff1a;调用函数和方法 在过去&#xff0c;如果你想在…

大模型时代,交换机技术演变、性能分析、衡量指标

OSI协议及在高性能计算中向RDMA的过渡 协议是为计算机网络内的数据交换而建立的一组规则、标准或协议。在法律层面&#xff0c;OSI七层协议被视为国际标准。该协议于20世纪80年代引入&#xff0c;旨在通过其七层网络模型标准化计算机间通信&#xff0c;以满足开放网络的要求。…

Lazyboy品牌发布会“球幕气膜”

Lazyboy品牌发布会“球幕气膜”为品牌活动提供了一个独特、现代化、环保的展示空间。这座球幕气膜不仅为发布会提供了一个视觉震撼的场地&#xff0c;也为与会嘉宾带来了全新的体验。作为轻空间&#xff08;江苏&#xff09;膜科技有限公司&#xff08;以下简称“轻空间”&…

C++ 数据结构算法 学习笔记(25) - 图及其企业级应用

C 数据结构算法 学习笔记(25) - 图及其企业级应用 图的故事导入 故事情节 Jack 自从买车后&#xff0c;交通出行方便了&#xff0c;心自然就野了&#xff01;身边的各种朋友自然就多了起来&#xff01; 有一天晚上&#xff0c;一个年轻漂亮的女同事生日&#xff0c;Jack 受邀…

可用在vue自动导入的插件unplugin-auto-import

在大多数vue3开发中&#xff0c;基本所有页面都会引用vue3 componsition api&#xff0c;如下代码 想这种vue3 架构中自带的api&#xff0c;如果在全局配置一下的话&#xff0c;就可以减少一部分代码量&#xff0c;只是在代码编译的时候&#xff0c;会添加相应的引用&#xff…

ArcGIS arcpy代码工具——关于标识码的那些事(查找最大标识码、唯一性检查、重排序、空值赋值)

系列文章目录 ArcGIS arcpy代码工具——批量对MXD文件的页面布局设置修改 ArcGIS arcpy代码工具——数据驱动工具批量导出MXD文档并同步导出图片 ArcGIS arcpy代码工具——将要素属性表字段及要素截图插入word模板 ArcGIS arcpy代码工具——定制属性表字段输出表格 ArcGIS arc…

复制即用!纯htmlcss写的炫酷input输入框

一般我们写css样式都要用样式库&#xff0c;但是嫌麻烦&#xff0c;如果能找到现成的内容复制上去就很香了&#xff0c;下文是笔者觉得好看的纯html&css写的样式&#xff0c;可以直接复制到Vue等内&#xff0c;十分方便。 input组件 1&#xff09; 下面这个很推荐&#…

C++的数据结构(九): 笛卡尔树

笛卡尔树&#xff08;Cartesian Tree&#xff09;是一种特殊的二叉树&#xff0c;其每个节点的键值&#xff08;key&#xff09;满足二叉搜索树的性质&#xff0c;即左子树上所有节点的键值小于根节点的键值&#xff0c;右子树上所有节点的键值大于根节点的键值。与此同时&…

C 深入指针(4)

目录 一、字符指针变量 1 初始化 2 与字符串数组的区别 二、数组指针变量 1 初始化 2 二维数组传参本质 三、函数指针变量 1 初始化 2 用法 四、typedef关键字 五、函数指针数组 一、字符指针变量 1 初始化 //VS2022 x64 #include <stdio.h> int main() {…