一、前言
- AWK 是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。
- AWK 的处理文本和数据的方式是这样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出(屏幕),如果没有指定模式,则所有被操作所指定的行都被处理。awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人,分别是Alfred Aho、Brian Kernighan、Peter Weinberger。
二、工作原理
[root@localhost ~]# awk -F: '{print $1}' passwd.txt
root
bin
daemon
adm
lp
sync
shutdown
halt
mail
operator
- (1)awk使用一行作为输入,并将这一行赋给内部变量$0,每一行也可称为一个记录,以换行符结束
- (2)然后,行被:(默认为空格或制表符) 分解成字段(或域),每个字段存储在已编号的变量中,从$1开始, 最多达100个字段
- (3)awk输出之后,将从文件中获取另一行,并将其存储在$0中,覆盖原来的内容,然后将新的字符串分隔 成字段并进行处理。该过程将持续到所有行处理 完毕
三、语法
awk [options] 'commands' filenames
options: 例如:- F定义输入字段分隔符,默认的分隔符是空格或制表符(tob)
command(时空):BEGIN{} {} END{}
BEGIN{}:begin发生在行处理前(注意大写)
{}:行处理时,读一行执行一次
END{}:行处理后
四、示例
[root@localhost ~]# awk -F: 'BEGIN{print 1/2}{print $0}END{print "-------"}' passwd.txt
0.5
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin10
-------
[root@localhost ~]# awk -F: 'BEGIN{print "awk工作开始"}{print $0}END{print "awk工作结束"' passwd.txt
awk工作开始
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin10
awk工作结束