**sed**
表21-7: sed 地址表示法
地址 说明
n 行号,n 是一个正整数。
$ 最后一行。
/regexp/ 所有匹配一个 POSIX 基本正则表达式的文本行。注意正则表达式通过 斜杠字符界定。选择性地,这个正则表达式可能由一个备用字符界定,通过\cregexpc 来 指定表达式,这里 c 就是一个备用的字符。
addr1,addr2 从 addr1 到 addr2 范围内的文本行,包含地址 addr2 在内。地址可能是上述任意 单独的地址形式。
first~step 匹配由数字 first 代表的文本行,然后随后的每个在 step 间隔处的文本行。例如 1~2 是指每个位于偶数行号的文本行,5~5 则指第五行和之后每五行位置的文本行。
addr1,+n 匹配地址 addr1 和随后的 n 个文本行。
addr! 匹配所有的文本行,除了 addr 之外,addr 可能是上述任意的地址形式。
1041 echo aaa | sed 's|saaa|bbb|'
1042 sed -n '/a/p' a.txt
1043 sed -n '/a/!p' a.txt
基本概念
sed命令的语法如下所示:
sed [-nefr] [动作]
参数说明:
-n : 使用安静模式,一般所有来自STDIN的数据会被列出到屏幕上,但是 -n 在可以只列出经过 sed 处理过的那一行。
-e : 直接在命令行模式上进行 sed 的动作编辑。
-f : 直接将 sed 的动作卸载一个文件内, -f filename 则可以执行 filename 内的 sed 动作。
-r : sed 的动作支持的是扩展型正则表达式的语法(默认是基础正则表达式语法)。
-i : 直接修改读取的文件内容,而不是由屏幕输出。
动作说明: [n1],[n2] function
n1,n2:不见得会存在,一般代表选择进行动作的行数。
举例来说:如果我的动作是需要在 10 到 20 行之间进行的,则“10,20[动作行为]”
function 有下面这些参数:
a:新增,a 的后面可以接字符串,而这些字符串会在新的一行出现(目前的下一行)。
c:替换,c 的后面可以接字符串,这些字符串可以替换n1,n2之间的行!
d:删除,因为是删除,所以 d 后面通常不接任何参数。
i:插入,i 的后面可以接字符串,而这些字符串会在新的一行出现(目前的上一行)。
p:打印,也就是将某个选择的数据打印出来,通常 p 会与参数 sed -n 一起运行。
s:替换,可以直接进行替换工作。通常这个 s 的动作可以匹配正则表达式!
例如:1,20s/old/new/g 就是。
关于 sed 的一些常见使用
以行为单位的新增或删除功能
案例(一)
nl /etc/passwd | sed '2,5d'
说明:
sed 的动作为 '2,5d',那个 d 就是删除,命令运行的效果就是把2~5行给删除。
需要注意的是,原本应该是要执行 sed -e 才对,没有 -e 也行。
另外还需要注意的一点:sed 后面接的动作,请务必要以 '' 两个单引号括住。
如果你只想删除第二行,那么命令就是:nl /etc/passwd | sed '2d'。
如果你想删除第三行到最后一行,那么就可以这么写:nl /etc/passwd | sed '3,$d'
注:$表示最后一行。
案例(二)
nl /etc/passwd | sed '2a drink tea'
说明:
命令执行的效果就是在第二行后面(也就是第三行)加上“drink tea”字样。
如果你想在第二行前面加上字符串,那么你可以这样:nl /etc/passwd | sed '2i drink tea'
注:2a 中的 a 是指第二行后面,而 2i 中的 i 则是指第二行的前面。
案例(三)
nl /etc/passwd | sed '2a drink tea or ......\
drink beer'
说明:
上面的命令的执行效果是在第二行后面加入2行字。
在每一行的后面必须要以反斜杠 来进行新行的增加。
以行为单位的替换与显示功能
案例(一)
nl /etc/passwd | sed '2, 5c No 2-5 number'
说明:
上面的命令的执行效果是将第2~5行的内容替换成“No 2-5 number”
案例(二)
nl /etc/passwd | sed -n '5,7p'
说明:
上面的命令执行的效果是仅列出文件中的第5~7行的内容。
命令中的 -n 代表的是安静模式!但是这个参数建议加上。
案例(三)
sed 's/要被替换的内容/新的内容/g'
说明:
以上命令执行的效果就是替换掉指定内容。
案例(四)
下面是记录一次获取IP数据的过程:
第一步:先查看源信息,利用 /sbin/ifconfig 查询 IP。
/sbin/ifconfig eth0
注:我们的目的是要获得IP数据,那么先利用关键字找出那一行。
第二步:利用关键字配合 grep 选取出关键的一行数据。
/sbin/ifconfig eth0 | grep 'inet addr'
注:因为只需要IP数据,所以接下来就是把不需要的内容都删掉,那么就需要一个正则表达式来帮助实现:
^.*inet addr:
第三步:将 IP 前面的部分予以删除
/sbin/ifconfig eth0 | grep 'inet addr' | \
sed 's/^.*inet addr://g'
注:上面的命令就把 IP 前面的数据删掉了,那么接下来就是把 IP 后面的数据也删掉,此时的正则表达式则是:
Bcast.*$
第四步:将 IP 后面的部分予以删除
/sbin/ifconfig eth0 | grep 'inet addr' | \
sed 's/^.*inet addr://g' | sed 's/Bcast.*$//g'
这样就能把 IP 截取出来了~~~
案例(五)
这里主要是展示 sed 与正则表达式的配合使用。
假设我想在一个文件(你自己新建或者已有的,主要是测试而已)获取MAN字样的那几行数据,但是#在内的批注我不需要,而且空白行也不要。
第一步:先使用 grep 将关键字 MAN 所在行取出来。
cat /home/man.config | grep 'MAN'
第二步:删除掉批注之后的数据。
cat /home/man.config | grep 'MAN' | sed 's/#.*$//g'
第三步:那么接下来就是把空白行删除掉。
cat /home/man.config | grep 'MAN' | sed 's/#.*$//g' | \
sed '^$/d'
直接修改文件内容(慎重)
首先要特别提醒的是,要练习 sed 修改文件内容的时候不能用任何系统配置文件,最好是自己新建一个测试文本来测试练习。
案例(一)
sed -i '/s\.$/\!/g' test.txt
说明:
上面命令执行效果是利用 sed 将test.txt内的每一行结尾为“.” 的换成 !
命令中的 -i 参数可以让你的 sed 直接去修改后面接的文件内容,而不是由屏幕输出。
案例(二)
sed -i '$a # This is a test' test.txt
说明:
上面命令执行的效果是利用 sed 直接在test.txt最后一行加入 “This is a test”。
由于 $ 代表的是最后一行,而 a 的操作是新增,因此该文件最后新增。
什么是 awk
简单来说,awk 是一个数据处理工具。
相比于 sed 常常作用于一整行的处理,awk 则比较倾向于将一行分成数个“字段”来处理。因此,awk 相当适合处理小型数据的数据处理。
对于编程语言来讲,awk 是一种便于使用且表达能力强的程序设计语言,可应用于各种计算和数据处理任务。
基本概念
基本语法
awk '条件类型1{动作1} 条件类型2{动作2} ...' filename
awk 后面接两个单引号病加上大括号{}来设置想要对数据进行的处理动作。
awk 可以处理后续接的文件,也可以读取来自签个命令的 standardoutput。
如前面说的,awk 主要是处理每一行的字段内的数据,而默认的字段的分隔符为空格键或者[tab]键。 比如:
last -n 5 // 仅取出登陆者的数据前五行(last 可以将登陆者的数据取出来)
如果我还要在这些信息中取出:账号与登陆者的IP,且账号与IP之间以[tab]隔开,那么可以这么改命令:
last -n 5 | awk '{print $1 "\t" $3}'
上面是 awk 最常使用的动作,通过 print 的功能来讲字段的数据列出来,字段的分割则以空格键或者[tab]按键来隔开。
上面的例子中,在每一行的每个字段都是有变量名称的,那就是$1,$2等变量名称。
备注:$1 指的就是第一列,但是 $0 则是代表一整行(第一行)。
上面的例子中整个awk的处理流程:
(1)读入第一行,并将第一行的数据填入$0,$1,$2等变量中;
(2)依据条件类型的限制,判断是否需要进行后面的动作;
(3)昨晚所有的动作与条件类型;
(4)若还有后续的“行”的数据,则重复上面1~3的不知,直到所有的数据都读完为止。
注:awk是以行为一次处理的单位,而以字段最小的处理单位。
对于上面的案例指令 last -n 5 ... 来讲,有几点需要注意的:
列出每一行的账号(就是$1)。
列出目前处理的行数(那就是 awk 内的 NR 变量)。
并且说明,该行有多少个字段(就是 awk 内的 NF 变量)。
注意: awk 后续的所有动作都是以单引号 “'” 括住的,由于单引号与双引号都必须是成对的,所以 awk 的格式内容如查想要以 print 打印时,记得非变量的文字部分,包含一小节 printf 提到的格式中,都需要使用双引号来定义出来,因为单引号已是 awk 的命令固定用法了。
last -n 5 | awk '{print $1 "\t lines: " NR "\t lines: " NR "\t columes: " NF}'
awk的一些常见使用
awk 的运算符
大于: >
小于: <
大于或等于: >=
小于或等于: <=
等于: ==
不等于: !=
值得关注的是那个等于 “==” 的符号,因为:
逻辑运算上面也就是所谓的大于,小于,等于等判断式上面,习惯上是以“==”来表示的。
如果是直接给与一个值,例如变量设置时,就直接使用 = 而已。
案例(一)
cat /etc/passwd | \
awk '{FS=":"} $3 < 10 {print $1 "\t " $3}'
说明:上面的指令运行的效果是查阅第三列小于10以下的数据,并且仅列出账号与第三列。(在 /etc/passwd 当中是以冒号“:”来作为字段的风,该文件中第一字段为账号,第三字段则是UID)
案例(二)
cat /etc/passwd | \
awk 'BEGIN {FS":"} $3 < 10 {print $1 "\t " $3}'
说明:由于案例一中并没有显示出第一行的数据,那么此命令则是把第一行也显示出来了。利用 BEGIN 关键字预先设置 awk 的变量。
案例(三)
此外 awk 还可以进行“计算功能”。
比如有一个文件,内容如下:
name 1st 2nd 3th
小A 1000 1000 1000
小B 2000 2000 2000
小C 3000 3000 3000
那么怎么计算每个人的总额呢?而且还需要格式化输出,那么可以这样思考:
第一行只是说明,所以第一行不要进行加总(NR==1时处理)。
第二行以后就会有加总的情况出现(NR>=2以后处理)。
cat test.txt | \
awk 'NR==1{printf "%10s %10s %10s %10s %10s\n",$1,$2,$3,$4, "Total" }
NR>2{total = $2 + $3 + $4
printf "%10s %10d %10d %10.2f\n", $1, $2, $3, $4, total}'
说明:
所有 awk 的动作(即在{}内的动作),如果有需要多个命令来辅助是,可利用分号“;”间隔,或者直接以[Enter]按键来隔开每个命令,上面则是摁了三次。
逻辑运算中,如果是“等于”的情况,则务必使用两个等号“==”!
格式化处输出时,在 printf 的格式设置当中,务必加上 n ,才能实现分行。
与 bash 、shell 的变量不同,在 awk 当中,变量可以直接使用,不需要加上 $ 符号。
- 关于我
- laravel
- quickstart
- quickstart-intermediate
- swoole
- (一)快速起步
- php7
- swoole异步高性能
- 开发中常见问题
- event扩展的安装
- phptrace
- 用C/C++写php扩展
- 无聊的笔试题
- rewrite二级目录转二级域名
- php多进程
- rpc-yar
- php专家列表
- php守护进程
- php函数防止超时
- php分析报错信息
- gdb调试php
- php-cli模式
- composer/pear
- 基础
- sublime+xdebug
- 开启opcache
- 前端
- js
- linux
- Xshell连接不上Ubuntu解决方式
- xshell
- centos安装中文输入
- centos下安装谷歌浏览器
- centos安装phpstorm
- php7之phpredis安装
- 磁盘大小
- dns
- TCP/IP协议
- HTTP
- tcpdump
- zbacktrace
- gdb调试php扩展
- lsof
- perf
- lnmp
- first
- 重定向
- echo
- 键盘高效操作
- 权限控制
- 进程
- 环境变量
- vi
- 软件包管理
- 网络
- 查找文件
- 压缩
- 正则
- sed/awk
- 编译程序
- shell脚本
- shell认识
- sh脚本
- sh调试相关
- win共享文件夹给虚拟机
- git
- git的安装
- 常用命令
- 本地到远程仓库
- 远程到本地仓库
- 分支管理
- bug分支
- feature
- 标签
- 多人协作
- FAQ
- C/C++
- 难点
- 修饰符
- 数组
- 字符串
- 指针
- 引用
- 面向对象
- 类访问修饰符
- 构造函数
- 操作文件
- mysql集群
- 使用navicat操作MySQL数据库能不能整个数据库搜索一条数据?
- 帮助的使用
- 存储引擎的选择
- 数据类型/字符集
- 索引
- kafka集群
- rabbitmq集群
- (一)初识rabbitmq
- (二)原理
- (三)消息模型
- (四)rabbitmq&php基础
- (五)持久化&route&指定exchange
- (六)发布订阅
- (七)route key
- (八)topic
- elasticsearch集群
- (一)服务端搭建
- (二)elasticsearch&php
- (三)head插件
- redis集群
- github
- 设计模式
- createType
- factory_method.php
- abstract_factory.php
- mysql_singleton.php
- builder.php
- prototype.php
- structType
- adapter.php
- 数据结构与算法
- python