文件查看命令 · PHP知识总结

[TOC] # 1、查看文件内容或者合并文件：cat [-AbeEnstTuv] [--help] [--version] fileName > * -n 或 --number：由 1 开始对所有输出的行数编号。 > * -b 或 --number-nonblank：和 -n 相似，只不过对于空白行不编号。 > * -s 或 --squeeze-blank：当遇到有连续两行以上的空白行，就代换为一行的空白行。 > * -v 或 --show-nonprinting：使用 ^ 和 M- 符号，除了 LFD 和 TAB 之外。 > * -E 或 --show-ends: 在每行结束处显示 $。 > * -T 或 --show-tabs: 将 TAB 字符显示为 ^I。 > * -A, --show-all：等价于 -vET。 > * -e：等价于"-vE"选项； > * -t：等价于"-vT"选项； | 命令 | 注释 | | --- | --- | | cat textfile |把textfile的文档内容输出打印出来 | | cat -n textfile1 > textfile2 | 把 textfile1 的文档内容加上行号后输入 textfile2 这个文档里 | | cat -b textfile1 textfile2 > textfile3 | 把 textfile1 和 textfile2 的文档内容加上行号（空白行不加）之后将内容附加到 textfile3 文档里 | | cat /dev/null > textfile2 | 清空textfile2文档内容| # 2、显示文件的详细信息：stat [option] filename > * -f ：不显示文件本身的信息，显示文件所在文件系统的信息 > * -t：以更简洁的方式输出，只显示摘要信息 > * -c：格式化输出。如 stat -c 格式代码 filename |-c：格式化输出参数 |注释| | ---| ---| |%A| 用文件权限代码表示，如-rw-r--r-- | |%a| 用八进制数字表示文件权限 | |%b| 占用的区块数量 | |%B| 用%b计算区块数量时，每一区块的大小，预设是512bytes | |%D| 用16进制表示设备编号 | |%d| 用10进制表示设备编号 | |%F|显示文件形态，即文件类型| |%f|raw mode以16进制表示| |%G| 文件拥有者的组名| |%g|文件拥有着的群组编号| |%h|硬链接的数量| |%i|inode编号| |%N|将符号链接的文件明和其指向的文件的文件名，用引号包含，'1.sh'->'h.sh'| |$n|文件名| |%o|IO区块的大小，预设是4096bytes| |%s|文件大小| |%T|16进制表示Minor次要设备代码| |%t|16进制表示Major主要设备代码| |%U|文件拥有者的使用者名称| |%u|文件拥有者的使用者编号| |%X|访问时间，时间戳显示| |%x|访问时间| |%Y|修改时间，时间戳显示| |%y|修改时间| |%Z|最近改动时间，时间戳显示| |%z|最近改动时间| ![](https://img.kancloud.cn/b5/62/b562f8dba415d52942ed06d829160d68_567x174.png) 简单的介绍一下stat命令显示出来的文件其他信息： File：显示文件名，Size：显示文件大小，Blocks：文件使用的数据块总数，IO Block：IO块大小，regular file：文件类型（常规文件），Device：设备编号，Inode：Inode号，Links：链接数，Access：文件的权限，Gid、Uid：文件所有权的Gid和Uid，以及linux下的三个时间： 1、 Access Time（访问时间）：简写为atime，表示文件的访问时间。当文件内容被访问时，更新这个时间 2、Modify Time（修改时间）：简写为mtime，表示文件内容的修改时间，当文件的数据内容被修改时，更新这个时间。 3、 Change Time（最近改动时间）：简写为ctime，表示文件的状态时间，当文件的状态被修改时，更新这个时间，例如文件的链接数，大小，权限，Blocks数。 > 1、当读取文件时，access time会发生改变，modify、change time会发生改变 > 2、当修改文件时，acces、modify、change time都会发生改变 > 3、当修改属性时，change time会发生改变，access、modify time不会发生改变 > 4、more、less、cat、tail 等命令会改变 access time，ls、stat命令不会改变access time > 5、通过 chown、chmod修改文件属性时，会更新change time，touch命令会同时更新这三个时间 |命令|注释| | ---| ---| |stat test.txt| 显示文件的详细信息| |stat -c %a%A test.txt | 644-rw-r--r\-\- | |ls -lc test.txt | 查看文件的最近改动时间（change time） | |ls -lu test.txt | 查看文件的最近访问时间（access time） | |ls -l test.txt | 查看文件的最近修改时间（modify time） | # 3、只查看文件的开头部分的内容：head [option] [文件] > * -q 隐藏文件名 > * -v 显示文件名 > * -c 显示的字节数。 > * -n 显示的行数。默认为 10，即显示 10 行的内容。 | 命令 | 注释 | | --- | --- | | head -c 20 text.txt |显示文件前 20 个字节 | | head -n 20 text.txt |显示文件前 20 行 | # 4、查看文件最尾部的内容：tail [option] [文件] > * -f 循环读取 > * -q 不显示处理信息 > * -v 显示详细的处理信息 > * -c 显示的字节数 > * -n 显示文件的尾部 n 行内容 > * --pid=PID 与-f合用,表示在进程ID,PID死掉之后结束 > * -q, --quiet, --silent 从不输出给出文件名的首部 > * -s, --sleep-interval=S 与-f合用,表示在每次反复的间隔休眠S秒 | 命令 | 注释 | | --- | --- | | tail -f filename |把 filename 文件里的最尾部的内容显示在屏幕上，并且不断刷新，只要 filename 更新就可以看到最新的文件内容 | | tail notes.log |显示 notes.log 文件的最后 10 行 | |tail -c 10 notes.log|显示文件 notes.log 的最后 10 个字符| # 5、显示文件属性：lsattr [-adlRvV][文件或目录...] >* -a 　显示所有文件和目录，包括以"."为名称开头字符的额外内建，现行目录"."与上层目录".."。 >* -d 　显示，目录名称，而非其内容。 >* -l 　此参数目前没有任何作用。 >* -R 　递归处理，将指定目录下的所有文件及子目录一并处理。 >* -v 　显示文件或目录版本。 >* -V 　显示版本信息。 | 命令 | 注释 | | --- | --- | | lsattr test | 显示test文件的文件属性 | # 6、改变文件属性：chattr [-RV][-v<版本编号>][+-=<属性>][文件或目录...] > 这项指令可改变存放在ext2文件系统上的文件或目录属性，这些属性共有以下8种模式： > 1. a：让文件或目录仅供附加用途。 > 2. b：不更新文件或目录的最后存取时间。 > 3. c：将文件或目录压缩后存放。 > 4. d：将文件或目录排除在倾倒操作之外。 > 5. i：不得任意更动文件或目录。 > 6. s：保密性删除文件或目录。 > 7. S：即时更新文件或目录。 > 8. u：预防意外删除。 > > 参数： >* -R 递归处理，将指定目录下的所有文件及子目录一并处理。 >* -v 设置文件或目录版本。 >* -V 显示指令执行过程。 >* +开启文件或目录的该项属性。 >* -关闭文件或目录的该项属性。 >* = 指定文件或目录的该项属性。 | 命令 | 注释 | | --- | --- | | chattr +i test.txt | 用chattr命令防止系统中某个关键文件被修改。此时使用lsattr命令查看属性：----i--------e-- test.txt | | chattr +a text.txt | 让某个文件只能往里面追加数据，但不能删除，适用于各种日志文件。此时使用lsattr命令查看属性：----a--------e-- test.txt | # 7、统计文件的字数：wc [-clw][文件] > * \-c或--bytes或--chars 只显示Bytes数。 >* \-l或--lines 只显示行数。 >* \-w或--words 只显示字数。 | 命令 | 注释 | | --- | --- | | wc test.log | 默认的情况下，wc将计算指定文件的行数、字数，以及字节数 | |cat /proc/cpuinfo \| grep 'core id' \| sort -u\| wc -l | 与grep配合使用，统计文件内某字符的行数，此命令为查询cpu核数| # 8、查看文本汇总的重复列：uniq [-cdu][-f<栏位>][-s<字符位置>][-w<字符位置>][输入文件][输出文件] > 注意：该命令是用于去掉文件中相邻数据重复的行，经常与sort命令配合使用 >* \-c 在每列旁边显示该行重复出现的次数。 >* \-d 仅显示重复出现的行列。 >* \-f 忽略比较指定的栏位。 >* \-s 忽略比较指定的字符。 >* \-u 仅显示出一次的行列。 >* \-w 指定要比较的字符。 >* \[输入文件\] 指定已排序好的文本文件。如果不指定此项，则从标准读取数据； >* \[输出文件\] 指定输出的文件。如果不指定此选项，则将内容显示到标准输出设备（显示终端） | 命令 | 注释 | | --- | --- | |uniq test.log| 打印删除重复行之后的结果| |uniq -u test.log| 打印出文本中仅出现一次的行| |uniq -c test.log test1.log| 检查文件并删除文件中重复出现的行，并在行首显示该行重复出现的次数，并将结果输入至test1.log文件中| |sort test.log \| uniq| 如果文件内重复行并不相邻，uniq 命令是不起作用的，需要先用sort进行排序，再使用uniq命令| # 9、排序文本内容：sort [-bcdfimMnr][-o<输出文件>][-t<分隔字符>][+<起始栏位>-<结束栏位>][文件] >* \-b 忽略每行前面开始出的空格字符。 >* \-c 检查文件是否已经按照顺序排序。 >* \-d 排序时，处理英文字母、数字及空格字符外，忽略其他的字符。 >* \-f 排序时，将小写字母视为大写字母。 >* -h 按照文件大小倒叙显 >* \-i 排序时，除了040至176之间的ASCII字符外，忽略其他的字符。 >* \-m 将几个排序好的文件进行合并。 >* \-M 将前面3个字母依照月份的缩写进行排序，比如JAN小于FEB。 >* \-n 依照数值的大小排序。 >* \-u 去重排序。 >* \-o 将排序后的结果存入指定的文件。 >* \-r 降序排序，默认的排序方式是升序。 >* \-t 指定排序时所用的栏位分隔字符 >* -k 定义排序键值字段，当出现多个-k选项时候，会先从第一个键值开始排序，找出匹配该键值的记录后，再进行第二个键值字段的排序，以此类推 | 命令 | 注释 | | --- | --- | |sort test.log|默认情况下，将文本内容的第一列以ASCII 码的次序排列| |sort -o test1.log -u test.log | 去重排序test.log内容，并将结果保存至test1.log | ``` // -t与-k参数使用实例 [root@izwz91quxhnlkan8kjak5hz ~]# cat test google:150:2000 baidu:100:3000 sougou:90:4000 sohu:100:4500 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k 2n test // 以冒号隔开的第二个字段以整数类型进行排序 sougou:90:4000 baidu:100:3000 sohu:100:4500 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k2n -k3nr test // 以冒号隔开的第二个字段进行排序，当数值相等时，以第三个字段进行排序 sougou:90:4000 sohu:100:4500 baidu:100:3000 google:150:2000 [root@izwz91quxhnlkan8kjak5hz ~]# sort -t : -k1.1 test // 以冒号隔开的第一个字段的第一个字母进行排序 baidu:100:3000 google:150:2000 sohu:100:4500 sougou:90:4000 ``` # 10、显示每行从开头算起 num1 到 num2 的文字：cut [option] 文件 >* \-b ：以字节为单位进行分割。这些字节位置将忽略多字节字符边界，除非也指定了 -n 标志。 >* \-c ：以字符为单位进行分割（适用于中文）。 >* \-d ：自定义分隔符，默认为制表符。 >* \-f ：与-d一起使用，指定显示哪个区域。 > * -n ： > * n：只有第n项 > * n-:从第n项一直到行尾 > * n-m：从第n项到第m项(包括m) > * -m：从一行的开始到第m项(包括m) > * -：从一行的开始到结束的所有项 | 命令 | 注释 | | --- | --- | | head -5 /etc/passwd \| cut -d : -f 1,3-5| 以冒号隔开的passwd文件前五行内容，显示第一、第三至五项字段 | | head -5 /etc/passwd \| cut -b 1-3| 取每行的第1-3字字节 | # 11、文本处理文件：awk '{[pattern] action}' {filenames} > option： > * \-F fs or --field-separator fs：指定输入文件折分隔符，fs是一个字符串或者是一个正则表达式，如-F: > * \-v var=value or --asign var=value：赋值一个用户定义变量 > * \-f scripfile or --file scriptfile：从脚本文件中读取awk命令 > > 脚本关键字： > * BEGIN{ 这里面放的是执行前的语句 } > * END {这里面放的是处理完所有的行后要执行的语句 } > * {这里面放的是处理每一行时要执行的语句} > > 内建变量： > * $n：当前记录的第n个字段，字段间由FS分隔 > * $0：完整的输入记录 > * ARGC：命令行参数的数目 > * ARGIND：命令行中当前文件的位置(从0开始算) > * ARGV：包含命令行参数的数组 > * CONVFMT：数字转换格式(默认值为%.6g)ENVIRON环境变量关联数组 > * ERRNO：最后一个系统错误的描述 > * FIELDWIDTHS：字段宽度列表(用空格键分隔) > * FILENAME：当前文件名 > * FNR：各文件分别计数的行号 > * FS：字段分隔符(默认是任何空格) > * IGNORECASE：如果为真，则进行忽略大小写的匹配 > * NF：一条记录的字段的数目 > * NR：已经读出的记录数，就是行号，从1开始 > * OFMT：数字的输出格式(默认值是%.6g) > * OFS：输出记录分隔符（输出换行符），输出时用指定的符号代替换行符 > * ORS：输出记录分隔符(默认值是一个换行符) > * RLENGTH：由match函数所匹配的字符串的长度 > * RS：记录分隔符(默认是一个换行符) > * RSTART：由match函数所匹配的字符串的第一个位置 > * SUBSEP：数组下标分隔符(默认值是/034) | 命令实例 | 注释 | | --- | --- | |cat test.txt \| awk -F/ '{print $1}'| 读取test.txt文件，按 \/分割，并输出第一段内容。'{print $NF}'：最后一列；'{print $NF-1}'：倒数第二列 | | awk '{if(NR<=4 && NR>=2) print $1}' score.txt|输出第二行到第四行的第一列| |awk '/mall/' test.txt 效果同：sed -n '/mall/p' url.txt|显示文件中含有mall的行| | awk -F/ '{print $1,$3}' OFS="$" test.txt | 按 \/分割，并输出第一段，第三段内容，并指定分隔符“$” | | awk 'BEGIN{IGNORECASE=1} /this/' test.txt | 忽略大小写，匹配this字符 | |awk 'BEGIN{printf "%.2f%\n",('5'/'20')*100}'|计算百分比| | cat test.txt \| awk NF \| wc -l| 过滤空行后，统计文件总行数 | |awk -f cal.awk score.txt|从脚本文件中读取awk命令| |awk '{sum+=$3} END {print sum}' score.txt | 计算score.txt文件第三列的总和| | cat transit\_log\_elapsed.txt \| awk '{print $1,$2,$(NF-3),$(NF-2),$(NF-1),$NF}'|获取第一二列和最后的几列| |cat transit_log_elapsed.txt \| awk 'NR==1 {print $0} END {print $0}' | 获取第一行和最后一行 | | cat transit_log_elapsed.txt \| awk -F= '$3>50{print $0}' | 只获取某一列的数字大于指定数值的行| ``` // 只获取文件内elapsed的值大于50的行 SIS3.0.58.0 ~ # cat transit_log_elapsed.txt | awk -F= '$3>50{print $0}' time="2021-05-07T10:13:25+08:00" elapsed=95.835122 time="2021-05-07T10:13:27+08:00" elapsed=54.939698 time="2021-05-07T10:13:29+08:00" elapsed=51.889203 time="2021-05-07T10:13:32+08:00" elapsed=63.37284 time="2021-05-07T10:13:43+08:00" elapsed=3030.551248 time="2021-05-07T10:13:46+08:00" elapsed=51.853267 time="2021-05-07T10:13:47+08:00" elapsed=80.545366 time="2021-05-07T10:13:47+08:00" elapsed=97.63666 time="2021-05-07T10:13:49+08:00" elapsed=57.14669 ``` # 12、匹配文本中的字符串： grep [option] [pattern] [filename] > 正则表达式参数： > * -E, --extended-regexp：PATTERN 是一个可扩展的正则表达式(缩写为 ERE) > * -F, --fixed-strings：PATTERN 是一组由断行符分隔的定长字符串。 > * -G, --basic-regexp：PATTERN 是一个基本正则表达式(缩写为 BRE) > * -P, --perl-regexp：PATTERN 是一个 Perl 正则表达式 > * -e, --regexp=PATTERN：用 PATTERN 来进行匹配操作 > * -f, --file=FILE：从 FILE 中取得 PATTERN > * -i, --ignore-case：忽略大小写 > * -w, --word-regexp：强制 PATTERN 仅完全匹配字词 > * -x, --line-regexp：强制 PATTERN 仅完全匹配一行 > * -z, --null-data：一个 0 字节的数据行，但不是空行 > 输出控制： > * -m, --max-count=NUM：NUM 次匹配后停止 > * -b, --byte-offset：输出的同时打印字节偏移 > * -n, --line-number：输出的同时打印行号 --line-buffered：每行输出清空 > * -H, --with-filename：为每一匹配项打印文件名 > * -h, --no-filename：输出时不显示文件名前缀 --label=LABEL：将LABEL 作为标准输入文件名前缀 > * -o, --only-matching：只显示匹配PATTERN 部分 > * -q, --quiet, --silent：不显示任何信息 > * -a, --text：不要忽略二进制的数据 > * -I：列出文件内容符合指定的样式的文件名称 > * -d, --directories=ACTION：当指定要查找的是目录而非文件时，必须使用这项参数，否则grep指令将回报信息并停止动作，ACTION is 'read', 'recurse', or 'skip' > * -D, --devices=ACTION： how to handle devices, FIFOs and sockets;ACTION is 'read' or 'skip' > * -r, --recursive：此参数的效果和指定"-d recurse"参数相同 > * -L, --files-without-match ：只打印不匹配的文件名 > * -c, --count：仅打印每个 FILE 匹配行的计数 > * -T, --initial-tab：标签对齐 > > 文件控制： > * -B, --before-context=NUM：显示文件里匹配行以及前NUM行 > * -A, --after-context=NUM：显示文件里匹配行以及后NUM行 > * -C, --context=NUM：显示文件里匹配行以及上下NUM行 > * --group-separator=SEP use SEP as a group separator > * --no-group-separator use empty string as a group separator > * --colour[=WHEN]：使用标记突出显示匹配的字符串；WHEN is 'always', 'never', or 'auto'