共计 4020 个字符,预计需要花费 11 分钟才能阅读完成。
导读 | linux 入门式必学的文件处理命令,主要有以下几个命令 file,mkdir,grep,dd,find,mv。 |
Linux 系统信息存放在文件里,文件与普通的公务文件类似。每个文件都有自己的名字、内容、存放地址及其它一些管理信息,如文件的用户、文件的大小等。文件可以是一封信、一个通讯录,或者是程序的源语句、程序的数据,甚至可以包括可执行的程序和其它非正文内容。Linux 文件系统具有良好的结构,系统提供了很多文件处理程序。这里主要介绍常用的文件处理命令。
file [options] 文件名
-v:在标准输出后显示版本信息,并且退出。
-z:探测压缩过的文件类型。
-L:允许符合连接。
如果我们看到一个没有后缀的文件 grap,可以使用下面命令:
$file grap
grap:English text
此时系统显示这是一个英文文本文件。需要说明的是,file 命令不能探测包括图形、音频、视频等多媒体文件类型。
mkdir [options] 目录名
-m,--mode= 模式:设定权限 < 模式 >;,与 chmod 类似。
-p,--parents:需要时创建上层目录;如果目录早已存在,则不当作错误。
-v,--verbose:每次创建新目录都显示信息。
--version:显示版本信息后离开。
在进行目录创建时可以设置目录的权限,此时使用的参数是“-m”。假设要创建的目录名是“tsk”,让所有用户都有 rwx(即读、写、执行的权限),那么可以使用以下命令:
$mkdir -m 777 tsk
grep [options]
-c:只输出匹配行的计数。
-I:不区分大小写(只适用于单字符)。
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
pattern 正则表达式主要参数:
\:忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达式的行开始。
\>;:到匹配正则表达式的行结束。
[]:单个字符,如 [A] 即 A 符合要求。
[–]:范围,如[A-Z],即 A、B、C 一直到 Z 都符合要求。
*:有字符,长度可以为 0。
正则表达式是 Linux/Unix 系统中非常重要的概念。正则表达式(也称为“regex”或“regexp”)是一个可以描述一类字符串的模式(Pattern)。如果一个字符串可以用某个正则表达式来描述,我们就说这个字符和该正则表达式匹配(Match)。这和 DOS 中用户可以使用通配符“*”代表任意字符类似。在 Linux 系统上,正则表达式通常被用来查找文本的模式,以及对文本执行“搜索-替换”操作和其它功能。
查询 DNS 服务是日常工作之一,这意味着要维护覆盖不同网络的大量 IP 地址。有时 IP 地址会超过 2000 个。如果要查看 nnn.nnn 网络地址,但是却忘了第二部分中的其余部分,只知到有两个句点,例如 nnn nn..。要抽取其中所有 nnn.nnn IP 地址,使用[0-9]\{3 \}\.[0-0\{3\}\。含义是任意数字出现 3 次,后跟句点,接着是任意数字出现 3 次,后跟句点。
$grep '[0-9]\{3 \}\.[0-0\{3\}\' ipfile
补充说明,grep 家族还包括 fgrep 和 egrep。fgrep 是 fix grep,允许查找字符串而不是一个模式;egrep 是扩展 grep,支持基本及扩展的正则表达式,但不支持 \q 模式范围的应用及与之相对应的一些更加规范的模式。
dd [options]
bs= 字节:强迫 ibs=< 字节 >; 及 obs=< 字节 >;。
cbs= 字节:每次转换指定的 < 字节 >;。
conv= 关键字:根据以逗号分隔的关键字表示的方式来转换文件。
count= 块数目:只复制指定 < 块数目 >; 的输入数据。
ibs= 字节:每次读取指定的 < 字节 >;。
if= 文件:读取 < 文件 >; 内容,而非标准输入的数据。
obs= 字节:每次写入指定的 < 字节 >;。
of= 文件:将数据写入 < 文件 >;,而不在标准输出显示。
seek= 块数目:先略过以 obs 为单位的指定 < 块数目 >; 的输出数据。
skip= 块数目:先略过以 ibs 为单位的指定 < 块数目 >; 的输入数据。
dd 命令常常用来制作 Linux 启动盘。先找一个可引导内核,令它的根设备指向正确的根分区,然后使用 dd 命令将其写入软盘:
$rdev vmlinuz /dev/hda
$dd if=vmlinuz of=/dev/fd0
上面代码说明,使用 rdev 命令将可引导内核 vmlinuz 中的根设备指向 /dev/hda,请把“hda”换成自己的根分区,接下来用 dd 命令将该内核写入软盘。
find [path][options][expression]
path 指定目录路径,系统从这里开始沿着目录树向下查找文件。它是一个路径列表,相互用空格分离,如果不写 path,那么默认为当前目录。
-depth:使用深度级别的查找过程方式,在某层指定目录中优先查找文件内容。
-maxdepth levels:表示至多查找到开始目录的第 level 层子目录。level 是一个非负数,如果 level 是 0 的话表示仅在当前目录中查找。
-mindepth levels:表示至少查找到开始目录的第 level 层子目录。
-mount:不在其它文件系统(如 Msdos、Vfat 等)的目录和文件中查找。
-version:打印版本。
[expression]是匹配表达式,是 find 命令接受的表达式,find 命令的所有操作都是针对表达式的。它的参数非常多,这里只介绍一些常用的参数。
-name:支持统配符 * 和?。
-atime n:搜索在过去 n 天读取过的文件。
-ctime n:搜索在过去 n 天修改过的文件。
-group grpoupname:搜索所有组为 grpoupname 的文件。
-user 用户名:搜索所有文件属主为用户名(ID 或名称)的文件。
-size n:搜索文件大小是 n 个 block 的文件。
-print:输出搜索结果,并且打印。
find 命令查找文件的几种方法:
(1)根据文件名查找
例如,我们想要查找一个文件名是 lilo.conf 的文件,可以使用如下命令:
find / -name lilo.conf
find 命令后的“/”表示搜索整个硬盘。
(2)快速查找文件
根据文件名查找文件会遇到一个实际问题,就是要花费相当长的一段时间,特别是大型 Linux 文件系统和大容量硬盘文件放在很深的子目录中时。如果我们知道了这个文件存放在某个目录中,那么只要在这个目录中往下寻找就能节省很多时间。比如 smb.conf 文件,从它的文件后缀“.conf”可以判断这是一个配置文件,那么它应该在 /etc 目录内,此时可以使用下面命令:
find /etc -name smb.conf
这样,使用“快速查找文件”方式可以缩短时间。
(3)根据部分文件名查找方法
有时我们知道只某个文件包含有 abvd 这 4 个字,那么要查找系统中所有包含有这 4 个字符的文件可以输入下面命令:
find / -name '*abvd*'
输入这个命令以后,Linux 系统会将在 / 目录中查找所有的包含有 abvd 这 4 个字符的文件(其中 * 是通配符),比如 abvdrmyz 等符合条件的文件都能显示出来。
(4)使用混合查找方式查找文件
find 命令可以使用混合查找的方法,例如,我们想在 /etc 目录中查找大于 500000 字节,并且在 24 小时内修改的某个文件,则可以使用 -and (与)把两个查找参数链接起来组合成一个混合的查找方式。
find /etc -size +500000c -and -mtime +1
mv [options] 源文件或目录 目标文件或目录
-i:交互方式操作。如果 mv 操作将导致对已存在的目标文件的覆盖,此时系统询问是否重写,要求用户回答“y”或“n”,这样可以避免误覆盖文件。
-f:禁止交互操作。mv 操作要覆盖某个已有的目标文件时不给任何指示,指定此参数后 i 参数将不再起作用。
(1)将 /usr/cbu 中的所有文件移到当前目录(用“.”表示)中:
$mv /usr/cbu/ * .
(2)将文件 cjh.txt 重命名为 wjz.txt:
$mv cjh.txt wjz.txt