衡阳建设企业网站,西安网站建设个人,做网站需要什么系统,在线制作海报免费第5章 文件的排序、合并与分割 #xff08;第四部分之cut命令#xff09; 4 cut 命令4.1 选项及其意义4.2 输出字符 #xff08;-c#xff09;4.3 改变分隔符#xff08;-d#xff09;和提取特定域#xff08;-f#xff09; 5 paste 命令5.1 paste 命令选项及其意义5.2… 第5章 文件的排序、合并与分割 第四部分之cut命令 4 cut 命令4.1 选项及其意义4.2 输出字符 -c4.3 改变分隔符-d和提取特定域-f 5 paste 命令5.1 paste 命令选项及其意义5.2 基础用法5.3 分隔符 -d5.4 按行粘贴-s5.5 从标准输入中读取(-) 6 split命令6.1 split 命令选项及其意义6.2 基础用法6.3 按大小切割(-b)6.4 按大小切割但保留完整记录-C 4 cut 命令
4.1 选项及其意义
选 项意 义-c指定提取的字符数或字符范围-f指定提取的域数或域范围-d改变域分隔符
4.2 输出字符 -c
[root2E-8E-22-DC-1E-ED 2023]# cat teacher.db
D Hou:Beijing University:Beijing:China
Y Zhang:Victory University:Melbourne:Australia
J Luo:Southeast University:Nanjing:China
B Liu:Shanghai Jiaotong University:Shanghai:China
C Lin:University of Toronto:Toronto:Canada
[root2E-8E-22-DC-1E-ED 2023]# cut -c3 teacher.db
H
Z
L
L
L4.3 改变分隔符-d和提取特定域-f
[root2E-8E-22-DC-1E-ED 2023]# cut -d: -f1,4 test.log ---提取test.log的第14域
B Liu:China
C Lin:Canada
D Hou:China
J Luo:China
Y Zhang:Australia
[root2E-8E-22-DC-1E-ED 2023]# cut -d: -f1-3 test.log ---提取test.log的第123域
B Liu:Shanghai Jiaotong University:Shanghai
C Lin:University of Toronto:Toronto
D Hou:Beijing University:Beijing
J Luo:Southeast University:Nanjing
Y Zhang:Victory University:Melbourne
[root2E-8E-22-DC-1E-ED 2023]# 5 paste 命令
paste 命令用于将文本文件或标准输出中的内容粘贴到新的文件它可以将来自不同文件的数据粘贴到一起形成新的文件。
5.1 paste 命令选项及其意义
选 项意 义-d默认域分隔符是空格或Tab键设置新的域分隔符-s将每个文件粘贴成一行-从标准输入中读取数据
5.2 基础用法
[root2E-8E-22-DC-1E-ED 2023]# cat file1
Shanghai Jiaotong University
University of Toronto
Beijing University
Southeast University
[root2E-8E-22-DC-1E-ED 2023]# cat file2
Shanghai
Toronto
Beijing
Nanjing
Melbourne
[root2E-8E-22-DC-1E-ED 2023]#
[root2E-8E-22-DC-1E-ED 2023]# paste file1 file2
Shanghai Jiaotong University Shanghai
University of Toronto Toronto
Beijing University Beijing
Southeast University NanjingMelbourne
[root2E-8E-22-DC-1E-ED 2023]# paste file2 file1
Shanghai Shanghai Jiaotong University
Toronto University of Toronto
Beijing Beijing University
Nanjing Southeast University
Melbourne5.3 分隔符 -d
[root2E-8E-22-DC-1E-ED 2023]# paste -d file1 file2
Shanghai Jiaotong UniversityShanghai
University of TorontoToronto
Beijing UniversityBeijing
Southeast UniversityNanjing
Melbourne
[root2E-8E-22-DC-1E-ED 2023]# paste -d: file1 file2
Shanghai Jiaotong University:Shanghai
University of Toronto:Toronto
Beijing University:Beijing
Southeast University:Nanjing
:Melbourne
[root2E-8E-22-DC-1E-ED 2023]# paste 命令则不同改变域分隔符是用于设置输出文件的格式。
5.4 按行粘贴-s
paste 不加-s选项时将文件内容“竖着放”,加上-s选项后将文件内容“横着放”。
[root2E-8E-22-DC-1E-ED 2023]# paste -d: file1 file2
Shanghai Jiaotong University:Shanghai
University of Toronto:Toronto
Beijing University:Beijing
Southeast University:Nanjing
:Melbourne
[root2E-8E-22-DC-1E-ED 2023]# paste -d: -s file1 file2
Shanghai Jiaotong University:University of Toronto:Beijing University:Southeast University
Shanghai:Toronto:Beijing:Nanjing:Melbourne5.5 从标准输入中读取(-)
[root2E-8E-22-DC-1E-ED 2023]# ls | paste -d - - - - -
area.db export.txt file1 file2 linshi.log
save.txt teacher.db test.log uniq.log word.sh通过读取ls命令的输出结果再进行粘贴。 paste命令后的-d将分隔符设置为空格符在原本应出现“文件1 文件2”的位置上加上“- ” 选项。例中加了5个“- ”选项从结果可以看到粘贴后的每行显示5个文件名每个 选项表示读取1次标准输入数据即读取到标准输入数据中的一个域。
6 split命令
6.1 split 命令选项及其意义
split 命令的选项用于指定切割的依据 split命令所切割生成的小文件最多包含1000行记录。
选 项意 义-或-1此两个选项等价都用于指定切割成小文件的行数-b指定切割成小文件的字节-C与-b选项类似但是切割时尽量维持每行的完整性
6.2 基础用法
[root2E-8E-22-DC-1E-ED 2023]# split -2 teacher.db pro.db[root2E-8E-22-DC-1E-ED 2023]# ls -l pro.db*
-rw-r--r--. 1 root root 86 7月 27 15:12 pro.dbaa
-rw-r--r--. 1 root root 91 7月 27 15:12 pro.dbab
-rw-r--r--. 1 root root 43 7月 27 15:12 pro.dbac[root2E-8E-22-DC-1E-ED 2023]# cat pro.dbaa
D Hou:Beijing University:Beijing:China
Y Zhang:Victory University:Melbourne:Australia[root2E-8E-22-DC-1E-ED 2023]# cat pro.dbab
J Luo:Southeast University:Nanjing:China
B Liu:Shanghai Jiaotong University:Shanghai:China[root2E-8E-22-DC-1E-ED 2023]# cat pro.dbac
C Lin:University of Toronto:Toronto:Canada
[root2E-8E-22-DC-1E-ED 2023]# split命令利用-2指定按2行对TEACHER.db 进行切割即每2行记录切割成1个文件。 PEO.db 指定输出小文件名由于小文件有多个 split 命令在 PEO.db 后面自动加上编号以区分不同的小文件编号为aazz,即第1个小文件是PEO.dbaa、第2个是PEO.dbab、第3个是PEO.dbac、……,我们逐个查看小文件的记录前面两个小文件包含2条记录最后1个小文件只有1条记录。
6.3 按大小切割(-b)
[root2E-8E-22-DC-1E-ED 2023]# ll teacher.db --大小220
-rw-r--r--. 1 root root 220 7月 26 15:33 teacher.db
[root2E-8E-22-DC-1E-ED 2023]# split -b100 teacher.db --按100切割
[root2E-8E-22-DC-1E-ED 2023]# ll x*
-rw-r--r--. 1 root root 100 7月 27 15:16 xaa
-rw-r--r--. 1 root root 100 7月 27 15:16 xab
-rw-r--r--. 1 root root 20 7月 27 15:16 xac
[root2E-8E-22-DC-1E-ED 2023]# cat xaa
D Hou:Beijing University:Beijing:China
Y Zhang:Victory University:Melbourne:Australia
J Luo:Southeas[root2E-8E-22-DC-1E-ED 2023]# cat xab
t University:Nanjing:China
B Liu:Shanghai Jiaotong University:Shanghai:China
C Lin:University of Tor[root2E-8E-22-DC-1E-ED 2023]# cat xac
onto:Toronto:Canada
[root2E-8E-22-DC-1E-ED 2023]# split 命令利用-b 选项按100B 切割TEACHER.db 文件当 split 命令不指定小文件的名字时将自动以x 开头、 aazz为编号对这些小文件进行命名用Ⅱ命令查看这三个小文件时发现xaa 和 xab 是100Bxac 是20B这说明确实按照100B 的大小切割了TEACHER.db文件。但是当用 cat 命令查看这三个文件时发现每个文件内容比较凌乱甚至存放了不完整的单词。因此split命令-b选项在切割文件时仅考虑了文件大小并未考虑记录的完整性。
6.4 按大小切割但保留完整记录-C
[root2E-8E-22-DC-1E-ED 2023]# split -C100 teacher.db
[root2E-8E-22-DC-1E-ED 2023]# cat xaa
D Hou:Beijing University:Beijing:China
Y Zhang:Victory University:Melbourne:Australia
[root2E-8E-22-DC-1E-ED 2023]# cat xab
J Luo:Southeast University:Nanjing:China
B Liu:Shanghai Jiaotong University:Shanghai:China
[root2E-8E-22-DC-1E-ED 2023]# cat xac
C Lin:University of Toronto:Toronto:Canada
[root2E-8E-22-DC-1E-ED 2023]# ll xa*
-rw-r--r--. 1 root root 86 7月 27 15:20 xaa
-rw-r--r--. 1 root root 91 7月 27 15:20 xab
-rw-r--r--. 1 root root 43 7月 27 15:20 xac
[root2E-8E-22-DC-1E-ED 2023]# 利用-C 选项按100B 切割TEACHER.db 文件同样得到 xaa、xab 和xac 三个小 文件但是 xaa是93B、xab是80B、xac是47B,xaa、xab 和 xac 这三个文件存放了完整 的记录由此可见 -C 选项并不严格按照100B 的大小进行切割而是在切割时尽量维持每 行的完整性。