管道、重定向与数据流

发布于 2025-09-04 分类: Linux

系列文章: Linux基础系列教程

第 1 部分: Linux 终端漫游指南：基础导航命令第 2 部分: Linux文件与目录核心概念第 3 部分: Linux命令行中的超级用户与安全第 4 部分: Linux 文件权限详解第 5 部分: 命令行文件管理入门第 6 部分: 管理文件和目录第 7 部分: 玩转Linux中的隐藏文件与文件夹第 8 部分: Egrep 与正则表达式入门教程第 9 部分: 玩转Linux man命令：你的随身速查手册第 10 部分: 玩转 Linux 命令行：文本过滤器入门第 11 部分: 玩转通配符：批量操作文件的命令行魔法第 12 部分: Unix命令行文本处理之：管道的艺术第 13 部分: 管道、重定向与数据流 (当前) 第 14 部分: Linux 进程管理入门第 15 部分: Vi/Vim 编辑器新手入门教程第 16 部分: Bash 脚本编程入门教程

管道与重定向：让数据流动起来

引言

欢迎学习管道与重定向！通过本教程，您将学会如何利用这两个强大的工具，轻松创建高效的工作流，自动化处理任务，从而节省宝贵的时间和精力。

在之前的学习中，我们了解了许多用于处理数据的命令（过滤器）。现在，我们将学习如何将这些命令连接起来，实现更复杂、更强大的数据操作。

本节内容需要您花些时间阅读。尽管管道和重定向的机制和用法相当简单，但要真正有效地使用它们，理解其背后的行为和特性至关重要。

什么是数据流？

在命令行中，我们运行的每一个程序都会自动连接三个数据流。您可以将程序想象成一个处理机器，它有三个端口：

标准输入 (stdin)：编号为 0。这是程序的“输入口”，用于接收需要处理的数据。
标准输出 (stdout)：编号为 1。这是程序的“主输出口”，用于显示程序的正常执行结果，默认连接到我们的终端屏幕。
标准错误 (stderr)：编号为 2。这是程序的“错误输出口”，用于显示错误或警告信息，默认也连接到终端屏幕。

管道 (Piping) 和 重定向 (Redirection) 就是我们用来控制这些数据流流向的工具，我们可以将它们连接到文件或其他程序，实现各种有趣且实用的数据操作。

重定向：控制数据的来源和去向

1. 输出重定向到文件 (`>` 和 `>>`)

通常，命令的执行结果会直接显示在屏幕上。但有时，我们希望将这些结果保存到文件中，以便日后查看、存档或用作其他程序的输入。

>：覆盖写入

大于号 (>) 会将程序的标准输出 (stdout) 保存到一个文件中。如果文件不存在，系统会自动创建它；如果文件已存在，其原有内容将被清空，然后写入新的内容。

示例：

# 1. 查看当前目录下的文件
$ ls
barry.txt  bob  example.png  firstfile  foo1  video.mpeg

# 2. 将 ls 命令的输出保存到 myoutput.txt 文件中
#    注意：此时屏幕上不会显示任何输出
$ ls > myoutput.txt

# 3. 再次查看目录，发现新文件已创建
$ ls
barry.txt  bob  example.png  firstfile  foo1  myoutput.txt  video.mpeg

# 4. 查看 myoutput.txt 的内容
$ cat myoutput.txt
barry.txt
bob
example.png
firstfile
foo1
myoutput.txt
video.mpeg

观察与思考：
您可能注意到了，直接在终端运行 ls 时，文件名是横向排列的，而重定向到文件后，文件名变成了每行一个。这是因为程序在输出到终端时，会根据屏幕宽度进行格式化；而输出到文件或管道时，为了方便后续的程序处理，通常会采用更通用的格式（如每行一项）。

>>：追加写入

如果我们不想覆盖文件的原有内容，而是想在文件末尾添加新内容，可以使用双大于号 (>>)。

示例：

# 1. 先用 wc 命令统计一个文件的行数，并将结果覆盖写入 myoutput.txt
$ wc -l barry.txt > myoutput.txt
$ cat myoutput.txt
7 barry.txt

# 2. 现在，将 ls 的输出追加到 myoutput.txt 文件末尾
$ ls >> myoutput.txt

# 3. 查看文件内容，可以看到新旧内容都在
$ cat myoutput.txt
7 barry.txt
barry.txt
bob
example.png
firstfile
foo1
myoutput.txt
video.mpeg

2. 输入重定向 (`<`)

小于号 (<) 的作用与 > 相反，它将文件的内容作为程序的标准输入 (stdin)。

许多命令（如 wc, cat）可以直接接受文件名作为参数来处理文件。那么为什么还需要输入重定向呢？下面的例子揭示了一个细微但有用的差别：

# 方式一：使用文件名作为参数
$ wc -l myoutput.txt
8 myoutput.txt

# 方式二：使用输入重定向
$ wc -l < myoutput.txt
8

注意到区别了吗？当使用输入重定向时，wc 命令只输出了行数 8，而没有显示文件名。这是因为，通过重定向，数据是“匿名”地被送入程序的。wc 只知道收到了一堆数据，但并不知道这些数据来自哪个文件，因此它无法打印文件名。这个特性在编写脚本时非常有用，可以帮助我们获得更纯净、不含附加信息的输出。

3. 错误重定向 (`2>`)

默认情况下，标准错误 (stderr) 和标准输出 (stdout) 都会显示在屏幕上。如果我们想把错误信息单独保存起来，就需要重定向 stderr。由于 stderr 的编号是 2，我们可以使用 2> 操作符。

示例：

# 尝试列出两个文件，其中 blah.foo 不存在
$ ls -l video.mpg blah.foo
ls: cannot access 'blah.foo': No such file or directory
-rw-r--r-- 1 user user 1024 Sep 4 15:42 video.mpg

# 现在，将错误信息重定向到 errors.txt 文件
# 终端上只会显示正常输出
$ ls -l video.mpg blah.foo 2> errors.txt
-rw-r--r-- 1 user user 1024 Sep 4 15:42 video.mpg

# 查看 errors.txt 的内容
$ cat errors.txt
ls: cannot access 'blah.foo': No such file or directory

4. 合并输出流

有时，我们希望将正常输出和错误信息都保存到同一个文件中。这可以通过 > file 2>&1 的语法实现。

它的含义是：

> myoutput.txt：首先，将标准输出 (stdout, 编号1) 重定向到 myoutput.txt 文件。
2>&1：然后，将标准错误 (stderr, 编号2) 重定向到标准输出 (stdout, 编号1) 当前所在的位置。因为 stdout 已经被重定向到了文件，所以 stderr 也就跟着被重定向到了同一个文件。

示例：

$ ls -l video.mpg blah.foo > myoutput.txt 2>&1

$ cat myoutput.txt
ls: cannot access 'blah.foo': No such file or directory
-rw-r--r-- 1 user user 1024 Sep 4 15:42 video.mpg

注意：2>&1 必须放在 > 之后，顺序很重要。

管道：连接命令的流水线 (`|`)

管道符 (|) 是一个非常强大的工具，它将左边命令的标准输出 (stdout) 直接作为右边命令的标准输入 (stdin)。这就像建立了一条流水线，数据在一个个命令之间流动并被加工处理。

示例 1：只列出目录中的前 3 个文件

# 1. ls 的输出是所有文件
$ ls
barry.txt  bob  example.png  firstfile  foo1  myoutput.txt  video.mpeg

# 2. ls 的输出通过管道传给 head -3，head 只取前 3 行
$ ls | head -3
barry.txt
bob
example.png

我们可以连接任意多个管道，构建复杂的处理流程。

示例 2：只列出目录中的第 3 个文件

# ls 的输出 -> head 取前3个 -> tail 取最后一个 (也就是第3个)
$ ls | head -3 | tail -1
example.png

一个重要的建议：
在构建复杂的管道命令时，请分步构建。先运行第一个命令，确认其输出是你想要的；然后加上管道和第二个命令，再次检查输出；以此类推。这样做可以帮你快速定位问题，避免在一条长长的命令中迷失方向。

总结

操作符	名称	功能
`>`	输出重定向	将标准输出覆盖写入到文件。
`>>`	输出重定向	将标准输出追加到文件末尾。
`<`	输入重定向	从文件中读取内容，作为命令的标准输入。
`2>`	错误重定向	将标准错误 (stderr) 重定向到文件。
`	`	管道
数据流	stdin, stdout, stderr	每个程序都有3个基本数据流：标准输入、标准输出、标准错误。

动手练习

现在，让我们来实践一下：

尝试将不同命令（如 date, pwd, whoami）的输出保存到同一个文件中。分别使用覆盖 (>) 和追加 (>>) 方式，并使用绝对路径和相对路径来指定文件。
挑战一下：只列出 /etc 目录中，按字母顺序倒数第 20 个文件或目录的名称。
最后，统计一下在你的主目录 (~) 下，有多少个文件和目录是你拥有执行权限的？（提示：ls -l 的输出中，权限部分的 x 代表执行权限）。

管道与重定向：让数据流动起来

引言

什么是数据流？

重定向：控制数据的来源和去向

1. 输出重定向到文件 (> 和 >>)

2. 输入重定向 (<)

3. 错误重定向 (2>)

4. 合并输出流

管道：连接命令的流水线 (|)

更多实战范例

总结

动手练习

1. 输出重定向到文件 (`>` 和 `>>`)

2. 输入重定向 (`<`)

3. 错误重定向 (`2>`)

管道：连接命令的流水线 (`|`)