Linux管道揭秘之匿名管道连接进程世界的方法

2024-11-09 10:09:30 作者：Yui_

文章介绍了Linux中的管道（Pipe）概念,包括其定义、作用、类型、工作原理以及如何在父子进程间使用,匿名管道是进程间通信的一种机制,通过pipe()系统调用创建,具有读端和写端文件描述符,文章详细解释了匿名管道的创建、使用流程、4种情况和5种特性

1.什么是管道？

管道（Pipe）是一种常见的进程间通信（IPC，Inter-Process Communication）机制，在 Unix/Linux 系统中尤其重要。它允许一个进程的输出直接作为另一个进程的输入，而不需要使用中间文件。管道通常用于将多个命令连接起来，让它们像流水线一样处理数据。
管道在 Unix/Linux 系统中提供了一种简便的机制，允许数据在不同进程之间传递。它提供了一个缓冲区，数据写入管道的一端（写端），然后可以从另一端（读端）读取。管道的本质是一种半双工的通信机制，即数据只能沿一个方向流动。
提问：有没有一些直观的管道的利用？
当然。其实早在Linux的指令学习中，我们就已经接触到了管道。就是这个符号|。

ubuntu@VM-20-9-ubuntu:~/pipeTest$ ls -l
total 24
-rwxrwxr-x 1 ubuntu ubuntu 16576 Nov  5 11:41 a.out
-rw-rw-r-- 1 ubuntu ubuntu  1285 Nov  5 11:40 pipeTest1.c
ubuntu@VM-20-9-ubuntu:~/pipeTest$ ls -l|grep "pipeTest1.c"
-rw-rw-r-- 1 ubuntu ubuntu  1285 Nov  5 11:40 pipeTest1.c
ubuntu@VM-20-9-ubuntu:~/pipeTest$

这就是一个管道的简单使用，我们都知道，在大部分Linux的指令都是一个可执行文件，运行起来就是一个进程。ls -l的作用就是显示当前目录文件的信息，现在我们通过|将这个显示的信息通过管道传递给grep，不就实现了两个进程间的相互通信了嘛。这就是管道的核心作用：实现进程间的通信，高效传递数据，避免了使用临时文件的麻烦.

2. 管道的类型

管道存在两种类型：

匿名管道，用于父子进程或者兄弟进程间的数据传递，没有名字，仅限具有亲缘关系的进程。
命名进程，具有文件名，可以在不相干的进程间使用。

2.1 匿名管道

匿名管道通过pipe()创建。

2.1.1 介绍pipe()

#include <unistd.h>
int pipe(int pipefd[2]);

pipefd：是一个数组，它包含两个元素，分别是管道的读端和写端的文件描述符。

pipefd[0]：读端（用于读取数据）。
pipefd[1]：写端（用于写入数据）。
pipe()创建一个管道，并将两个文件描述符存储在pipefd数组中。
管道的数据流是单向的：数据从写端流向读端。
关于返回值：
成功：返回0.
失败：返回-1.

使用pepe()的基本流程：

创建管道：调用pipe()函数。
使用fork()创建一个子进程。
在父进程关闭写端，使用读端读取数据。
在子进程中关闭读端，使用写端将数据传输给父进程。

2.1.2 pipe()简单示例：父子进程通过管道通信

//本代码用来测试子进程提供匿名管道将信息传递给父进程 24/11/5
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
#include <sys/types.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#define SIZE 1024
void writer(int wfd)
{
    char buf[SIZE];
    const char* str = "hello father,i am child";
    int count = 1;
    pid_t id = getpid();
    while(true)
    {
        //格式化输入
        snprintf(buf,sizeof(buf)-1,"message:%s,pid:%d,times:%d",str,id,count);
        write(wfd,buf,strlen(buf));
        count+=1;
        sleep(1);
    }
}
void reader(int rfd)
{
    char buf[SIZE];
    while(true)
    {
        ssize_t n = read(rfd,buf,sizeof(buf)-1);
        if(n == -1)
        {
            perror("read");
            return;
        }
        printf("%s\n",buf);
    }
}
int main()
{
    //文件标识符
    int fd[2];
    if(pipe(fd) < 0)
    {
        //error
        perror("pipe error");
        return 1;
    }
    pid_t id = fork();
    if(id<0)
    {
        perror("fork error");
        return 1;
    }
    else if(id == 0)
    {
        //child
        //关闭读端
        close(fd[0]);
        writer(fd[1]);
        exit(1);
    }
    //father
    close(fd[1]);
    reader(fd[0]);
    wait(NULL);
    return 0;
}

运行结果：

运行结果

如此我们我们便实现了父子间的管道通信。
pipe() 是一个非常重要的系统调用，它为进程间通信提供了一个简单而高效的机制。通过管道，多个进程可以协作完成任务，并且避免了中间文件的使用。在父子进程之间的通信，或在处理大量数据时，管道通常是最常用的 IPC 方式之一。

2.1.3 管道的4种情况与5种特性

4种情况：

管道内部没有数据时且子进程不关闭自己的写端文件fd，读端（父）就会堵塞等待，直到pipe有数据，
管道内部被写满且父进程（读端）不关闭自己的fd，写端写满后，就会堵塞等待。
对于写端而言：不写了且关闭了pipe，读端会将pipe中的数据读完，最后就会读到返回值为0，表示读结束，类似读到了文件的结尾。
读端不读且关闭，写再写，OS会直接终结写入的进程（子进程）通过信号13）SIGPIPE来杀死进程。
5种特性：
自带同步机制。
血缘关系进行通信，常见于父子进程。
pipe是面向字节流的。
父子进程退出，管道自动释放，文件的生命周期是跟随进程的。
管道只能单向通信，半双工的一种特殊情况。

2.1.4 匿名管道原理

通过父子进程继承关系，再将文件描述符关闭，实现一端写，一端读就是匿名管道.
创建匿名管道的步骤：

父进程以读写的方式打开，文件。父进程fork创建子进程，子进程会拷贝一份PCB结构，PCB中会包含files_struct结构，files_struct中有一个指向struct file（文件）的指针数组，而文件描述符就是这个数组的下标。
拷贝完成后，子进程也就存在了指向struct file的对应文件描述符。
又因为，struct file是独属于的文件的，和进程没有关系，也就不用拷贝，也就是说此时父子进程同时指向了一块公共区域struct file（不同进程看见同一份资源）。
write是系统调用接口，会将数据放在内核缓冲区，底层会定期刷新缓冲区将内容写入磁盘。
匿名管道是一个半双工的通信机制，也就是说，数据只能沿一个方向流动，为了实现半双工的通信方式，父子进程需要关闭各种不需要的文件描述符。

2.1.5 用fork来共享管道的原理

使用fork后

2.1.6 站在文件描述符角度-深度理解管道

0 1 2 分别为 标准输入，标准输出，标准错误。

2.1.7 站在内核角度-管道的本质

Linux下一切皆文件.
所以我们也应该用看待文件的眼观，去理解管道。
我们可以将管道（Pipe）理解为一种特殊类型的文件。实际上，管道确实是由操作系统内部的内存缓冲区实现的，它通过文件描述符来进行访问，就像其他普通文件一样。通过这种类比，我们可以从文件的角度理解管道。

3. 匿名管道总结

通过匿名管道，进程可以轻松地进行数据交换，而不需要借助临时文件或其他外部资源。尽管管道有一些局限性（如单向传输和缓冲区限制），它仍然是许多进程间通信场景中常见的选择。
注意：管道是半双工的，数据只能向一个方向流动，需要双方通信时，可以建立两个管道。

到此这篇关于Linux管道揭秘：匿名管道如何连接进程世界的文章就介绍到这了,更多相关Linux匿名管道内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！