Linux cgroups 命令简介

2018 年 8 月 24 日 Linux爱好者

（点击上方公众号，可快速关注）

来源：sparkdev

www.cnblogs.com/sparkdev/p/8296063.html

cgroups(Control Groups) 是 linux 内核提供的一种机制，这种机制可以根据需求把一系列系统任务及其子任务整合(或分隔)到按资源划分等级的不同组内，从而为系统资源管理提供一个统一的框架。简单说，cgroups 可以限制、记录任务组所使用的物理资源。本质上来说，cgroups 是内核附加在程序上的一系列钩子(hook)，通过程序运行时对资源的调度触发相应的钩子以达到资源追踪和限制的目的。

本文以 Ubuntu 16.04 系统为例介绍 cgroups，所有的 demo 均在该系统中演示。

为什么要了解 cgroups

在以容器技术为代表的虚拟化技术大行其道的时代了解 cgroups 技术是非常必要的！比如我们可以很方便的限制某个容器可以使用的 CPU、内存等资源，这究竟是如何实现的呢？通过了解 cgroups 技术，我们可以窥探到 linux 系统中整个资源限制系统的脉络。从而帮助我们更好的理解和使用 linux 系统。

cgroups 的主要作用

实现 cgroups 的主要目的是为不同用户层面的资源管理提供一个统一化的接口。从单个任务的资源控制到操作系统层面的虚拟化，cgroups 提供了四大功能：

资源限制：cgroups 可以对任务是要的资源总额进行限制。比如设定任务运行时使用的内存上限，一旦超出就发 OOM。
优先级分配：通过分配的 CPU 时间片数量和磁盘 IO 带宽，实际上就等同于控制了任务运行的优先级。
资源统计：cgoups 可以统计系统的资源使用量，比如 CPU 使用时长、内存用量等。这个功能非常适合当前云端产品按使用量计费的方式。
任务控制：cgroups 可以对任务执行挂起、恢复等操作。

查看进程所属的 cgroups

可以通过 /proc/[pid]/cgroup 来查看指定进程属于哪些 cgroup：

每一行包含用冒号隔开的三列，他们的含义分别是：

cgroup 树的 ID，和 /proc/cgroups 文件中的 ID 一一对应。
和 cgroup 树绑定的所有 subsystem，多个 subsystem 之间用逗号隔开。这里 name=systemd 表示没有和任何 subsystem 绑定，只是给他起了个名字叫 systemd。
进程在 cgroup 树中的路径，即进程所属的 cgroup，这个路径是相对于挂载点的相对路径。

cgroups 工具

在介绍通过 systemd 应用 cgroups 之前，我们先使用 cgroup-bin 工具包中的 cgexec 来演示 demo。Ubuntu 默认没有安装 cgroup-bin 工具包，请通过下面的命令安装：

$ sudo apt install cgroup-bin

demo：限制进程可用的 CPU

在我们使用 cgroups 时，最好不要直接在各个子系统的根目录下直接修改其配置文件。推荐的方式是为不同的需求在子系统树中定义不同的节点。比如我们可以在 /sys/fs/cgroup/cpu 目录下新建一个名称为 nick_cpu 的目录：

$ cd /sys/fs/cgroup/cpu

$ sudo mkdir nick_cpu

然后查看新建的目录下的内容：

是不是有点吃惊，cgroups 的文件系统会在创建文件目录的时候自动创建这些配置文件！

让我们通过下面的设置把 CPU 周期限制为总量的十分之一：

$ sudo su

$ echo 100000 > nick_cpu/cpu.cfs_period_us

$ echo 10000 > nick_cpu/cpu.cfs_quota_us

然后创建一个 CPU 密集型的程序：

void main()

{

    unsigned int i, end;

    end = 1024 * 1024 * 1024;

    for(i = 0; i < end; )

    {

        i ++;

    }

}

保存为文件 cputime.c 编译并通过不同的方式执行：

$ gcc cputime.c -o cputime

$ sudo su

$ time ./cputime

$ time cgexec -g cpu:nick_cpu ./cputime

time 命令可以为我们报告程序执行消耗的时间，其中的 real 就是我们真实感受到的时间。使用 cgexec 能够把我们添加的 cgroup 配置 nick_cpu 应用到运行 cputime 程序的进程上。上图显示，默认的执行只需要 2s 左右。通过 cgroups 限制 CPU 资源后需要运行 23s。

demo：限制进程可用的内存

这次我们来限制进程可用的最大内存，在 /sys/fs/cgroup/memory 下创建目录nick_memory：

$ cd /sys/fs/cgroup/memory

$ sudo mkdir nick_memory

下面的设置把进程的可用内存限制在最大 300M，并且不使用 swap：

# 物理内存 + SWAP <= 300 MB；1024*1024*300 = 314572800

$ sudo su

$ echo 314572800 > nick_memory/memory.limit_in_bytes

$ echo 0 > nick_memory/memory.swappiness

然后创建一个不断分配内存的程序，它分五次分配内存，每次申请 100M：

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#define CHUNK_SIZE 1024 * 1024 * 100

void main()

{

    char *p;

    int i;

    for(i = 0; i < 5; i ++)

    {

        p = malloc(sizeof(char) * CHUNK_SIZE);

        if(p == NULL)

        {

            printf("fail to malloc!");

            return ;

        }

        // memset() 函数用来将指定内存的前 n 个字节设置为特定的值

        memset(p, 0, CHUNK_SIZE);

        printf("malloc memory %d MB\n", (i + 1) * 100);

    }

}