GSoC2024 笔记:使用 Rust 重新实现 procps

procps 是一套用于收集统计系统信息的套件,也指代一套访问 /proc 文件系统的 API。uutils 的 procps 是用 Rust 重新实现的,而这正好是本次 GSoC 的提案内容。

文章总体很长,请使用右侧 TOC 来跳转

free 命令

用于显示系统中已用和未用内存空间

文件系统

free 命令通过访问 /proc/meminfo 假(pseudo)文件系统来获取原始信息

对于一个该假文件系统文件的典型输出为

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
❯ cat /proc/meminfo
MemTotal: 32273056 kB
MemFree: 434940 kB
MemAvailable: 21037048 kB
Buffers: 32 kB
Cached: 20893812 kB
SwapCached: 0 kB
Active: 13078828 kB
Inactive: 16008968 kB
Active(anon): 4430756 kB
Inactive(anon): 4009712 kB
Active(file): 8648072 kB
Inactive(file): 11999256 kB
Unevictable: 128 kB
Mlocked: 128 kB
SwapTotal: 0 kB
SwapFree: 0 kB
Zswap: 0 kB
Zswapped: 0 kB
Dirty: 2880 kB
Writeback: 0 kB
AnonPages: 7908776 kB
Mapped: 1515536 kB
Shmem: 246428 kB
KReclaimable: 417148 kB
Slab: 734004 kB
SReclaimable: 417148 kB
SUnreclaim: 316856 kB
KernelStack: 40940 kB
PageTables: 79788 kB
SecPageTables: 0 kB
NFS_Unstable: 0 kB
Bounce: 0 kB
WritebackTmp: 0 kB
CommitLimit: 16136528 kB
Committed_AS: 20790660 kB
VmallocTotal: 34359738367 kB
VmallocUsed: 92816 kB
VmallocChunk: 0 kB
Percpu: 13312 kB
HardwareCorrupted: 0 kB
AnonHugePages: 1038336 kB
ShmemHugePages: 0 kB
ShmemPmdMapped: 0 kB
FileHugePages: 0 kB
FilePmdMapped: 0 kB
Unaccepted: 0 kB
HugePages_Total: 0
HugePages_Free: 0
HugePages_Rsvd: 0
HugePages_Surp: 0
Hugepagesize: 2048 kB
Hugetlb: 0 kB
DirectMap4k: 3882436 kB
DirectMap2M: 29063168 kB
DirectMap1G: 0 kB

该输出的 kB 单位实际上为 2^10 byte,也就是 1kB = 1024B

解析

解析时应当忽略最后的 kB,实际上解析应当只包含 keyvalue 而不包含末尾的单位

最后的解析结果类型应当是 HashMap<String, u64>

参考文献

tload 命令

tload 命令使用打印终端图形的方式向用户显示系统负载

文件系统

tload 命令使用 /proc/loadavg 作为信息源,该文件典型的内容如下

1
2
❯ cat /proc/loadavg
3.06 2.61 2.77 8/2609 94056

解析

根据内核文档我们可以知道

Load average of last 1, 5 & 15 minutes;

number of processes currently runnable (running or on ready queue); total number of processes in system; last pid created. All fields are separated by one space except “number of processes currently runnable” and “total number of processes in system”, which are separated by a slash (‘/’). Example: 0.61 0.61 0.55 3/828 22084

那么对于以上输出的例子,我们可以认为其意义如下

1
2
3
4
5
6
7
3.06 2.61 2.77 8/2609 94056
|--| |--| |--| |----| |---|
| | | | |--- 最后创建的 PID
| | | |---------- 当前可运行进程数/系统中总进程数
| | |--------------- 最近 15 分钟的平均负载
| |-------------------- 最近 5 分钟的平均负载
|-------------------------- 最近 1 分钟的平均负载

因此我们可以根据如上内容来设计数据结构

1
2
3
4
5
6
7
8
pub struct LoadAvg {
load1: u64,
load5: u64,
load15: u64,
runnable: u64,
total: u64,
last_pid: u64,
}

参考文献

vmstat 命令

slabtop 命令

实时显示内核的 slab 缓存信息

slab 是什么

slab 是一种 Linux 通用的内存分配器,其实现原理和工作原理不是本次 GSoC 的一部分,但可以通过 Kernel Document 获得相关的理论知识

文件系统

slabtop 使用 /proc/slabinfo 作为信息源,典型的输入如下(已作截断,并且已经对齐)

访问该文件需要 root 权限。

1
2
3
4
5
6
7
8
9
slabinfo - version: 2.1
# name <active_objs> <num_objs> <objsize> <objperslab> <pagesperslab> : tunables <limit> <batchcount> <sharedfactor> : slabdata <active_slabs> <num_slabs> <sharedavail>
nf_conntrack_expect 0 0 208 39 2 : tunables 0 0 0 : slabdata 0 0 0
nf_conntrack 736 736 256 32 2 : tunables 0 0 0 : slabdata 23 23 0
QIPCRTR 78 78 832 39 8 : tunables 0 0 0 : slabdata 2 2 0
ovl_inode 585 585 720 45 8 : tunables 0 0 0 : slabdata 13 13 0
kvm_vcpu 0 0 7288 4 8 : tunables 0 0 0 : slabdata 0 0 0
x86_emulator 0 0 2656 12 8 : tunables 0 0 0 : slabdata 0 0 0
fat_inode_cache 205 328 792 41 8 : tunables 0 0 0 : slabdata 8 8 0

其中第一行不作解析,声明 slabinfo 的版本

第二行声明每个元素的意义

将该输出换作表格形式后如下

name active_objs num_objs objsize objperslab pagesperslab tunables limit batchcount sharedfactor slabdata active_slabs num_slabs sharedavail
nf_conntrack_expect 0 0 208 39 2 tunables 0 0 0 slabdata 0 0 0
nf_conntrack 736 736 256 32 2 tunables 0 0 0 slabdata 23 23 0
QIPCRTR 78 78 832 39 8 tunables 0 0 0 slabdata 2 2 0
ovl_inode 585 585 720 45 8 tunables 0 0 0 slabdata 13 13 0
kvm_vcpu 0 0 7288 4 8 tunables 0 0 0 slabdata 0 0 0
x86_emulator 0 0 2656 12 8 tunables 0 0 0 slabdata 0 0 0
fat_inode_cache 205 328 792 41 8 tunables 0 0 0 slabdata 8 8 0

解析

根据以上的表格,我们可以发现该文件数据部分的格式实际上依赖第二行的 meta 格式,因此我们可以认为其格式如下

分析 meta

1
# name            <active_objs> <num_objs> <objsize> <objperslab> <pagesperslab> : tunables <limit> <batchcount> <sharedfactor> : slabdata <active_slabs> <num_slabs> <sharedavail>

最终结论

1
type SlabInfo = Vec<HashMap<String, u64>>;

参考文献

slabinfo 迭代记录

slabinfo 文件总共有三个版本

  • 1.0 Present throughout the Linux 2.2.x kernel series.
  • 1.1 Present in the Linux 2.4.x kernel series.
  • 1.2 A format that was briefly present in the Linux 2.5 development series.
  • 2.0 Present in Linux 2.6.x kernels up to and including Linux 2.6.9.
  • 2.1 The current format, which first appeared in Linux 2.6.10.

当前使用的版本为 2.1,而包含 slabinfo2.1 的内核为 2.6.10,第一次出现已经是接近 20 年前了,并且目前没有出现想要修改 slabinfo 文件的请求,因此认为该文件的内容和格式在较长时间内不会改变

pgrep 命令

通过名称来查找 PID

文件系统

pgrep 命令依赖于 /proc/<PID> 作为输入源,该部分文档见 Kernel Archive

pid 号在程序结束后会被删除。但有些清空 pid 会保留在/proc 文件系统里,这种情况一般是因为僵尸进程。

解析

进程启动时间

pgrep 命令还实现了判断哪个进程最先创建和哪个进程最后创建,这部分功能通过读取 /proc/self/stat 实现。

以空格为分割,该文件的第 21 个元素即为该进程的 start_time(下标从 0 开始)。

start_time 并不唯一对应一个进程,因此在对 start_time 排序结束后需要对相同的 start_time 的进程的 pid 进行排序(存疑,但确实如此)。

参考文献


GSoC2024 笔记:使用 Rust 重新实现 procps
https://blog.krysztal.dev/2024/03/28/GSoC2024-notes/
作者
Krysztal
发布于
2024年3月28日
许可协议