Linux-Systemd教程
一、Systemd 概述
1、简介
Systemd 是一系列工具的集合,其作用也远远不仅是启动操作系统,它还接管了后台服务、结束、状态查询,以及日志归档、设备管理、电源管理、定时任务等许多职责,并支持通过特定事件(如插入特定 USB 设备)和特定端口数据触发的 On-demand(按需)任务。
Systemd 的后台服务还有一个特殊的身份——它是系统中 PID 值为 1 的进程。
2、Systemd 架构
3、Systemd系统管理
Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面,systemctl是 Systemd 的主命令,用于管理系统
1 | # ===============systemctl是 Systemd 的主命令,用于管理系统================= |
4、Systemd 的 Unit 文件
Systemd 可以管理所有系统资源,不同的资源统称为 Unit(单位)。在 Systemd 的生态圈中,Unit 文件统一了过去各种不同系统资源配置格式,例如服务的启/停、定时任务、设备自动挂载、网络配置、虚拟内存配置等。而 Systemd 通过不同的文件后缀来区分这些配置文件
4.1 12 种 Unit 文件类型
-
automount:用于控制自动挂载文件系统,相当于 SysV-init 的 autofs 服务
-
device:对于 /dev 目录下的设备,主要用于定义设备之间的依赖关系
-
mount:定义系统结构层次中的一个挂载点,可以替代过去的 /etc/fstab 配置文件
-
path:用于监控指定目录或文件的变化,并触发其它 Unit 运行
-
scope:这种 Unit 文件不是用户创建的,而是 Systemd 运行时产生的,描述一些系统服务的分组信息
-
service:封装守护进程的启动、停止、重启和重载操作,是最常见的一种 Unit 文件
-
slice:用于表示一个 CGroup 的树,通常用户不会自己创建这样的 Unit 文件
-
snapshot:用于表示一个由 systemctl snapshot 命令创建的 Systemd Units 运行状态快照
-
socket:监控来自于系统或网络的数据消息,用于实现基于数据自动触发服务启动
-
swap:定义一个用户做虚拟内存的交换分区
-
target:用于对 Unit 文件进行逻辑分组,引导其它 Unit 的执行。它替代了 SysV-init 运行级别的作用,并提供更灵活的基于特定设备事件的启动方式
-
timer:用于配置在特定时间触发的任务,替代了 Crontab 的功能
4.2 Systemd 目录
Unit 文件按照 Systemd 约定,应该被放置指定的三个系统目录之一中。这三个目录是有优先级的,如下所示,越靠上的优先级越高。因此,在三个目录中有同名文件的时候,只有优先级最高的目录里的那个文件会被使用。
-
/etc/systemd/system
:系统或用户自定义的配置文件 -
/run/systemd/system
:软件运行时生成的配置文件 -
/usr/lib/systemd/system
:系统或第三方软件安装时添加的配置文件-
CentOS :Unit 文件指向该目录
-
ubuntu :被移到了 /lib/systemd/system
-
Systemd 默认从目录 /etc/systemd/system/
读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录 /usr/lib/systemd/system/
,真正的配置文件存放在那个目录
4.3 Unit 和 Target
-
Unit 是 Systemd 管理系统资源的基本单元,可以认为每个系统资源就是一个 Unit,并使用一个 Unit 文件定义。在 Unit 文件中需要包含相应服务的描述、属性以及需要运行的命令
-
Target 是 Systemd 中用于指定系统资源启动组的方式,相当于 SysV-init 中的运行级别
简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。
二、Systemd Service Unit
1、简介
Systemd 服务的 Unit 文件可以分为三个配置区段:
-
Unit 和 Install 段:所有 Unit 文件通用,用于配置服务(或其它系统资源)的描述、依赖和随系统启动的方式
-
Service 段:服务(Service)类型的 Unit 文件(后缀为 .service)特有的,用于定义服务的具体管理和操作方法
1 | [Unit] |
2、Service类型Unit结构详解(常用)
2.1 Unit段
-
Description:描述这个 Unit 文件的信息
-
Documentation:指定服务的文档,可以是一个或多个文档的 URL 路径
-
Requires:依赖的其它 Unit 列表,列在其中的 Unit 模板会在这个服务启动时的同时被启动。并且,如果其中任意一个服务启动失败,这个服务也会被终止
-
Wants:与 Requires 相似,但只是在被配置的这个 Unit 启动时,触发启动列出的每个 Unit 模块,而不去考虑这些模板启动是否成功
-
After:与 Requires 相似,但是在后面列出的所有模块全部启动完成以后,才会启动当前的服务
-
Before:与 After 相反,在启动指定的任务一个模块之间,都会首先确证当前服务已经运行
-
Binds To:与 Requires 相似,失败时失败,成功时成功,但是在这些模板中有任意一个出现意外结束或重启时,这个服务也会跟着终止或重启
-
Part Of:一个 Bind To 作用的子集,仅在列出的任务模块失败或重启时,终止或重启当前服务,而不会随列出模板的启动而启动
-
OnFailure:当这个模板启动失败时,就会自动启动列出的每个模块
-
Conflicts:与这个模块有冲突的模块,如果列出的模块中有已经在运行的,这个服务就不能启动,反之亦然
2.2 Install 段
这部分配置的目标模块通常是特定运行目标的 .target 文件,用来使得服务在系统启动时自动运行。这个区段可以包含三种启动约束:
-
WantedBy:和 Unit 段的 Wants 作用相似,只有后面列出的不是服务所依赖的模块,而是依赖当前服务的模块。它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入
/etc/systemd/system
目录下面以<Target 名> + .wants
后缀构成的子目录中,如/etc/systemd/system/multi-user.target.wants/
-
RequiredBy:和 Unit 段的 Wants 作用相似,只有后面列出的不是服务所依赖的模块,而是依赖当前服务的模块。它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入
/etc/systemd/system
目录下面以<Target 名> + .required
后缀构成的子目录中 -
Also:当前 Unit
enable/disable
时,同时 enable/disable 的其他 Unit -
Alias:当前 Unit 可用于启动的别名
2.3 Service 段(重要)
用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段分为服务生命周期和服务上下文配置两个方面
服务生命周期控制相关
-
Type:定义启动时的进程行为,它有以下几种值:
-
Type=simple:默认值,执行ExecStart指定的命令,启动主进程
-
Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
-
Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
-
Type=dbus:当前服务通过D-Bus启动
-
Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
-
Type=idle:若有其他任务执行完毕,当前服务才会运行
-
-
RemainAfterExit:值为 true 或 false(默认)。当配置为 true 时,Systemd 只会负责启动服务进程,之后即便服务进程退出了,Systemd 也仍然会认为这个服务还在运行中。这个配置主要是提供给一些并非常驻内存,而是启动注册后立即退出,然后等待消息按需启动的特殊类型服务使用的。
-
ExecStart:启动当前服务的命令
-
ExecStartPre:启动当前服务之前执行的命令
-
ExecStartPost:启动当前服务之后执行的命令
-
ExecReload:重启当前服务时执行的命令
-
ExecStop:停止当前服务时执行的命令
-
ExecStopPost:停止当其服务之后执行的命令
-
RestartSec:自动重启当前服务间隔的秒数
-
Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括 always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdog
-
TimeoutStartSec:启动服务时等待的秒数,这一配置对于使用 Docker 容器而言显得尤为重要,因其第一次运行时可能需要下载镜像,严重延时会容易被 Systemd 误判为启动失败杀死。通常,对于这种服务,将此值指定为 0,从而关闭超时检测
-
TimeoutStopSec:停止服务时的等待秒数,如果超过这个时间仍然没有停止,Systemd 会使用 SIGKILL 信号强行杀死服务的进程
-
KillMode:定义 Systemd 如何停止 sshd 服务。
-
control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
-
process:只杀主进程
-
mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
-
none:没有进程会被杀掉,只是执行服务的 stop 命令。
-
服务上下文配置相关
-
Environment:为服务指定环境变量
-
EnvironmentFile:指定加载一个包含服务所需的环境变量的列表的文件,文件中的每一行都是一个环境变量的定义,该文件内部的
key=value
键值对,可以用$key
的形式,在当前配置文件中获取 -
Nice:服务的进程优先级,值越小优先级越高,默认为 0。其中 -20 为最高优先级,19 为最低优先级
-
WorkingDirectory:指定服务的工作目录
-
RootDirectory:指定服务进程的根目录(/ 目录)。如果配置了这个参数,服务将无法访问指定目录以外的任何文件
-
User:指定运行服务的用户
-
Group:指定运行服务的用户组
-
MountFlags:服务的 Mount Namespace 配置,会影响进程上下文中挂载点的信息,即服务是否会继承主机上已有挂载点,以及如果服务运行执行了挂载或卸载设备的操作,是否会真实地在主机上产生效果。可选值为 shared、slaved 或 private
-
shared:服务与主机共用一个 Mount Namespace,继承主机挂载点,且服务挂载或卸载设备会真实地反映到主机上
-
slave:服务使用独立的 Mount Namespace,它会继承主机挂载点,但服务对挂载点的操作只有在自己的 Namespace 内生效,不会反映到主机上
-
private:服务使用独立的 Mount Namespace,它在启动时没有任何任何挂载点,服务对挂载点的操作也不会反映到主机上
-
-
LimitCPU / LimitSTACK / LimitNOFILE / LimitNPROC 等:限制特定服务的系统资源量,例如 CPU、程序堆栈、文件句柄数量、子进程数量等
-
日志相关类,这里输出到journal,否则默认syslog
StandardError=journal
StandardOutput=journal
StandardInput=null
注意:如果在 ExecStart、ExecStop 等属性中使用了 Linux 命令,则必须要写出完整的绝对路径。对于
ExecStartPre
和ExecStartPost
辅助命令,若前面有个 “-” 符号,表示忽略这些命令的出错。因为有些 “辅助” 命令本来就不一定成功,比如尝试清空一个文件,但文件可能不存在。
3、Unit 文件占位符和模板
3.1 Unit 文件占位符
在 Unit 文件中,有时会需要使用到一些与运行环境有关的信息,例如节点 ID、运行服务的用户等。这些信息可以使用占位符来表示,然后在实际运行被动态地替换实际的值。
-
%n:完整的 Unit 文件名字,包括 .service 后缀名
-
%p:Unit 模板文件名中 @ 符号之前的部分,不包括 @ 符号
-
%i:Unit 模板文件名中 @ 符号之后的部分,不包括 @ 符号和 .service 后缀名
-
%t:存放系统运行文件的目录,通常是 “run”
-
%u:运行服务的用户,如果 Unit 文件中没有指定,则默认为 root
-
%U:运行服务的用户 ID
-
%h:运行服务的用户 Home 目录,即 %{HOME} 环境变量的值
-
%s:运行服务的用户默认 Shell 类型,即 %{SHELL} 环境变量的值
-
%m:实际运行节点的 Machine ID,对于运行位置每个的服务比较有用
-
%b:Boot ID,这是一个随机数,每个节点各不相同,并且每次节点重启时都会改变
-
%H:实际运行节点的主机名
-
%v:内核版本,即 “uname -r” 命令输出的内容
-
%%:在 Unit 模板文件中表示一个普通的百分号
3.2 Unit模板
在现实中,往往有一些应用需要被复制多份运行。例如,用于同一个负载均衡器分流的多个服务实例,或者为每个 SSH 连接建立一个独立的 sshd 服务进程。Unit 模板文件的写法与普通的服务 Unit 文件基本相同,不过 Unit 模板的文件名是以 @ 符号结尾的。通过模板启动服务实例时,需要在其文件名的 @ 字符后面附加一个参数字符串。
例如apache@.service
1 | [Unit] |
在服务启动时需要在 @ 后面放置一个用于区分服务实例的附加字符参数,通常这个参数用于监控的端口号或控制台 TTY 编译号,systemctl start apache@8080.service
Systemd 在运行服务时,总是会先尝试找到一个完整匹配的 Unit 文件,如果没有找到,才会尝试选择匹配模板。例如上面的命令,System 首先会在约定的目录下寻找名为 apache@8080.service 的文件,如果没有找到,而文件名中包含 @ 字符,它就会尝试去掉后缀参数匹配模板文件。对于 apache@8080.service,systemd 会找到 apache@.service 模板文件,并通过这个模板文件将服务实例化。
三、Systemd 的资源管理
1、Unit 管理
1 | #=========================查看当前系统的所有 Unit========================= |
2、服务的生命周期
当一个新的 Unit 文件被放入 /etc/systemd/system/
或 /usr/lib/systemd/system/
目录中时,它是不会被自识识别的
2.1 服务的激活
-
systemctl enable:在
/etc/systemd/system/
建立服务的符号链接,指向/usr/lib/systemd/system/
中 -
systemctl start:依次启动定义在 Unit 文件中的 ExecStartPre、**ExecStart **和 **ExecStartPost **命令
2.2 服务的启动和停止
-
systemctl start:依次启动定义在 Unit 文件中的 ExecStartPre、ExecStart 和 ExecStartPost 命令
-
systemctl stop:依次停止定义在 Unit 文件中的 ExecStopPre、ExecStop 和 ExecStopPost 命令
-
systemctl restart:重启服务
-
systemctl kill:立即杀死服务
2.3 服务的开机启动和取消
-
systemctl enable:除了激活服务以外,也可以置服务为开机启动
-
systemctl disable:取消服务的开机启动
2.4 服务的修改和移除
-
systemctl daemon-reload:Systemd 会将 Unit 文件的内容写到缓存中,因此当 Unit 文件被更新时,需要告诉 Systemd 重新读取所有的 Unit 文件
-
systemctl reset-failed:移除标记为丢失的 Unit 文件。在删除 Unit 文件后,由于缓存的关系,即使通过 daemon-reload 更新了缓存,在 list-units 中依然会显示标记为 not-found 的 Unit。
3、Target 管理
Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。在传统的 SysV-init 启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。
1 | # 查看当前系统的所有 Target |
Target 与 SysV-init 进程的主要区别:
-
默认的 RunLevel(在
/etc/inittab
文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target
,通常符号链接到graphical.target
(图形界面)或者multi-user.target
(多用户命令行) -
启动脚本的位置,以前是
/etc/init.d
目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d
、/etc/rc5.d
等),现在则存放在/lib/systemd/system
和/etc/systemd/system
目录 -
配置文件的位置,以前 init 进程的配置文件是
/etc/inittab
,各种服务的配置文件存放在/etc/sysconfig
目录。现在的配置文件主要存放在/lib/systemd
目录,在/etc/systemd
目录里面的修改可以覆盖原始设置
4、日志管理
Systemd 通过其标准日志服务 **Journald **提供的配套程序 journalctl 将其管理的所有后台进程打印到 std:out(即控制台)的输出重定向到了日志文件。Systemd 的日志文件是二进制格式的,必须使用 Journald 提供的 journalctl 来查看,默认不带任何参数时会输出系统和所有后台进程的混合日志。默认日志最大限制为所在文件系统容量的 10%,可以修改/etc/systemd/journald.conf
中的 SystemMaxUse
来指定该最大限制。
1 | # 查看所有日志(默认情况下 ,只保存本次启动的日志) |
四、Systemd 实战
1、Systemd 路径介绍
-
/usr/lib/systemd/system
: 用户自己定义的单元文件,安装包相关配置,一般是供应商提供的操作系统资源,。通常,只允许包管理工具(yum/dnf/rpm/apt)进行包安装的过程中操作此路径; -
/lib/systemd/system
: 系统默认的单元文件,指向/usr/lib/systemd/system
-
/etc/systemd/system
:用户安装的软件的单元文件,本地配置文件,系统管理员手动软件安装包或脚本放置于此(一般为链接文件)
service设定文件
-
/usr/lib/systemd/system/*.service
: 预设设定文件 -
/etc/systemd/system/system/*.service.d
/: 用户个性化设定文件,会被加入设定 -
/etc/systemd/system/system/*.service.wants/
: 链接文件,启动该服务后推荐启动的其他服务 -
/etc/systemd/system/system/*.service.requires/
: 链接文件,启动该服务之前,需要预先启动的服务 -
/run/systemd/generator.late 使用 systemd-sysv-generator工具处理 SysV init脚本(即:/etc/init.d/*),自动生成.service文件
2、路径的区别与优先级
2.1 区别
-
/usr/lib/systemd/system/ 软件包安装的单元
-
/etc/systemd/system/ 系统管理员安装的单元, 优先级更高
2.2 优先级
systemd的使用大幅提高了系统服务的运行效率, 而unit的文件位置一般主要有三个目录:
-
/etc/systemd/system
-
/run/systemd/system
-
lib/systemd/system
这三个目录的配置文件优先级依次从高到低,如果同一选项三个地方都配置了,优先级高的会覆盖优先级低的。
系统安装时,默认会将unit文件放在/lib/systemd/system
目录。如果我们想要修改系统默认的配置,比如nginx.service,一般有两种方法:
-
在
/etc/systemd/system
目录下创建nginx.service
文件,里面写上我们自己的配置。 -
在
/etc/systemd/system
下面创建nginx.service.d
目录,在这个目录里面新建任何以.conf结尾的文件,然后写入我们自己的配置。推荐这种做法。
/run/systemd/system
这个目录一般是进程在运行时动态创建unit文件的目录,一般很少修改,除非是修改程序运行时的一些参数时,即Session级别的,才在这里做修改。
3、实战
创建文件vim /usr/lib/systemd/system/test.service
1 | [Unit] |
创建完成后
1 | # 开启 |
五、systemd.timer定时任务
1、介绍
所谓定时任务,就是未来的某个或多个时点,预定要执行的任务,比如每五分钟收一次邮件、每天半夜两点分析一下日志等等。Linux 系统通常都使用 cron 设置定时任务,但是 Systemd 也有这个功能,而且优点显著
-
自动生成日志,配合 Systemd 的日志工具,很方便除错
-
可以设置内存和 CPU 的使用额度,比如最多使用50%的 CPU
-
任务可以拆分,依赖其他 Systemd 单元,完成非常复杂的任务
Service 单元只是定义了如何执行任务,要定时执行这个 Service,还必须定义 Timer 单元
2、Timer单元
上面新建了test.service
服务,这里继续在/usr/lib/systemd/system
里创建test.timer
(一般建议同名)文件
1 | [Unit] |
-
定时器单元文件中必须包含一个 [Timer]
-
通过同时使用 OnBootSec= 与 OnUnitActiveSec= 指令, 就可以实现在系统启动后的某个时间点启动匹配单元, 并且之后每隔一段时间周期性的反复启动匹配单元
-
时间单位后缀:us(微秒), ms(毫秒), s(秒), m(分), h(时), d(天), w(周)。 如果省略了时间单位,那么表示使用默认单位"秒"
-
Unit= 该定时器单元的匹配单元, 也就是要被该定时器启动的单元。默认值是与此定时器单元同名的服务单元
1 | # 启动刚刚新建的这个定时器 |
3、Timer详解
3.1 Timer单位
Timer 单元文件分成几个部分
**[Unit]**部分定义元数据。
**[Timer]**部分定制定时器。Systemd 提供以下一些字段
-
OnActiveSec
:定时器生效后,多少时间开始执行任务 -
OnBootSec
:系统启动后,多少时间开始执行任务 -
OnStartupSec
:Systemd 进程启动后,多少时间开始执行任务 -
OnUnitActiveSec
:该单元上次执行后,等多少时间再次执行 -
OnUnitInactiveSec
: 定时器上次关闭后多少时间,再次执行 -
OnCalendar
:基于绝对时间,而不是相对时间执行 -
AccuracySec
:如果因为各种原因,任务必须推迟执行,推迟的最大秒数,默认是60秒 -
Unit
:真正要执行的任务,默认是同名的带有.service
后缀的单元 -
Persistent
:如果设置了该字段,即使定时器到时没有启动,也会自动执行相应的单元 -
WakeSystem
:如果系统休眠,是否自动唤醒系统
举例脚本里面,OnUnitActiveSec=1h
表示一小时执行一次任务。其他的写法还有OnUnitActiveSec=*-*-* 02:00:00
表示每天凌晨两点执行,OnUnitActiveSec=Mon *-*-* 02:00:00
表示每周一凌晨两点执行,具体请参考官方文档
3.2 [Install] 和 target
-
test.timer
文件里面,还有一个[Install]
部分,定义开机自启动(systemctl enable
)和关闭开机自启动(systemctl disable
)这个单元时,所要执行的命令。上面脚本中,[Install]
部分只写了一个字段,即WantedBy=multi-user.target
。它的意思是,如果执行了systemctl enable test.timer
(只要开机,定时器自动生效),那么该定时器归属于multi-user.target
。 -
所谓 Target 指的是一组相关进程,有点像 init 进程模式下面的启动级别。启动某个Target 的时候,属于这个 Target 的所有进程都会全部启动。
multi-user.target
是一个最常用的 Target,意为多用户模式。也就是说,当系统以多用户模式启动时,就会一起启动test.timer
。它背后的操作其实很简单,执行systemctl enable test.timer
命令时,就会在multi-user.target.wants
目录里面创建一个符号链接,指向test.timer