process-exporter 安装部署

Prometheus   2025-01-12 16:43   454   0  

process-exporter主要用来做进程监控,比如某个服务的进程数、消耗了多少CPU、内存、IO资源等。

1、用法

process-exporter [options] -config.path filename.yml

如果选择监控的进程并将其分组,可以提供命令行参数或使用 yaml 配置文件。推荐通过 -config.path 指定配置文件。
-config.path yaml 文件的常规格式是顶级 process_names 部分,其中包含名称匹配器列表:

process_names:
  - matcher1
  - matcher2
  ...
  - matcherN

deb/rpm 软件包附带的默认配置为:

process_names:
  - name: "{{.Comm}}"
    cmdline:
    - '.+'

一个进程仅可能属于一个组:即使匹配多个,也只会归属于第一个匹配的 groupname 组。
其中的每一项 process_names 都提供了用于识别和命名过程的方法。可选 name 标签定义用于命名匹配过程的模板;如果未指定,则 name 默认为 {{.ExeBase}}。
可用的模板变量:

{{.Comm}}           包含原始可执行文件的基本名称,即 /proc/<pid>/stat

{{.ExeBase}}        包含可执行文件的基本名称

{{.ExeFull}}        包含可执行文件的标准路径

{{.Username}}       包含有效用户的用户名

{{.Matches}}        包含所有由于应用cmdline正则表达式而产生的匹配项

{{.PID}}            包含过程的PID。请注意,使用PID意味着该组将仅包含一个进程

{{.StartTime}}      包含过程的开始时间。与PID结合使用时,这很有用,因为PID会随着时间的推移而被重用

不建议使用 PID 或 StartTime:这并不会得到想要的结果,并且可能会导致 prometheus 遇到麻烦——metrics 基数过高。
process_exporter 配置参考:https://github.com/ncabatoff/process-exporter/

2、安装 process-exporter

touch process.sh && chmod +x process.sh
#!/bin/bash
#用于安装process_exporter

#版本号
PROCESS_EXPORTER_VER=0.7.10
#安装位置
PROCESS_EXPORTER_DIR=/app/process_exporter
#安装包存放路径
INSTALL_PACKAGE=/app/install
#日志文件
LOG_FILE=/tmp/process_exporter.log

# PROCESS_EXPORTER的用户名
PROCESS_EXPORTER_USER=prometheus
# PROCESS_EXPORTER监听端口
PROCESS_EXPORTER_PORT=9256

check_err()
{
    if [ $? -ne 0 ]; then
        echo "$1"
        exit 1
    else
        echo "$2"
    fi
}

start() {
    [ ! -d /app ] && mkdir -p /app

    #检查是否存在wget命令,没有则安装
    type wget &> /dev/null
    if [ $? -ne 0 ]; then
        yum install wget -y
        check_err "\033[31myum安装依赖包 wget 失败,请检查\033[0m" "\033[36myum安装依赖包 wget 成功\033[0m"
    fi

    #检查是否存在netstat命令,没有则安装
    type netstat &> /dev/null
    if [ $? -ne 0 ]; then
        yum install net-tools -y
        check_err "\033[31myum安装依赖包 net-tools 失败,请检查\033[0m" "\033[36myum安装依赖包 net-tools 成功\033[0m"
    fi

    netstat -tln | grep ":$PROCESS_EXPORTER_PORT"
    CHECK_RESULT=$?
    if [ $CHECK_RESULT -eq 0 ];then
      echo "PROCESS_EXPORTER 已启动,请勿重复启动应用!"
      exit 1
    fi
    echo "正在启动 PROCESS_EXPORTER....."

    [ ! -d $INSTALL_PACKAGE ] && mkdir -p $INSTALL_PACKAGE

    [ ! -f $INSTALL_PACKAGE/process-exporter-${PROCESS_EXPORTER_VER}.linux-amd64.tar.gz ] && wget -O $INSTALL_PACKAGE/process-exporter-${PROCESS_EXPORTER_VER}.linux-amd64.tar.gz https://github.com/ncabatoff/process-exporter/releases/download/v${PROCESS_EXPORTER_VER}/process-exporter-${PROCESS_EXPORTER_VER}.linux-amd64.tar.gz

    [ ! -d $PROCESS_EXPORTER_DIR ] && mkdir -p $PROCESS_EXPORTER_DIR
    count=`ls $PROCESS_EXPORTER_DIR | wc -l`
    if [ $count -gt 0 ]; then
        echo "目录 $PROCESS_EXPORTER_DIR 不为空,不再重复解压压缩包"
    else
        tar -xvzf $INSTALL_PACKAGE/process-exporter-${PROCESS_EXPORTER_VER}.linux-amd64.tar.gz --strip-components 1 -C $PROCESS_EXPORTER_DIR
    fi

    cat /etc/group | grep $PROCESS_EXPORTER_USER
    if [ $? -ne 0 ]; then
        groupadd -g 10002 $PROCESS_EXPORTER_USER
    fi
    cat /etc/passwd | grep $PROCESS_EXPORTER_USER
    if [ $? -ne 0 ]; then
        useradd -u 10002 -g $PROCESS_EXPORTER_USER -d /home/$PROCESS_EXPORTER_USER -m $PROCESS_EXPORTER_USER
    fi


    [ ! -f $PROCESS_EXPORTER_DIR/process-exporter.yaml ] && touch $PROCESS_EXPORTER_DIR/process-exporter.yaml
    cat > $PROCESS_EXPORTER_DIR/process-exporter.yaml << EOF
process_names:
  - name: "{{.Matches}}"
    cmdline:
    - 'process-exporter'
EOF

    chown -R $PROCESS_EXPORTER_USER:$PROCESS_EXPORTER_USER $PROCESS_EXPORTER_DIR

    [ ! -f $LOG_FILE ] && touch $LOG_FILE
    chown -R $PROCESS_EXPORTER_USER:$PROCESS_EXPORTER_USER $LOG_FILE


    # 切换用户
su - $PROCESS_EXPORTER_USER << EOF
    # 不加反斜杠,取的值是切换用户前的
    nohup $PROCESS_EXPORTER_DIR/process-exporter --config.path=$PROCESS_EXPORTER_DIR/process-exporter.yaml >> $LOG_FILE 2>&1 &
    #每2s检查一次监听端口是否启动,总共检查60次共2分钟,超时未启动则退出
    CHECK_RESULT=1
    CHECK_COUNT=60
    while [ \$CHECK_RESULT -ne 0 ];do
        if [ \$CHECK_COUNT -gt 0 ];then
          echo "等待监听端口启动..."
          sleep 2
          netstat -tln | grep ":$PROCESS_EXPORTER_PORT"
          CHECK_RESULT=\$?
          CHECK_COUNT=\$((\$CHECK_COUNT-1))
        else
          echo "ERROR: 启动$PROCESS_EXPORTER_PORT端口超时,请检查!"
          exit 1
        fi
    done
echo "PROCESS_EXPORTER 启动成功!"
EOF
#检查防火墙是否已启动,如果启动则开放端口
systemctl status firewalld > /dev/null
if [ $? -eq 0 ];then
    firewall-cmd --add-port=$PROCESS_EXPORTER_PORT/tcp --permanent
    firewall-cmd --reload
fi
}

stop(){

netstat -tln | grep ":$PROCESS_EXPORTER_PORT"
check_err "PROCESS_EXPORTER 未启动!" "PROCESS_EXPORTER 正在运行,开始停止应用....."

su - $PROCESS_EXPORTER_USER << EOF
PROCESS=`ps aux | grep $PROCESS_EXPORTER_DIR/process-exporter | grep -v "grep" | awk '{print $2}'`
for i in \${PROCESS}
do
  echo "Kill the PROCESS_EXPORTER process [ \$i ]"
  kill -9 \$i
done
EOF
    CHECK_RESULT=0
    CHECK_COUNT=30
    while [ $CHECK_RESULT -eq 0 ];do
      if [ $CHECK_COUNT -gt 0 ];then
        echo "等待监听端口关闭..."
        sleep 2
        netstat -tln | grep ":$PROCESS_EXPORTER_PORT"
        CHECK_RESULT=$?
        CHECK_COUNT=$(($CHECK_COUNT-1))
      else
        echo "ERROR: 关闭$PROCESS_EXPORTER_PORT端口超时,请检查!"
        exit 1
      fi
    done
    echo "关闭 PROCESS_EXPORTER 成功!"
}

restart(){
    stop
    start
}

status(){
    su $PROCESS_EXPORTER_USER -c "ps aux | grep $PROCESS_EXPORTER_DIR/process-exporter | grep -v \"grep\" | grep -v \"su $PROCESS_EXPORTER_USER\""
}

remove(){
    rm -rf $LOG_FILE
    rm -rf $PROCESS_EXPORTER_DIR
    #userdel -r $PROCESS_EXPORTER_USER
}

usage ()
{
    echo " "
    echo "Please input start to start PROCESS_EXPORTER."
    echo "Please input stop to stop PROCESS_EXPORTER."
    echo "Please input status to get PROCESS_EXPORTER status."
    echo "Please input restart to restart PROCESS_EXPORTER."
    echo "Please input remove to remove PROCESS_EXPORTER."
    echo " "
}

INPUT_ACTIVE=$1
ACTIVE=${INPUT_ACTIVE:=start}
case ${ACTIVE} in
    start)
        start
        ;;
    stop)
        stop
        ;;
    status)
        status
        ;;
    restart)
        restart
        ;;
    remove)
        remove
        ;;
    *)
        usage
        ;;
esac

3、修改匹配器配置

vim /app/process-exporter/process-exporter.yaml
process_names:
  - name: "{{.Matches}}"
    cmdline:
    - 'docker'
systemctl restart process_exporter

image.png

4、prometheus 添加监控

vim /app/prometheus/prometheus.yml
      - job_name: 'wxhntmy-process'              #进程监控
        static_configs:
        - targets: ['localhost:9256']

image.png

5、prometheus 添加 rules

vim /app/prometheus/prometheus.yml
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  - "/app/prometheus/*_rules.yaml"
  # - "first_rules.yml"
  # - "second_rules.yml"

image.png

vim /app/prometheus/process_exporter_rules.yaml

image.png

groups:
- name: process
  rules:
    - alert: ProcessDockerDown
      expr: (namedprocess_namegroup_num_procs{groupname="map[:docker]"}) == 0
      for: 1m
      labels:
        severity: warning
      annotations:
        summary: "{{ $labels.instance }}: Process Docker Down"
        description: "{{ $labels.instance }}: Process Docker has been down for more than 1m"
        value: "{{ $value }}"

image.png
重启Prometheus

systemctl restart prometheus

image.png

6、查看 Prometheus

image.png
image.png

7、添加 Grafana 监控面板

:::info Import ID 是:249 :::image.png
image.png


博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。