云环境中,业务运行的实际情况的持续监控有助于预防潜在的问题、避开业务中断和提高业务连续性很关键。下面是华纳云为大家分享的关于网站业务的云监控工具,构建监控和报警体系的一般步骤。
先对监控需求进行详细分析,如监控主要对象、监控哪些指标、报警的相关渠道等,再依照需求选择合适的监控工具。当前常见的工具有Zabbix、Prometheus、Grafana等。确定开始搭建监控环境。根据官方文档安装监控工具。配置相关参数,如监控指标、报警阈值等。
安装Zabbix,先下载安装包:
yum install https://mirrors.huaweicloud.com/zabbix/zabbix/6.2/rhel/8/x86_64/zabbix-release-6.2-3.el8.noarch.rpm
sed -i 's#https://repo.zabbix.com#https://mirrors.huaweicloud.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-server-mysql
yum install zabbix-agent2 -y
yum install zabbix-web-mysql zabbix-nginx-conf.noarch nginx -y
安装配置数据库(如MySQL):
yum install mysql-server -y
systemctl enable --now mysqld
mysql -uroot -p
create database zabbix charset utf8 collate utf8_bin;
create user zabbix@localhost identified with mysql_native_password by 'zabbix';
grant all privileges on zabbix.* to zabbix@localhost;
导入数据:
yum install zabbix-sql-scripts.noarch -y
cd /usr/share/zabbix-sql-scripts/mysql
zcat server.sql.gz | mysql zabbix
mysql zabbix < double.sql
mysql zabbix < history_pk_prepare.sql
配置数据库:
grep ^DB /etc/zabbix/zabbix_server.conf
# 设置 DBName, DBUser, DBPassword
启动服务:
systemctl restart nginx.service php-fpm.service zabbix-server.service zabbix-agent2.service
访问Zabbix Web界面进行安装配置。
Prometheus的安装(Ubuntu),更新系统包索引:
sudo apt update
sudo apt upgrade -y
下载sudo apt update
wget https://github.com/prometheus/prometheus/releases/download/v2.26.0/prometheus-2.26.0.linux-amd64.tar.gz
解压Prometheus包:
tar xvf prometheus-*.tar.gz
配置prometheus,进入解压目录后编辑prometheus,yml配置文件。启动prometheus:
./prometheus --config.file=prometheus.yml
访问prometheus的web界面进行设置。
Grafana安装先下载:
wget https://dl.grafana.com/enterprise/release/grafana-enterprise-11.1.4.linux-amd64.tar.gz
解压重命名:
tar -zxvf grafana-enterprise-11.1.4.linux-amd64.tar.gz
mv grafana-v11.1.4 /data/grafana
编写Grafana服务文件:
vim /usr/lib/systemd/system/grafana-server.service
添加:
[Unit]
Description=Grafana
After=network.target
[Service]
Type=notify
ExecStart=/data/grafana/bin/grafana-server -homepath /data/grafana
Restart=always
[Install]
WantedBy=multi-user.target
启动Grafana:
systemctl start grafana-server.service
用浏览器访问http://<服务器IP地址>:3000,默认账号密码为admin/admin,进行设置。
安装好相关监控工具后,部署agent可以收集服务器性能数据,把监控工具和报警系统集成实现实时报警功能。
还可以配置Prometheus等工具,编写告警规则,自定义触发告警的条件。使用工具配置告警通知方式,设置不同的告警级别,对应不同的通知渠道和接收人。
还可以用自动化运维方式编写脚本,可以在接收到告警后自动执行预设故障处理。用Grafana等工具能可连接Prometheus数据源提供仪表盘,直观表现云主机的各项监控指标。
搭建好监控环境后,多次测试和优化可以保证监控工具正常收集服务器性能数据,报警系统可及时发出报警通知,根据实际情况调整监控指标和报警阈值。
用监控平台可以及时发现故障,分析监控数据定位故障原因,并采取对应措施。定期分析监控数据可以发现性能瓶颈,并根据性能分析结果采取相应优化措施。对监控工具设置合理权限,避免未经授权的访问。