winc 2019-09-05
前面文章介绍使用docker compose组合应用并利用scale快速对容器进行扩容。
由于docker compose启动的服务都在同一台宿主机上,对于一个宿主机上运行多个容器应用时,容器的运行情况如:CPU使用率、内存使用率、网络状态、磁盘空间等一系列随时间变化的时序数据信息,都是需要去了解,因此监控是必须的。
对于容器的监控方案可谓多种多样,本身自带命令docker stats命令,Scout,Data Dog,Sysdig Cloud,Sensu Monitoring Framework,CAdvisor等。
通过docker stats命令可以很方便的看到当前宿主机上所有容器的CPU,内存以及网络流量等数据。但是docker stats命令的缺点就是统计的只是当前宿主机的所有容器,而获取的监控数据是实时的,没有地方存储,也没有报警功能。
docker stats
而Scout、Sysdig Cloud、Data Dog虽然都提供了较完善的服务,但是它们都是托管的服务而且都收费,Sensu Monitoring Framework集成度较高,也免费,但是部署过于复杂。综合考虑,我们选择了CAdvisor做容器监控工具。
CAdvisor谷歌出品,优点是开源产品,监控指标齐全,部署方便,而且有官方的docker镜像。缺点是集成度不高,默认只在本地保存2分钟数据。不过可以加上InfluxDB存储数据,对接Grafana展示图表,比较便利地搭建好了容器监控系统,数据收集和图表展示效果良好,对系统性能也几乎没有什么影响。
CAdvisor是一个容器资源监控工具,包括容器的内存,CPU,网络IO,磁盘IO等监控,同时提供了一个WEB页面用于查看容器的实时运行状态。CAdvisor默认存储2分钟的数据,而且只是针对单物理机。不过,CAdvisor提供了很多数据集成接口,支持InfluxDB,Redis,Kafka,Elasticsearch等集成,可以加上对应配置将监控数据发往这些数据库存储起来。
CAdvisor功能主要有两点:
InfluxDB是用Go语言编写的一个开源分布式时序、事件和指标数据库,无需外部依赖。
前面说到,CAdvisor默认只在本机保存最近2分钟的数据,为了持久化存储数据和统一收集展示监控数据,需要将数据存储到InfluxDB中。InfluxDB是一个时序数据库,专门用于存储时序相关数据,很适合存储CAdvisor的数据。而且,CAdvisor本身已经提供了InfluxDB的集成方法,丰启动容器时指定配置即可。
InfluxDB主要功能:
InfluxDB主要特点:
Grafana是一个开源的数据监控分析可视化平台,支持多种数据源配置(支持的数据源包括InfluxDB,MySQL,Elasticsearch,OpenTSDB,Graphite等)和丰富的插件及模板功能,支持图表权限控制和报警。
Grafan主要特性:
CAdvisor:负责收集容器的随时间变化的数据
InfluxDB:负责存储时序数据
Grafana:负责分析和展示时序数据
docker run -d --name influxdb -p 8086:8086 \ -v /data/influxdb:/var/lib/influxdb \ --hostname=influxdb \ influxdb
说明:
1、浏览器访问influxdb的管理端,http://ip:8083
2、创建test的数据库与root用户,这个用于后期配granfa
docker exec it influxdb influx CREATE DATABASE "test" CREATE USER "root" WITH PASSWORD 'root' WITH ALL PRIVILEGES
谷歌的cadvisor可以用于收集Docker容器的时序信息,包括容器运行过程中的资源使用情况和性能数据。
docker run --volume=/:rootfs:ro --volume=/var/run:/var/run:ro\ --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro\ --volume=/dev/disk/:/dev/disk:ro --volume=/cgroup:/cgroup:ro \ --publish=8080:8080 --detach=true --privileged=true --name=cadvisor \ google/cadvisor:latest\ -storage_driver=influxdb-storage_driver_host=influxdb:8086\ -storage_driver_db=test-storage_driver_user=root\ -storage_driver_password=root
说明:
通过ip:8080端口访问测试一下
grafana是一款开源的时序数据分析工具,而且界面专业简单。
docker run -d -p 3000:3000 \ -v /data/grafana:/var/lib/grafana \ --link=influxdb:influxdb\ --name grafana grafana/grafana
注意:如果使用-v把数据挂载出来会出现容器启动失败,错误为mkdir:cannot create directory '/var/lib/grafana/plugins':Permission denied,此时可以使用docker run --entrypoint "id" grafana/grafana得到uid,gid,groups(默认是472);
接着使用chown -R 472:472 /data/grafana/修改目录权限就可以启动成功。
通过ip:3000端口来访问grafana的web服务,第一次访问需要修改admin用户密码,默认用户名/密码为admin/admin
version: '3.1' volumes: grafana_data: {} services: influxdb: image: tutum/influxdb:0.9 #image: tutum/influxdb #image: influxdb restart: always #user: environment: - PRE_CREATE_DB=cadvisor ports: - "8083:8083" - "8086:8086" expose: - "8090" - "8099" volumes: - ./data/influxdb:/data cadvisor: #image: google/cadvisor:v0.29.0 image: google/cadvisor links: - influxdb:influxsrv command: -storage_driver=influxdb -storage_driver_db=cadvisor -storage_driver_host=influxsrv:8086 restart: always ports: - "8080:8080" volumes: - /:/rootfs:ro - /var/run:/var/run:rw - /sys:/sys:ro - /var/lib/docker/:/var/lib/docker:ro grafana: #image: grafana/grafana:2.6.0 user: "104" image: grafana/grafana user: "104" #user: "472" restart: always links: - influxdb:influxsrv ports: - "3000:3000" volumes: - grafana_data:/var/lib/grafana environment: - HTTP_USER=admin - HTTP_PASS=admin - INFLUXDB_HOST=influxsrv - INFLUXDB_PORT=8086 - INFLUXDB_NAME=cadvisor - INFLUXDB_USER=root - INFLUXDB_PASS=root
启动docker-compose文件
docker-compose up
查看三个服务容器是否启动
浏览grafana服务,http://ip:3000
登陆grafana服务
浏览influxdb服务,http://ip:8083/
1、配置数据源
选择influxdb数据源
具体配置如下
配置完成后,如下图
2、配置面板
选择面板类型
选择图形
配置查询条件
配置完后,效果如下图
grafana支持查询条件,可以从influxdb中了解
浏览cAdvisor服务,http://ip:8080/