3.2 Configurando o Servidor de Monitoramento

Nesta sessão iremos configurar o nosso supervisor. Para a sua instalação é possível seguir os passos descritos na documentação oficial. Existem dois papéis principais quando se fala em sistemas de monitoramento, um deles é o de supervisor, ou seja, aquele elemento que é responsável pelo monitoramento em si de todos os demais elementos, que são os chamados supervisionados. No exemplo da figura acima, o Servidor de Monitoramento Nagios seria o supervisor e os Servidores Web e de Banco de Dados os supervisionados.

Entretanto, da mesma forma como fizemos com os Servidores Web e de Banco de Dados, vamos nos aproveitar de imagens já disponíveis no Docker Hub.

Ao pesquisar por Nagios no Docker Hub, aparecem várias imagens disponíveis. Vamos utilizar a mais popular, conforme destacado na imagem abaixo.

Novamente, recomenda-se a leitura de toda a documentação da imagem para facilitar o seu uso. Além disso, é possível também consultar diferentes fóruns na Internet pesquisando sobre como usar ou personalizar a imagem jasonrivers/nagios, que é a que utilizaremos aqui.

Conforme pode ser observado na documentação, essa imagem contém o Nagios Core 4.4.5 executando sobre um Ubuntu 16.04 LTS e irá nos atender perfeitamente para conduzir o monitoramento do nosso sistema, conforme ilustrado a seguir.

Para carregarmos a imagem e fazermos uso da mesma iremos proceder como fizemos com os demais servidores. Inicialmente vamos executar um docker run na imagem original e, posteriormente, iremos redigir um Dockerfile para configurá-la de forma a atender as nossas necessidades específicas.

docker run -p 80:80 jasonrivers/nagios

O comando acima fará o download da imagem jasonrivers/nagiose irá mapear a porta 80, exposta pelo contêiner na porta local 80 de nossa máquina hospedeira de modo que, após iniciar o contêiner, o Nagios estará disponível na URL: http://localhost:80/. Se tudo correr bem, a saída do comando acima será simular a essa: http://localhost:80/.

Adding password for user nagiosadmin
Started runsvdir, PID is 10
checking permissions for nagios & nagiosgraph
rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="18" x-info="http://www.rsyslog.com"] start
postfix/master[16]: daemon started -- version 3.1.0, configuration /etc/postfix

Nagios Core 4.4.5
Copyright (c) 2009-present Nagios Core Development Team and Community Contributors
Copyright (c) 1999-2009 Ethan Galstad
Last Modified: 2019-08-20
License: GPL

Website: https://www.nagios.org
Nagios 4.4.5 starting... (PID=17)
Local time is Tue Sep 22 19:42:19 UTC 2020
nagios: Nagios 4.4.5 starting... (PID=17)
nagios: Local time is Tue Sep 22 19:42:19 UTC 2020
nagios: LOG VERSION: 2.0
nagios: qh: Socket '/opt/nagios/var/rw/nagios.qh' successfully initialized
nagios: qh: core query handler registered
nagios: qh: echo service query handler registered
nagios: qh: help for the query handler registered
wproc: Successfully registered manager as @wproc with query handler
nagios: wproc: Successfully registered manager as @wproc with query handler
wproc: Registry request: name=Core Worker 37;pid=37
...
...
Successfully launched command file worker with pid 49
nagios: Successfully launched command file worker with pid 49

Ao digitar o endereço http://localhost:80/ no navegador, será aberta uma janela para autenticar no Servidor de Monitoramento. Conforme a documentação da imagem, o login padrão é nagiosadmine a senha padrão é nagios.

Ao preencher esses campos com as informações acima tem-se acesso ao painel do Nagios Core, conforme ilustrado na figura abaixo.

Observa-se no centro da figura acima que o processo do Nagios está em execução e a versão do Nagios Core em uso é a 4.4.5. Ao clicar na opção Hosts do menu lateral, tem-se acesso aos dados dos hosts supervisionados pelo Nagios até o momento.

Como pode ser observado, o único host monitorado é o próprio localhost, que seria, no caso, um auto monitoramento, ou seja, o Nagios é tanto o supervisor quanto o supervisionado até o momento.

Ao clicar no nome do host, localhost, são exibidos mais detalhes do mesmo, conforme apresentado a seguir.

Observa-se que a tela traz uma série de informações sobre o host supervisionado e ainda, na parte superior, apresenta outros links com mais detalhes sobre o host em questão. Navegue a vontade por ela e descubra informações adicionais disponibilizadas pela ferramenta.

No menu lateral, é possível também explorar a opção Services e, desse modo, descobrir quais serviços são oferecidos pelo host e quais estão operando adequadamente.

Como pode ser observado no host em questão, há um aviso sobre o serviço http que pode ser um problema dependendo do tipo de serviço que se espera que o host ofereça.

Os serviços com status OK indicam que os mesmos estão operacional e funcionando. Pode ocorrer que um serviço esteja com status PENDING e, nesse caso, significa que a verificação desse serviço ainda não finalizou. Outros status possíveis são os de WARNING, que indicam que algo não está funcionando 100% e os de ERROR que, nesse caso, indicam a falha no serviço em questão.

No caso desta configuração do Nagios, por padrão, são verificados os serviços listados acima, cujo significado é dado abaixo:

Current Load (Carga Atual): indica quão ocupada está a CPU do host. Segundo Sato (2028), a carga é medida pela média móvel do tamanho da fila de processo aguardando para executar. Em situações de sobrecarga da CPU, a fila de processos em espera aumenta e, consequentemente, o tempo de execução também, gerando um alerta caso esse valor de carga atinja determinado limite definido na verificação.
Current Users (Usuários Atuais): indica quando usuários logados há no sistema, sendo uma maneira simples para a detecção de ataques de intrusão no nosso servidor.
HTTP: verifica se o servidor esta aceitando conexões do tipo HTTP sendo que o padrão é verificar a conexão na porta 80, mas é possível também verificar a execução de serviços em portas diferentes, como será visto mais adiante.
PING: verificação simples se o servidor está em atividade, respondendo ao comando ping.
Root Partition (Partição Principal): faz uma verificação da partição principal do sistema, identificando o espaço disponível. Caso essa partição encha, certamente o servidor enfrentará problemas na execução de suas atividades.
Swap Usage (Uso da Partição de Troca): a partição de troca é utilizada, dentre outras coisas, para salvar o contexto de processos em execução e para paginação quando o espaço disponível na RAM não permite comportar a demanda de memória de todos os processos em execução. Assim sendo, monitorar a partição de troca permite identificar a carência de memória RAM ou seu esgotamento para que o servidor execute adequadamente suas atividades.
Total Process (Total de Processos): permite avaliar a sobrecarga no servidor monitorando o número total de processos em execução no servidor. Quanto maior esse número, pior o desempenho do servidor.

Esses são apenas alguns dos serviços de verificação realizados por padrão nessa configuração do contêiner do Nagios que estamos fazendo uso. Posteriormente, faremos uso de outras rotinas de verificação. O Nagios é extensível por meio de plugins e existem vários plugins que podem ser configurados para estender a capacidade de monitoramento do Nagios. No contêiner atual, a lista de rotinas de verificação disponível está localizada em /opt/nagios/libexec. É possível, por exemplo, testar o uso das mesmas via linha de comando, após conectar no prompt do servidor em execução.

Por exemplo, ao executar o comando docker exec abaixo, abrimos um prompt bash no contêiner em execução. Primeiro precisamos descobrir o Continer ID para podermos nos conectar ao mesmo.

docker ps

A saída desse comando é semelhante a exibida abaixo. No seu caso, o Conteiner ID será um numero diferente deste. Basta copiar esse número e utilizá-lo no final do comando docker exec abaixo.

CONTAINER ID        IMAGE                COMMAND                  CREATED             STATUS              PORTS                NAMES
26d55ffcbe1b        jasonrivers/nagios   "/usr/local/bin/star…"   58 minutes ago      Up 58 minutes       0.0.0.0:80->80/tcp   cranky_diffie

docker exec -it 26d55ffcbe1b bash

Estando no prompt do contêiner em execução, a lista de comandos de verificação disponível pode ser consultada em /opt/nagios/libexec. Há verificações dos mais diversos tipos para garantirem a execução dos serviços que desejamos.

Por exemplo, a primeira verificação disponível nesse diretório, check_apt, faz a verificação do apt, gerenciador de pacotes das distribuições Debian. Ao chamar check_apt -u, é executado o comando apt update no host e, posteriormente, o resultado é exibido.

Ao executar essa verificação em dado host é possível descobrir se há pacotes que necessitam ser atualizados. No caso abaixo, como pode ser observado, existem 154 pacotes que poderiam ser atualizados na imagem desse contêiner.

$ cd /opt/nagios/libexec
$ ./check_apt -u
APT CRITICAL: 154 packages available for upgrade (130 critical updates). |available_upgrades=154;;;0 critical_updates=130;;;0

É por meio desses avaliadores que o Nagios consegue realizar o monitoramento e, posteriormente, exibir essas informações na sua interface. Nas seções a seguir iremos utilizar alguns deles para supervisionar nosso Servidor Web e nosso Servidor de Banco de Dados.

Antes de irmos para a próxima seção podemos executar os comandos abaixo para parar e remover a imagem padrão de nosso host.

$ docker ps -a
CONTAINER ID        IMAGE                COMMAND                  CREATED             STATUS              PORTS                NAMES
26d55ffcbe1b        jasonrivers/nagios   "/usr/local/bin/star…"   5 hours ago         Up 5 hours          0.0.0.0:80->80/tcp   cranky_diffie
$ docker stop 26d55ffcbe1b
26d55ffcbe1b
auri@amrv:~/temp/devops-extra/cap-03$ docker rm 26d55ffcbe1b
26d55ffcbe1b

Os passos acima executam as seguintes tarefas: 1) o docker ps na linha 1 lista os contêineres existentes; 2) o docker stop, interrompe a execução contêiner com ID 26d55ffcbe1b; e 3) finalmente o docker rm, remove o contêiner do nosso host. Na próxima seção vamos realizar a personalização dessa imagem genérica para iniciar a supervisão do ambiente de produção.

Previous3.1 Introdução Next3.3 Monitorando Servidores do Ambiente de Produção

Last updated 5 years ago

Was this helpful?