Como ativar a tolerância a falhas automaticamente

O monitoramento de integridade do servidor observa como um servidor reage ao carregamento operacional e controla sua capacidade de resposta às solicitações do cliente. A finalidade desse monitoramento é evitar falhas de servidor, verificando se o servidor sempre retém capacidade suficiente para conduzir as tarefas necessárias. A maioria das ferramentas de monitoramento de integridade padrão oferece suporte de monitoramento do servidor remoto através dos protocolos HTTP e HTTPS.
casm173
O monitoramento de integridade do servidor observa como um servidor reage ao carregamento operacional e controla sua capacidade de resposta às solicitações do cliente. A finalidade desse monitoramento é evitar falhas de servidor, verificando se o servidor sempre retém capacidade suficiente para conduzir as tarefas necessárias. A maioria das ferramentas de monitoramento de integridade padrão oferece suporte de monitoramento do servidor remoto através dos protocolos HTTP e HTTPS.
O recurso de tolerância automática a falhas do CA SDM expõe as seguintes interfaces padrão com base em HTTP:
  • Interface de monitoramento de integridade: interface HTTP(S) para monitorar a integridade do servidor de segundo plano. Ela também cria decisões de tolerância a falhas confiáveis para iniciar um mecanismo de tolerância a falhas em um servidor em espera determinado, no caso de alguma interrupção na disponibilidade do servidor de segundo plano ou na capacidade de realizar as tarefas necessárias.
  • Interface de inicialização de tolerância a falhas: interface HTTP(S) para promover o servidor em espera escolhido como o novo servidor de segundo plano sem causar a interrupção do serviço.
Siga estas etapas:
  1. Instale o Apache Tomcat 8.5.43 no servidor de segundo plano e em todos os servidores em espera.
    Certifique-se de que o Tomcat esteja usando o JRE 1.8 e certifique-se de que o Tomcat não esteja usando o número da porta que está configurado para os componentes do CA SDM.
  2. (Opcional) Configurar SSL nos servidores Tomcat que você instalou. Para obter mais informações sobre como configurar o SSL, consulte Como configurar a autenticação SSL.
  3. Efetue logon no servidor de segundo plano.
  4. Implante o servlet de integridade. Conclua as seguintes etapas:
    1. Copie o arquivo HealthServlet.war da pasta $NX_ROOT/samples/HealthServlet para o
      TOMCAT_HOME
      /webapps.
    2. Reinicie o Tomcat.
    O arquivo HealthServlet.war foi implantado na pasta webapps. Para confirmar a implantação, verifique se a pasta HealthServlet é criada na mesma pasta webapps.
    Após a implantação bem-sucedida, o servlet de integridade está pronto para executar as verificações de integridade. Ele inclui a verificação do status do SLUMP e da integridade dos processos do CA SDM que são definidos no arquivo health.xml. Pesquise o arquivo health.xml no seguinte local:
    TOMCAT_HOME/webapps/HealthServlet/WEB-INF/classes
  5. (Opcional) Personalize o arquivo health.xml com base nas necessidades de sua empresa. Por exemplo, se deseja monitorar o processo do webengine. Adicione o processo no arquivo health.xml com o tagname correto, como definido no CA SDM. Conclua as seguintes etapas para encontrar o tagname:
    1. Abra os arquivos pdm_startup.i e pdm_startup do diretório $NX_ROOT/pdmconf.
    2. Procure o processo que você deseja monitorar em ambos os arquivos.
    3. Localize o respectivo tagname fazendo corresponder as variáveis em ambos os arquivos.
      Por exemplo, o processo webengine é definido no arquivo pdm_startup.i como a segue:
      #define WEBENGINE(_TAG,_HOST,_SLUMP_NAME,_DOMSRVR, _CFG, _WEBDIRECTOR, _RPC_NAME)
      O processo webengine é definido no arquivo pdm_startup da seguinte maneira:
      WEBENGINE(webengine, $NX_LOCAL_HOST, web:local, domsrvr, $NX_ROOT/bopcfg/www/web.cfg, "", "rpc_srvr:%h")
      No exemplo, é possível descobrir que o tagname do processo web engine é webengine.
      Se você estiver criando um novo processo, o processo existente será comentado no arquivo pdm_startup, e novas entradas serão criadas. Certifique-se de procurar o tagname nas novas entradas do processo.
      Se você modificar o health.xml, certifique-se de que o XML não tenha erros e de que o Tomcat tenha sido reiniciado de modo a refletir as alterações realizadas no XML.
  6. Execute as etapas 4 e 5 para todos os servidores em espera.
  7. Configure a ferramenta de terceiros escolhida para monitorar a integridade do servidor de segundo plano em intervalos regulares. Para monitorar a integridade, use o seguinte URL HTTP:
    http(s)://Background_server_name:port_number/HealthServlet/GetHealth
  8. Configure a ferramenta de terceiros escolhida para iniciar uma lógica de tolerância a falhas quando a integridade do servidor de segundo plano ficar prejudicada. Recomendamos configurar a lógica de tolerância a falhas para promover o servidor em espera como o novo servidor de segundo plano. Use o seguinte servlet de tolerância a falhas, na lógica de tolerância a falhas:
    É recomendado que você configure o servlet de tolerância a falhas no SSL com os privilégios de acesso fornecidos somente a usuários predefinidos. Siga essa recomendação para configurar as ferramentas de terceiros para iniciar a tolerância a falhas.
    http(s)://Standby_server_name:port_number/HealthServlet/FailoverServlet
    Você ativou a tolerância a falhas automaticamente.
  9. Após o êxito na configuração, a ferramenta de terceiros inicia o monitoramento da integridade do servidor de segundo plano usando o URL do servlet de integridade.
    • Cada tipo de servidor possui seu próprio conjunto de processos. Se o SLUMP e todos os processos do CA SDM estiverem funcionando adequadamente, a ferramenta de terceiros receberá uma resposta do HTTP 200 do servidor de segundo plano com uma carga predefinida:
      AA-Server-Status: All OK! AA-Server-Role: BG
    • Se um SLUMP ou qualquer um dos processos do CA SDM (listados em health.xml) parar de funcionar e não puder ser retomado, a ferramenta de terceiros receberá uma resposta do HTTP 503 do servidor de segundo plano com uma carga de implantação predefinida, como a seguir:
      AA-Server-Status: NOT OK! AA-Server-Role: BG
  10. Se a resposta HTTP 503 for recebida, a ferramenta de terceiros iniciará automaticamente a lógica de tolerância a falha.