Sistema de monitoramento


O monitoramento de TI compreende uma ampla classe de produtos projetados para permitir que os analistas determinem se o equipamento de TI está online e funcionando de acordo com os níveis de serviço esperados, enquanto resolve quaisquer problemas detectados. As ferramentas de monitoramento de TI variam de verificações básicas a ferramentas mais avançadas que podem examinar detalhadamente o desempenho de um produto ou até mesmo automatizar reparos quando houver suspeita de problemas.

A engehx possui um sistema de monitoramento 24 horas para manter a alta disponibilidade dos ambientes de TI. Através do acompanhamento de toda infraestrutura, é possível antecipar problemas de performance e compreender as necessidades de forma preventiva.






MÉTRICAS USADAS


- Uso da CPU: Medir a carga no processador de um servidor. Se a utilização da CPU for alta, pode ser necessário substituir o hardware, para que ele possa gerenciar melhor todos os serviços executados nele. Você também pode redistribuir a carga para ajudar a evitar o uso excessivo.

- Desempenho do disco: O desempenho do armazenamento pode afetar seus aplicativos, portanto, ajuda a monitorar a entrada / saída enfileirada (E / S) e a latência do disco para ter uma ideia da frequência com que o disco está ocupado. O comprimento da fila de disco alto pode ser causado por um problema de desempenho de armazenamento, indicando que é hora de alterar o tipo de RAID ou adicionar discos físicos.

- Memória física e virtual: Rastrear a memória física, para ver onde existe o potencial de gargalos, o que indica que é necessário adicionar mais RAM. Enquanto isso, conforme o consumo de memória virtual aumenta, mais dados são movidos de e para a RAM, aumentando as chances de um gargalo ou fragmentação do arquivo de troca.



MONITORANDO A INTEGRIDADE DO SERVIDOR


- Disponibilidade e tempo de atividade do servidor: os servidores devem estar "ativos" na maior parte do tempo - pense em 99% das vezes. Se você começar a cair abaixo disso, é hora de prestar atenção.

- Segurança: Rastrear a segurança do servidor significa ficar de olho nas modificações, no acesso não autorizado e em outros eventos de segurança (normalmente, verificando os logs de eventos ).

- Desempenho do sistema: Você tem o que precisa para oferecer suporte ao desempenho do servidor? Isso inclui métricas como utilização de CPU, RAM suficiente, espaço em disco rígido e largura de banda.

- Desempenho do aplicativo: Os aplicativos e serviços são executados em seus servidores, portanto, é fundamental entender como esses processos estão afetando o desempenho e a carga do servidor.


Centralização

> É muito mais fácil visualizar as métricas de todos os dispositivos e aplicativos gerenciados em um painel consolidado. Você pode localizar pontos de acesso mais rapidamente, examinar listas e comparar métricas (e potencialmente obter uma linha de base histórica), obtendo facilmente uma imagem clara da integridade do sistema.



Relatórios

> Ter visões gerais para descrever as principais métricas em momentos específicos é útil para os técnicos, especialmente para fins de planejamento. Às vezes, também é fundamental para a conformidade.