O Operational Reporting fornece suporte ao monitoramento e controle das atividades diárias da empresa. O objetivo deste artigo de blog é familiarizá-lo mais com os relatórios operacionais disponíveis no ClusterControl.
Os relatórios operacionais do ClusterControl fornecem informações sobre o status de sua infraestrutura de banco de dados, que você pode usar para auditar seu ambiente ou como parte do suporte operacional. Esses relatórios consistem em diferentes verificações e abordam várias tarefas diárias do DBA. A ideia por trás do relatório operacional do ClusterControl é colocar todos os dados mais relevantes em um único documento que pode ser analisado rapidamente para obter uma compreensão clara do status dos bancos de dados e seus processos.
Com o ClusterControl, você pode agendar relatórios entre ambientes como "Relatório Diário do Sistema", "Relatório de Atualização de Pacote", "Relatório de Alteração de Esquema", bem como "Backups" e "Disponibilidade". Esses relatórios ajudarão você a manter seu ambiente seguro e operacional. Você também verá recomendações sobre como corrigir lacunas. Os relatórios podem ser endereçados a SysOps, DevOps ou mesmo a gerentes que gostariam de receber atualizações regulares de status sobre a integridade de um determinado sistema.
Por que preciso de relatórios operacionais?
Você já pode ter uma excelente ferramenta de monitoramento com todas as métricas/gráficos possíveis e provavelmente também configurou alertas com base em métricas e limites (alguns até terão consultores automatizados fornecendo recomendações ou corrigindo coisas automaticamente). sistema é importante; no entanto, você precisa ser capaz de processar muitas informações. Ferramentas integradas como o ClusterControl têm a vantagem de que todos os bits variados de informação estão localizados no mesmo local.
Em sistemas menores, você pode querer fazer algumas verificações manuais, mas em ambientes maiores, é impossível analisar tudo em tempo real. Também soa como uma perda de tempo. Para garantir que seus sistemas estejam em boa forma, você precisa passar por muitas informações. Normalmente, isso inclui estatísticas de host, estatísticas de banco de dados, estado de backups, logs e assim por diante.
O que monitorar e com que frequência?
Depois de configurar todas as ferramentas de monitoramento/gerenciamento do banco de dados, você precisa estabelecer uma rotina para verificar a integridade dos bancos de dados. A frequência com que você gostaria de fazer isso depende de você e deve se basear no tamanho/carga de trabalho do seu ambiente ou nos padrões de conformidade da sua empresa ou do setor. Para configurações menores, verificações diárias funcionarão. Para configurações maiores, você provavelmente terá que fazer isso a cada semana. O raciocínio por trás disso é que os testes regulares devem permitir que você aja proativamente e corrija quaisquer problemas antes que eles aconteçam ou se tornem graves. Claro, você eventualmente desenvolverá seu padrão, mas aqui estão algumas dicas sobre o que você pode querer.
O que monitorar provavelmente estará relacionado ao papel que você desempenha em sua organização de TI. DBAs, DevOps, Desenvolvedores ou Gerenciamento de TI terão necessidades diferentes.
Relatórios operacionais do ClusterControl
Programador de relatórios de operação
Antes de começarmos a descrever relatórios operacionais específicos, vamos dar uma olhada rápida no agendador de relatórios. Você pode configurar relatórios automatizados recorrentes com base no nome do cluster. A taxa de geração é dividida em tipo diário, semanal, mensal. Cada um deles lhe dará a opção de configurar o relatório conforme necessário, como todo 5º dia do mês para um tipo mensal ou toda terça-feira, se você pegar relatórios semanais.
ClusterControl Operational Report Scheduler
Na segunda seção do agendador de relatórios, você pode escolher os destinatários. É uma boa oportunidade para configurar alguns alertas para a equipe gestora, depois mais técnicos para o suporte de TI. Agendar isso corretamente pode tirar muito as tarefas da TI, ou seja, quando o gerenciamento está solicitando relatórios de disponibilidade ou a equipe de segurança precisa saber a versão dos pacotes e as alterações de esquema.
Relatório de backup
O Relatório de Backup Semanal é um relatório HTML que fornece uma visão geral dos backups para o período do relatório para todos os clusters gerenciados. O relatório de backup é dividido em duas seções; resumo de backup e detalhes de backup.
Na seção principal do relatório, você pode ver o resumo de todos os seus clusters com tipo de cluster, último backup, backups com falha e bem-sucedidos, taxa de sucesso e período de retenção. O que também é importante é que você também verá informações sobre clusters sem conjunto de backup. É extremamente útil se você esquecer de configurar o backup ou se os backups pararem de funcionar por algum motivo.
Relatório operacional de resumo de backup do ClusterControl
Nos detalhes do backup, você pode rastrear um ID de backup específico com informações detalhadas sobre localização, tamanho, hora e método. Usamos os mesmos modelos com dados para diferentes tipos de banco de dados, portanto, ao gerenciar seu ambiente misto, você terá a mesma sensação e aparência. Ajuda a gerenciar melhor os diferentes backups de banco de dados.
Como funciona esta solução? Coletamos informações sobre o processo de backup, os sistemas, plataformas e dispositivos na infraestrutura de backup quando o trabalho de backup é acionado. Todas essas informações são agregadas e armazenadas em um CMON (banco de dados do repositório ClusterControl), portanto, não há necessidade de consultar bancos de dados específicos adicionalmente.
Relatório de cluster padrão
O Relatório de cluster padrão contém todas as informações detalhadas sobre um determinado cluster. Ele começa com uma revisão de vários alertas relacionados ao grupo de clusters.
ClusterControl Relatório de cluster padrão
A próxima seção é sobre o estado dos nós que fazem parte do cluster. Você tem uma lista dos nós no cluster, seu tipo, função (mestre ou escravo), o status do nó, o tempo de atividade e o sistema operacional.
ClusterControl Tempo de atividade e funções do nó de relatório de cluster padrão
Outra seção do relatório é o resumo de backup, o mesmo que discutimos acima.
ClusterControl Detalhes de backup do relatório de cluster padrão
A próxima apresenta uma revisão das principais consultas no cluster. Por fim, vemos uma “Visão geral do status do nó” na qual você receberá gráficos relacionados às métricas do SO e do MySQL para cada nó.
ClusterControl Status do nó de visão geral do cluster padrão
Relatório de atualização
Este relatório de cluster ajudará você a manter seus pacotes atualizados e seguros. O Relatório de Atualização reúne informações do sistema operacional e as compara com os pacotes disponíveis no repositório.
O relatório está dividido em quatro seções; resumo de atualização, pacotes de banco de dados, pacotes de segurança e outros pacotes. Você pode comparar rapidamente o que instalou em seu sistema e encontrar uma atualização ou patch recomendado.
Relatório de detecção de alterações de esquema
O Relatório de Detecção de Alterações de Esquema mostra quaisquer alterações de DDL em seu banco de dados. Para funcionar corretamente requer um parâmetro adicional no arquivo de configuração do ClusterControl. Se não estiver definido, você verá as seguintes informações:schema_change_detection_address não está definido em /etc/cmon.d/cmon_1.cnf. Uma vez que isso esteja em vigor, uma saída de exemplo pode ser como abaixo:
Relatório de alteração do esquema do ClusterControl
Relatório de disponibilidade
Por último, mas não menos importante, está o Relatório de Disponibilidade. A disponibilidade é notoriamente difícil de medir e relatar, embora seja um KPI importante em qualquer SLA entre você e seu cliente. Pensando nisso, criamos um relatório que pode medir o uptime do seu banco de dados. O script é colocado em sua conta durante a manutenção planejada que você pode definir no ClusterControl. Com base nas informações do relatório, você pode ver se está alinhado com seu SLA interno ou externo e planejar alterações na infraestrutura de banco de dados para manter os noves planejados.
Relatório de alteração do esquema do ClusterControl
A seção principal do relatório descreve o tempo de atividade/inatividade e a disponibilidade para o período do relatório para cada cluster gerenciado pelo ClusterControl. As informações são combinadas para todos os clusters, independentemente do tipo de cluster.
ClusterControl relatório de disponibilidade histórico do estado do cluster
Abaixo, em detalhes, você pode ver importantes mudanças de estado ocorridas no período do relatório, bem como as reinicializações do controlador. As reinicializações do controlador não afetam o tempo de atividade ou o tempo de inatividade e a manutenção planejada não será contada no relatório.
Histórico do nó do relatório de disponibilidade do ClusterControl
Conclusão
O Multiplenines ClusterControl pode ajudá-lo a cobrir vários aspectos da conformidade do seu sistema de banco de dados. Começando com os detalhes do histórico de backup, que você pode usar para rastrear itens como conclusão de backup, histórico e servidores sem uma política de backup adequada para empacotar relatórios de atualização com pacotes de sistema desatualizados e alterações de esquema. Com algumas etapas, você pode agendar verificações de nível empresarial em seus bancos de dados de código aberto. Tudo isso dará às suas equipes de gerenciamento e suporte uma visão melhor sobre suas operações de banco de dados.