A replicação é um recurso fundamental para a maioria das configurações e é suportada pela maioria das tecnologias de banco de dados no mercado. A comunidade PostgreSQL introduziu a replicação na versão 9.0 (chamada Streaming Replication ou SR), desde então a replicação no PostgreSQL evoluiu com recursos adicionais como replicação em cascata, decodificação lógica e várias outras otimizações.
Neste blog, veremos como usar a função postgresql do Ansible conforme desenvolvida por “Demonware” (um fork da função “ANXS/postgresql”). Eu já havia falado sobre o uso da função “ANXS/postgresql” em meu blog anterior, mas não discuti o recurso de replicação. A função Ansible “postgresql” adiciona a capacidade de configurar a replicação do PostgreSQL usando repmgr.
Sobre Repmgr
Repmgr é uma ferramenta de linha de comando de código aberto desenvolvida e mantida pelo 2ndQuadrant. A ferramenta automatiza a maioria das tarefas relacionadas ao gerenciamento do cluster de replicação do PostgreSQL. Abaixo está a lista de tarefas que podem ser executadas sem problemas usando o comando repmgr e o daemon repmgrd.
- Reinicializando o cluster de replicação do PostgreSQL.
- Fazendo failover automático e alternância manual da instância primária.
- Adicionar e remover instâncias em espera (réplica de leitura).
Preparando o nó do controlador
Prepare o nó do controlador com a função Ansible PostgreSQL, playbooks, inventários e replicação personalizada do PostgreSQL.
$ mkdir demo
$ pushd demo
$ mkdir roles
$ git clone https://github.com/Demonware/postgresql roles/postgresql
$ pushd roles/postgresql
$ git checkout add-repmgr-extension
Na função baixada, há dois arquivos de variáveis padrão main.yml e arquivo repmgr.yml. No entanto, o Ansible considerará apenas o arquivo main.yml. Para fazer o Ansible também usar o arquivo repmgr.yml estamos movendo os dois arquivos para o diretório defaults/main.
$ mkdir defaults/main
$ mv defaults/main.yml defaults/repmgr.yml defaults/main
$ popd
Arquivo de inventário Ansible
Para a demonstração, configuraremos o cluster de replicação do PostgreSQL em três nós. Criei três VMs CentOS vm-01, vm-02 e vm-03, todas listadas no grupo postgres_cluster no arquivo development.yaml.
$ cat development.yaml
all:
children:
postgres_cluster:
hosts:
vm-01:
vm-02:
vm-03:
vars:
ansible_user: "vagrant"
Faça o ping do Ansible e verifique se conseguimos alcançar todos os hosts no grupo postgres_cluster.
$ ansible -i development.yaml -m ping postgres_cluster
vm-01 | SUCCESS => {
"changed": false,
"ping": "pong"
}
vm-03 | SUCCESS => {
"changed": false,
"ping": "pong"
}
vm-02 | SUCCESS => {
"changed": false,
"ping": "pong"
}
Arquivo de variável personalizada
No arquivo de variável personalizada custom-vars.yaml, definiremos o seguinte:
- Versão do PostgreSQL a ser instalada e codificação a ser usada
- Modificando a configuração do PostgreSQL para habilitar a replicação, modificaremos os parâmetros como wal_level, max_wal_senders, max_replication_slots, hot_standby, archive_mode, archive_command
- Criando os usuários e o banco de dados necessários
- Modificando o arquivo pg_hba.conf para permitir a conexão necessária do aplicativo e a replicação repmgr
- Algumas variáveis relacionadas ao repmgr
$ cat custom-vars.yaml
# Basic settings
postgresql_version: 11
postgresql_encoding: "UTF-8"
postgresql_locale: "en_US.UTF-8"
postgresql_ctype: "en_US.UTF-8"
postgresql_admin_user: "postgres"
postgresql_default_auth_method: "peer"
postgresql_listen_addresses: "*"
postgresql_wal_level: "replica"
postgresql_max_wal_senders: 10
postgresql_max_replication_slots: 10
postgresql_wal_keep_segments: 100
postgresql_hot_standby: on
postgresql_archive_mode: on
postgresql_archive_command: "/bin/true"
postgresql_shared_preload_libraries:
- repmgr
postgresql_users:
- name: "{{repmgr_user}}"
pass: "password"
postgresql_databases:
- name: "{{repmgr_database}}"
owner: "{{repmgr_user}}"
encoding: "UTF-8"
postgresql_user_privileges:
- name: "{{repmgr_user}}"
db: "{{repmgr_database}}"
priv: "ALL"
role_attr_flags: "SUPERUSER,REPLICATION"
postgresql_pg_hba_custom:
- { type: "host", database: "all", user: "all", address: "192.168.0.0/24", method: "md5" }
- { type: "host", database: "replication", user: "repmgr", address: "192.168.0.0/24", method: "md5" }
- { type: "host", database: "replication", user: "repmgr", address: "127.0.0.1/32", method: "md5" }
# repmgr related variables
postgresql_ext_install_repmgr: yes
repmgr_target_group: "postgres_cluster"
repmgr_target_group_hosts: "{{ groups[repmgr_target_group] }}"
repmgr_master: "vm-03"
A seguir estão algumas das variáveis notáveis definidas em custom-vars.yaml:
- postgresql_version:11 - Instala o PostgreSQL versão 11
- postgresql_ext_install_repmgr:yes - Instala a extensão repmgr no cluster PostgreSQL
- repmgr_target_group:"postgres_cluster" - Repmgr funciona nos hosts definidos no grupo "postgres_cluster" definido no arquivo de inventário
- repmgr_master:"vm-03" - Host vm-03 será a instância primária do PostgreSQL, vm-01 e vm--02 serão replicados de vm-03
Manual do Ansible
No playbook postgres-play.yaml abaixo, atribuí a função postgresql ao grupo de hosts postgres_cluster. Também incluí o arquivo de variável personalizada custom-vars.yaml que tem a configuração para PostgreSQL e repmgr.
$ cat postgres-play.yaml
- hosts: postgres_cluster
become: yes
vars_files:
- ./custom-vars.yaml
roles:
- postgresql
Executando o Ansible Playbook
Agora criamos os seguintes artefatos do Ansible e estamos prontos para executar o playbook do Ansible.
- roles/postgresql, diretório de funções do Ansible.
- custom-vars.yaml, arquivo de variável Ansible.
- development.yaml, arquivo de inventário do Ansible.
- postgres-play.yam, arquivo de manual do Ansible.
Execute o comando ansible-playbook abaixo do nó do controlador. Como a função postgresql espera o acesso sudo do controlador, estamos especificando a opção -K no comando, que por sua vez nos pede para inserir a senha SUDO do nó do controlador.
$ ansible-playbook -Ki development.yaml postgres-play.yaml
SUDO password:
PLAY [postgres_cluster] ********************************************************************************************************************************************************************************************************************************************************
TASK [Gathering Facts] *********************************************************************************************************************************************************************************************************************************************************
ok: [vm-01]
ok: [vm-02]
ok: [vm-03]
...
...
PLAY RECAP *********************************************************************************************************************************************************************************************************************************************************************
vm-01 : ok=41 changed=4 unreachable=0 failed=0
vm-02 : ok=41 changed=5 unreachable=0 failed=0
vm-03 : ok=43 changed=5 unreachable=0 failed=0
Verifique o PLAY RECAP na saída do comando e certifique-se de que a contagem de falhas seja 0.
Verifique a replicação do PostgreSQL
Com o comando repmgr cluster show abaixo, podemos verificar o status do cluster de replicação do PostgreSQL. Ele mostra a função, o status, a linha do tempo de todas as instâncias do PostgreSQL no cluster de replicação.
$ sudo -u postgres /usr/pgsql-11/bin/repmgr -f /etc/postgresql/11/data/repmgr.conf cluster show
ID | Name | Role | Status | Upstream | Location | Priority | Timeline | Connection string
----+-------+---------+-----------+----------+----------+----------+----------+--------------------------------------------------------
1 | vm-01 | standby | running | vm-03 | default | 100 | 1 | host=vm-01 user=repmgr dbname=repmgr connect_timeout=2
2 | vm-02 | standby | running | vm-03 | default | 100 | 1 | host=vm-02 user=repmgr dbname=repmgr connect_timeout=2
3 | vm-03 | primary | * running | | default | 100 | 1 | host=vm-03 user=repmgr dbname=repmgr connect_timeout=2
Da saída do comando acima, vm-03 é o primário e vm-01,vm02 são a instância em espera que está replicando do nó upstream vm-03. Todas as instâncias do PostgreSQL estão no estado de execução.
Verificando a visualização pg_stat_replication na vm-03 primária para confirmar que a vm-01 e a vm-02 estão replicando bem.
$ sudo -iu postgres /usr/pgsql-11/bin/psql -h vm-03 -c 'select * from pg_stat_replication'
Password for user postgres:
pid | usesysid | usename | application_name | client_addr | client_hostname | client_port | backend_start | backend_xmin | state | sent_lsn | write_lsn | flush_lsn | replay_lsn | write_lag | flush_lag | replay_lag | sync_priority | sync_state
------+----------+---------+------------------+---------------+-----------------+-------------+-------------------------------+--------------+-----------+-----------+-----------+-----------+------------+-----------+-----------+------------+---------------+------------
8480 | 16384 | repmgr | vm-02 | 192.168.0.122 | | 59972 | 2019-07-18 09:04:44.315859+00 | | streaming | 0/A000870 | 0/A000870 | 0/A000870 | 0/A000870 | | | | 0 | async
8481 | 16384 | repmgr | vm-01 | 192.168.0.121 | | 35598 | 2019-07-18 09:04:44.336693+00 | | streaming | 0/A000870 | 0/A000870 | 0/A000870 | 0/A000870 | | | | 0 | async
(2 rows)
Adicionando outro nó de espera ao cluster
Para adicionar outro nó PostgreSQL ao cluster, basta executar novamente o playbook do Ansible após adicionar o host específico no inventário. Nas etapas abaixo, estou adicionando vm-04 ao meu cluster de replicação Repmgr Postgresql existente.
- Adicionando vm-04 ao arquivo de inventário do Ansible developmentmeb
$ cat development.yaml all: children: postgres_cluster: hosts: vm-01: vm-02: vm-03: vm-04: vars: ansible_user: "vagrant"
- Execute o manual do Ansible
$ ansible-playbook -Ki development.yaml postgres-play.yaml SUDO password: PLAY [postgres_cluster] ******************************************************************************************************************************************************************************************************************************************************** TASK [Gathering Facts] ********************************************************************************************************************************************************************************************************************************************************* ok: [vm-01] ok: [vm-04] ok: [vm-03] ok: [vm-02] ... ... RUNNING HANDLER [postgresql : restart postgresql] ****************************************************************************************************************************************************************************************************************************** changed: [vm-04] changed: [vm-02] changed: [vm-01] changed: [vm-03] PLAY RECAP ********************************************************************************************************************************************************************************************************************************************************************* vm-01 : ok=41 changed=4 unreachable=0 failed=0 vm-02 : ok=41 changed=5 unreachable=0 failed=0 vm-03 : ok=43 changed=5 unreachable=0 failed=0 vm-04 : ok=46 changed=32 unreachable=0 failed=0
- Verificar cluster de replicação
$ sudo -u postgres /usr/pgsql-11/bin/repmgr -f /etc/postgresql/11/data/repmgr.conf cluster show ID | Name | Role | Status | Upstream | Location | Priority | Timeline | Connection string ----+-------+---------+-----------+----------+----------+----------+----------+-------------------------------------------------------- 1 | vm-01 | standby | running | vm-03 | default | 100 | 1 | host=vm-01 user=repmgr dbname=repmgr connect_timeout=2 2 | vm-02 | standby | running | vm-03 | default | 100 | 1 | host=vm-02 user=repmgr dbname=repmgr connect_timeout=2 3 | vm-03 | primary | * running | | default | 100 | 1 | host=vm-03 user=repmgr dbname=repmgr connect_timeout=2 4 | vm-04 | standby | running | vm-03 | default | 100 | 1 | host=vm-04 user=repmgr dbname=repmgr connect_timeout=2
Conclusão
Até agora vimos como configurar o cluster de replicação Repmgr PostgreSQL usando o Ansible. Depois que o cluster repmgr for configurado, podemos usar o comando repmgr para fazer outras manutenções no cluster de replicação, como fazer failover e alternar o nó primário e configurar a replicação em cascata. Por favor, verifique a documentação do repmgr para mais detalhes.