2016-03-02 11:52 GMT-03:00 Euler Taveira <eu...@timbira.com.br>:

> On 02-03-2016 11:22, Everton Berz wrote:
> > ontem tivemos duas paradas na replicação do primário para o standby, ou
> > seja, o standby não recebeu mais atualizações do primário.
> > Após mais de 4 horas assim, reiniciamos o standby e tudo voltou ao
> normal.
> >
> O que você quis dizer com parou de replicar? Dependendo do cenário, uma
> simples consulta pode "parar" a replicação com algum bloqueio (aka
> lock). Quais os valores dos parâmetros max_standby_*_delay?
>
>
"Parou de replicar" = as informações contidas no standby "congelaram". As
informações  não foram mais atualizadas..

Primário: os parâmetros max_standby.. estão comentados
Standby:
#max_standby_archive_delay = 30s
max_standby_archive_delay = -1
max_standby_streaming_delay = -1




> > Não existem mensagens de erro no log do PostgreSQL primário nem no
> standby.
> >
> Quando a conexão de replicação cai de maneira inesperada você tem uma
> mensagem no log. O processo wal sender e/ou wal receiver estava presente
> nos respectivos servidores? Você executou um strace no wal sender?
>
>
Tanto o receiver quanto o sender continuaram presentes e, inclusive,
alterando o identificador que é exibido após a palavra "streaming".
Envio em anexo um trecho da saída do OSWatcher. A primeira parada foi às
4:35.

Não executei strace, vou executar se acontecer novamente.



> Nem o OSWatcher nem o Zabbix exibem problemas de conectividade, disco ou
> SO.
> >
> Isso está parecendo consultas longas com bloqueios.
>
>
Elas existem, e são muitas.
Entretanto em um dos horários que aconteceu o problema não consegui
detectar isso. Utilizei o pg_activity e manualmente na view
pg_stat_activity.



> > Existe alguma maneira de diagnosticar melhor esse problema?
> >
> Qualquer problema na replicação é reportado no log.
>
> Recordo-me que há uma correção na 9.3.11 cuja mensagem de ERRO de
> conexão não era emitida após receber um EOF.
>
> Fix premature clearing of libpq's input buffer when socket EOF is seen
>
> Atualize sua versão.
>
>
Estamos planejando migrar para 9.5.1.


Obrigado
Standby:

zzz ***Tue Mar 1 04:34:31 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:52 
postgres: wal receiver process   streaming 1FFF/77A98000
zzz ***Tue Mar 1 04:35:05 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:53 
postgres: wal receiver process   streaming 1FFF/86F36E18
zzz ***Tue Mar 1 04:35:38 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:53 
postgres: wal receiver process   streaming 1FFF/874AFC70
zzz ***Tue Mar 1 04:36:12 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:54 
postgres: wal receiver process   streaming 1FFF/88B5A000
zzz ***Tue Mar 1 04:36:46 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:55 
postgres: wal receiver process   streaming 1FFF/8B3F9170
zzz ***Tue Mar 1 04:37:20 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:55 
postgres: wal receiver process   streaming 1FFF/8C6AE078
zzz ***Tue Mar 1 04:37:54 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:55 
postgres: wal receiver process   streaming 1FFF/8D970000
zzz ***Tue Mar 1 04:38:28 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:56 
postgres: wal receiver process   streaming 1FFF/8EB94000
zzz ***Tue Mar 1 04:39:02 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:56 
postgres: wal receiver process   streaming 1FFF/8F47E000
zzz ***Tue Mar 1 04:39:36 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:56 
postgres: wal receiver process   streaming 1FFF/8F70C000
zzz ***Tue Mar 1 04:40:10 BRT 2016
postgres 23011 22933  19  0.9  0.0 26355312 7480 poll_s S   Jan 31 06:28:56 
postgres: wal receiver process   streaming 1FFF/8F8FF678


Primário:
zzz ***Tue Mar 1 04:34:10 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:39 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/76058000
zzz ***Tue Mar 1 04:34:44 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:39 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/794AE000
zzz ***Tue Mar 1 04:35:17 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:39 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8717B680
zzz ***Tue Mar 1 04:35:50 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/881D0D18
zzz ***Tue Mar 1 04:36:23 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8A15FC68
zzz ***Tue Mar 1 04:36:57 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8B823BB8
zzz ***Tue Mar 1 04:37:31 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8C8E6878
zzz ***Tue Mar 1 04:38:04 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8EA75658
zzz ***Tue Mar 1 04:38:38 BRT 2016
postgres 30490 25294  19  0.2  0.0 26349912 6292 poll_s S   Jan 31 01:34:40 
postgres: wal sender process replicacao 10.4.16.53(33604) streaming 
1FFF/8EBE4000
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Reply via email to