Ciao Mauro

On 26/09/12 08:55, Mauro wrote:
> Ho due server HP Proliant DL580 G5 in cluster con heartbeat e pacemaker.
> Entrambi hanno debian squeeze e xen kernel per gestire macchine virtuali.
> Da molti mesi ho un gravissimo problema.
> In entrambe le macchine gira ntp.
> Succede in giorni a caso e in orari a caso che l'orario di sistema in
> una delle due macchine vada avanti anche di un'ora.
> ntp non riesce piu' a sincronizzare e si stoppa senza lasciare traccia nei 
> logs.
> Una delle due macchine, non avendo piu' l'orario in sincrono ed
> essendo in cluster viene riavviata.
> Questo succede sistematicamente da molti mesi.
> Ho anche probato a mettere "disable kernel" nel ntp.conf come
> suggerito da Marco in un suo blog ma non ho risolto nulla.
> Sono seriamente nei guai perche' con una situazione simile, e' la
> prima volta che mi capita, non posso mettere le macchine in
> produzione.
> Qualche suggerimento?

Ci sono un paio di cose da chiarire.

Quando dici che l'orologio va "avanti anche di un'ora" intendi che va
avanti _esattamente_ di un'ora, o che all'improvviso accelera?

L'orologio è sempre troppo veloce, oppure è regolare fino a un certo
punto, e poi improvvisamente prende a correre?

Mi mandi in privato il file ntpd.conf?

Quali messaggi lascia ntpd nei log quando queste cose succedono? Sarebbe
interessante vederli dall'avvio di ntpd fino a quando si arrende.

Se fosse necessario, potresti "scaricare" la macchina spegnendo tutte le
macchine virtuali per, diciamo, un'ora?

Potrebbe essere una situazione facilmente risolvibile, o un casino :)

Ciao
-- bronto
_______________________________________________
Gulchelp mailing list
[email protected]
http://www.gulch.crs4.it/cgi-bin/mailman/listinfo/gulchelp

Rispondere a