2012/9/26 Marco Marongiu <[email protected]>: > Ciao Mauro > > On 26/09/12 08:55, Mauro wrote: >> Ho due server HP Proliant DL580 G5 in cluster con heartbeat e pacemaker. >> Entrambi hanno debian squeeze e xen kernel per gestire macchine virtuali. >> Da molti mesi ho un gravissimo problema. >> In entrambe le macchine gira ntp. >> Succede in giorni a caso e in orari a caso che l'orario di sistema in >> una delle due macchine vada avanti anche di un'ora. >> ntp non riesce piu' a sincronizzare e si stoppa senza lasciare traccia nei >> logs. >> Una delle due macchine, non avendo piu' l'orario in sincrono ed >> essendo in cluster viene riavviata. >> Questo succede sistematicamente da molti mesi. >> Ho anche probato a mettere "disable kernel" nel ntp.conf come >> suggerito da Marco in un suo blog ma non ho risolto nulla. >> Sono seriamente nei guai perche' con una situazione simile, e' la >> prima volta che mi capita, non posso mettere le macchine in >> produzione. >> Qualche suggerimento? > > Ci sono un paio di cose da chiarire. > > Quando dici che l'orologio va "avanti anche di un'ora" intendi che va > avanti _esattamente_ di un'ora, o che all'improvviso accelera?
Non so se accelera, so che improvvisamente me lo ritrovo avanti. Controllo i server ogni giorno piu' volte al giorno. Capita che improvvisamente pero' mi ritrovi una delle due macchine con l'orario avanti di molto, una volta si e' trattato di due ore esatte, stamattina circa un'ora e 50 minuti. Quanto succede questo ntp non me lo ritrovo in esecuzione e nei log non c'e' traccia di nulla. > L'orologio è sempre troppo veloce, oppure è regolare fino a un certo > punto, e poi improvvisamente prende a correre? Sembra che succeda cosi', per giorni e giorni l'orario e' perfetto poi improvvisamente mi capita di ritrovarlo avanti di molto. > Mi mandi in privato il file ntpd.conf? Certamente. > Quali messaggi lascia ntpd nei log quando queste cose succedono? Sarebbe > interessante vederli dall'avvio di ntpd fino a quando si arrende. Quando ntp si arrende lo fa in silenzio, non c'e' traccia nei logs. > > Se fosse necessario, potresti "scaricare" la macchina spegnendo tutte le > macchine virtuali per, diciamo, un'ora? Posso farlo. Potrei spegnere tutto per un'ora nodi compresi. Pensi che sia il caso? > Potrebbe essere una situazione facilmente risolvibile, o un casino :) Le ho tentate quasi tutte se non risolvo mettero' in cron ntpdate. _______________________________________________ Gulchelp mailing list [email protected] http://www.gulch.crs4.it/cgi-bin/mailman/listinfo/gulchelp
