Marcos Vinicius Lazarini, Luiz Gustavo e turma,
Repasso os procedimentos que foram adotados e que iremos adotar e que
podem ser útil para o histórico da lista.
Além de pesquisar alternativas, reportei este problema à vcs e obtive
alguns posicionamentos sobre este ambiente relatando o seguinte:
1) A relação entre o N.I.S. (Networking Information Service) e do
N.F.S.(Networking File System) é o calcanhar de Aquiles do ambiente de
rede Linux.
2) Possivelmente é um problema associado à rede, uso e outros.
3) Verifiquei que o D.N.S. é fundamental para se ter uma rede e estes
serviços funcionais e não temos um servidor secundário neste prédio,
ficando sujeito as falhas e gargalos no link.
4) A configuração dos clientes NFS tem que ter uma opção de montagem
"nolock". Pois na ocorrencia de não resolver o nome pelo D.N.S. trava o
serviço NFS. Realizamos estas configurações.
Veja em :
http://libertas.pbh.gov.br/modules.php?name=FAQ&myfaq=yes&id_cat=7&categories=Problemas%2FSolu%E7%F5es+do+Libertas+3.x
5) O uso do N.I.S, se não for um servidor local ou não tiver configurado
de acordo, gerada um tráfego absurdo quando se realiza qualquer comando
como o ls(linux) para se listar os diretórios e arquivos(aqui são
enormes). O tráfego enorme, se refere aos UID e GID que são
Identificação de usuários e grupos para se verificar as permissões de
acesso em cada objeto.
6) O problema de travamento do serviço do NFS/associados está ocorrendo,
normalmente, quando há um grande volume de logons simultâneos/acesso ao
correio/inicio de trabalho(de manhã/ à tarde). Pode ser coincidência,
mas até agora é fato.
Conclusão:
Em função dos itens 1 a 6 anteriores e por observação da mudança do
ambiente pude diagnosticar inicialmente.
a) O nosso link já andava dando taxas de 800 bytes em alguns momentos;
b) É fundamental um servidor DNS local para evitar problemas de acesso
remoto.
c) O NIS é extremamente ineficiente e deve ser trocado pelo LDAP como
feito nas escolas;
d) Enquanto o NIS não é substituído, devemos reavaliar a sua configuração;
e) Todos os mount´s de cliente´s devem ter a opção nolock;
f) O Problema que estamos passando em relação ao link, parece ter se
agravado em função do servidor antigo ser um filtro as solicitações de
acesso à rede pela baixa performance. O novo servidor, gera uma
sobrecarga muito maior na rede por ter um troughput(produção) maior e
com consequente solicitação à rede.
g) Como este ambiente é complexo e sem documentação, pode ter faltado
alguma configuração no servidor com o S.O. Debian e/outro e acho
interessante o envolvimento de uma equipe multidisciplinar para
tratarmos todos os pontos avaliados nesta conclusão.
h) Capturar com um sniffer todo o tráfego de rede gerado com destino
remoto entre o servidor de home e roteador para a RMI e determinar se
não há tráfego e serviços desnecessários que possam comprometer todo o
processo.
i) Se não fizermos esta série de avaliações e ajustes, nada garante que
um outro sistema operacional resolva o problema ou mesmo que este
problema venha a se repetir nas 182 escolas de BH visto que: o ambiente
e muito complexo e conforme item(f) principalmente.
Histórico da mudança:
Troca do servidor: 03/06/2005 as 21:30 hrs.
04 e 05 sábado/domingo -> Ok
06 ,07 e 08/06/2005 segunda, terça e quarta -> Ok
09/06/2005 quinta - travamento e reboot as 10:00 e 14:00 hrs.
10/06/2005 sexta - travamento e reboot as 9:30 e 13:00 hrs.
11 e 12/06/2005 - sábado e domigo -> Ok
13/06/2005 segunda - travamento e reboot as 9:15, 14:30 e 15.30 hrs.
14/06/2005 terça - travamento e reboot as 9:10, 14:15, 15.00 e 15:30 hrs.
15 e 16/06/2005 quarta - normal.
No dia 14/06/2005 as 17:00 hrs, efetuei os seguintes procedimentos:
1) Com relação ao item "b" da conclusão:
Conforme sugestão do Marcos Vinícus Lazarini instalei e configurei o
pacote dnsmasq como cache.
Este pacote implementa um cache de DNS resolvendo os endereços para
todos os clientes do libertas(cliente) e não realizando tráfego remoto.
2) Com relação ao item "e" da conclusão:
Alteramos todos os mounts dos clientes Libertas colocando a opção
"nolock".
3) No ambiente do novo servidor, alterei o número de processos NFSD
(daemon) para 60.
Estes processos são responsáveis por atender a solicitação das
máquinas clientes.
O Ambiente encontra-se em observação.
Um abraço e obrigado,
Gonzaga.
--
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]