Re: Problema NFS travando.
Marcos Vinicius Lazarini, Luiz Gustavo e turma, Repasso os procedimentos que foram adotados e que iremos adotar e que podem ser til para o histrico da lista. Alm de pesquisar alternativas, reportei este problema vcs e obtive alguns posicionamentos sobre este ambiente relatando o seguinte: 1) A relao entre o N.I.S. (Networking Information Service) e do N.F.S.(Networking File System) o calcanhar de Aquiles do ambiente de rede Linux. 2) Possivelmente um problema associado rede, uso e outros. 3) Verifiquei que o D.N.S. fundamental para se ter uma rede e estes servios funcionais e no temos um servidor secundrio neste prdio, ficando sujeito as falhas e gargalos no link. 4) A configurao dos clientes NFS tem que ter uma opo de montagem nolock. Pois na ocorrencia de no resolver o nome pelo D.N.S. trava o servio NFS. Realizamos estas configuraes. Veja em : http://libertas.pbh.gov.br/modules.php?name=FAQmyfaq=yesid_cat=7categories=Problemas%2FSolu%E7%F5es+do+Libertas+3.x 5) O uso do N.I.S, se no for um servidor local ou no tiver configurado de acordo, gerada um trfego absurdo quando se realiza qualquer comando como o ls(linux) para se listar os diretrios e arquivos(aqui so enormes). O trfego enorme, se refere aos UID e GID que so Identificao de usurios e grupos para se verificar as permisses de acesso em cada objeto. 6) O problema de travamento do servio do NFS/associados est ocorrendo, normalmente, quando h um grande volume de logons simultneos/acesso ao correio/inicio de trabalho(de manh/ tarde). Pode ser coincidncia, mas at agora fato. Concluso: Em funo dos itens 1 a 6 anteriores e por observao da mudana do ambiente pude diagnosticar inicialmente. a) O nosso link j andava dando taxas de 800 bytes em alguns momentos; b) fundamental um servidor DNS local para evitar problemas de acesso remoto. c) O NIS extremamente ineficiente e deve ser trocado pelo LDAP como feito nas escolas; d) Enquanto o NIS no substitudo, devemos reavaliar a sua configurao; e) Todos os mounts de clientes devem ter a opo nolock; f) O Problema que estamos passando em relao ao link, parece ter se agravado em funo do servidor antigo ser um filtro as solicitaes de acesso rede pela baixa performance. O novo servidor, gera uma sobrecarga muito maior na rede por ter um troughput(produo) maior e com consequente solicitao rede. g) Como este ambiente complexo e sem documentao, pode ter faltado alguma configurao no servidor com o S.O. Debian e/outro e acho interessante o envolvimento de uma equipe multidisciplinar para tratarmos todos os pontos avaliados nesta concluso. h) Capturar com um sniffer todo o trfego de rede gerado com destino remoto entre o servidor de home e roteador para a RMI e determinar se no h trfego e servios desnecessrios que possam comprometer todo o processo. i) Se no fizermos esta srie de avaliaes e ajustes, nada garante que um outro sistema operacional resolva o problema ou mesmo que este problema venha a se repetir nas 182 escolas de BH visto que: o ambiente e muito complexo e conforme item(f) principalmente. Histrico da mudana: Troca do servidor: 03/06/2005 as 21:30 hrs. 04 e 05 sbado/domingo - Ok 06 ,07 e 08/06/2005 segunda, tera e quarta - Ok 09/06/2005 quinta - travamento e reboot as 10:00 e 14:00 hrs. 10/06/2005 sexta - travamento e reboot as 9:30 e 13:00 hrs. 11 e 12/06/2005 - sbado e domigo - Ok 13/06/2005 segunda - travamento e reboot as 9:15, 14:30 e 15.30 hrs. 14/06/2005 tera - travamento e reboot as 9:10, 14:15, 15.00 e 15:30 hrs. 15 e 16/06/2005 quarta - normal. No dia 14/06/2005 as 17:00 hrs, efetuei os seguintes procedimentos: 1) Com relao ao item b da concluso: Conforme sugesto do Marcos Vincus Lazarini instalei e configurei o pacote dnsmasq como cache. Este pacote implementa um cache de DNS resolvendo os endereos para todos os clientes do libertas(cliente) e no realizando trfego remoto. 2) Com relao ao item e da concluso: Alteramos todos os mounts dos clientes Libertas colocando a opo nolock. 3) No ambiente do novo servidor, alterei o nmero de processos NFSD (daemon) para 60. Estes processos so responsveis por atender a solicitao das mquinas clientes. O Ambiente encontra-se em observao. Um abrao e obrigado, Gonzaga. -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
Marcos Vinicius Lazarini, Marcos Vinicius Lazarini escreveu: On Tue, 14 Jun 2005, Luiz Gonzaga da Mata wrote: Bom, eu diria q 99% daz vezes que eu tinha problema, o NIS estava no meio. Qualquer 'ls' que voce faz (nao precisa ser nem 'ls -l'), o bandido do NIS vai la' e consulta o servidor em busca de converter os UID/GID em nomes. Se a rede caiu, a maquina congela ate' o servidor voltar. E pelo que me lembro, o NIS tem mais informacoes do que o proprio NFS. Pensando um pouco melhor no seu problema, acho que nao entendi quem trava: eh o servidor ou o cliente? O servio NFS trava no servidor e os clientes passam a no conectar mais. Eu consigo acessar o servidor atravs de ssh ou local. Eu chequei a ver alguns reportes com relao ao nolock no mount do cliente ou utilizar o daemon lockd se no fizer o mount com nolock, ser que pode ter alguma relao? O nolock tem a ver com transacoes assincronas; eu realmente nao lembro mais desses detalhes, mas sempre usei as configuracoes padroes e nao tive problemas (acho que sem o nolock). Parece-me que h um problema entre a opo lock e a no resoluo dos nomes das mquinas clientes com o DNS remoto. Quando trava, as mensagens so: 1) Kernel: statd: server localhost not responding, timed out. 2)Kernel: lockd : cannot unmonitor 10.1.8.9 Quando est funcional, a mensagem : 1) rpc.mounte: authenticated mount request from *smed164.pbh* que o nome do host. Como o DNS remoto e temos um link de 1Mb, ao trocar o servidor de PC para um com troughput maior, o gargalo passou do PC(antigo home) para o link. Outra questo, a sua informao sobre NIS, acima, pode estar comprometendo e ajudando a causar este problema, j que o servidor NIS remoto tambm. Veja mais essa informao: http://www.bytemark.co.uk/support/tech/backupnfs.html http://libertas.pbh.gov.br/modules.php?name=FAQmyfaq=yesid_cat=7categories=Problemas%2FSolu%E7%F5es+do+Libertas+3.x#7 Um abrao, Gonzaga. -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
Luiz Gonzaga da Mata wrote: Marcos Vinicius Lazarini, Marcos Vinicius Lazarini escreveu: On Tue, 14 Jun 2005, Luiz Gonzaga da Mata wrote: Bom, eu diria q 99% daz vezes que eu tinha problema, o NIS estava no meio. Qualquer 'ls' que voce faz (nao precisa ser nem 'ls -l'), o bandido do NIS vai la' e consulta o servidor em busca de converter os UID/GID em nomes. Se a rede caiu, a maquina congela ate' o servidor voltar. E pelo que me lembro, o NIS tem mais informacoes do que o proprio NFS. Pensando um pouco melhor no seu problema, acho que nao entendi quem trava: eh o servidor ou o cliente? O servio NFS trava no servidor e os clientes passam a no conectar mais. Eu consigo acessar o servidor atravs de ssh ou local. Isso deve ocorrer pq a prpria servidora no usa o NFS que ela exporta. Em outras palavras, os usurios no devem conseguir logar nela... assim penso eu. Eu chequei a ver alguns reportes com relao ao nolock no mount do cliente ou utilizar o daemon lockd se no fizer o mount com nolock, ser que pode ter alguma relao? O nolock tem a ver com transacoes assincronas; eu realmente nao lembro mais desses detalhes, mas sempre usei as configuracoes padroes e nao tive problemas (acho que sem o nolock). Parece-me que h um problema entre a opo lock e a no resoluo dos nomes das mquinas clientes com o DNS remoto. Quando trava, as mensagens so: 1) Kernel: statd: server localhost not responding, timed out. 2)Kernel: lockd : cannot unmonitor 10.1.8.9 Quando est funcional, a mensagem : 1) rpc.mounte: authenticated mount request from *smed164.pbh* que o nome do host. Como o DNS remoto e temos um link de 1Mb, ao trocar o servidor de PC para um com troughput maior, o gargalo passou do PC(antigo home) para o link. Pq vc usa o DNS remoto pra resolver nomes como 10.x.x.x? Instale um dns-cache, tipo o pacote dnsmasq, cadastre as estaes no arquivo /etc/hosts e alm de voce ganhar um cache de DNS, de quebra, ainda resolve os nomes locais sem mandar nenhum query pelo link. Outra questo, a sua informao sobre NIS, acima, pode estar comprometendo e ajudando a causar este problema, j que o servidor NIS remoto tambm. Veja mais essa informao: http://www.bytemark.co.uk/support/tech/backupnfs.html http://libertas.pbh.gov.br/modules.php?name=FAQmyfaq=yesid_cat=7categories=Problemas%2FSolu%E7%F5es+do+Libertas+3.x#7 Bom, me parece que vc est com boas pistas... agora eu acho que vc deveria fazer algumas experincias e tentar descobrir exatamente o que causa o problema. Boa sorte! -- Marcos -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
Prezado Luiz, devido a alguns problemas com o nfs-kernel-server passei a compartilhar arquivos com o nfs-user-server. Atenciosamente, Gustavo Luiz Gonzaga da Mata escreveu: Turma, Tenho instalado o Sarge com o kernel 2.4.27. É um servidor de homes e está acontecendo problema de travamento do Serviço NFS. As mensagens são as seguintes: Kernel: statd: server localhost not responding, timed out. Kernel: lockd : cannot unmonitor 10.1.8.9 Informações sobre os pacotes: Package: nfs-common Versions: 1:1.0.6-3.1(/var/lib/apt/lists/ftp.br.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/apt/lists/ftp.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/dpkg/status) 1:1.0-2woody3(/var/lib/apt/lists/security.debian.org_dists_stable_updates_main_binary-i386_Packages) Reverse Depends: nhfsstone,nfs-common nfs-kernel-server,nfs-common 1:0.3.3-3 ultrapossum-failover,nfs-common sfs-common,nfs-common nhfsstone,nfs-common nfs-kernel-server,nfs-common 1:0.3.3-3 netbase,nfs-common 1:0.3.2-1 gconf,nfs-common education-networked,nfs-common autofs,nfs-common netbase,nfs-common 1:0.3.2-1 Dependencies: 1:1.0.6-3.1 - portmap (0 (null)) debconf (2 1.0) sysvinit (2 2.80-1) libc6 (2 2.3.2.ds1-4) libwrap0 (0 (null)) nfs-client (0 (null)) nfs-client (0 (null)) 1:1.0-2woody3 - portmap (0 (null)) libc6 (2 2.2.4-4) libwrap0 (0 (null)) nfs-client (0 (null)) nfs-client (0 (null)) Provides: 1:1.0.6-3.1 - nfs-client 1:1.0-2woody3 - nfs-client Reverse Provides: Package: nfs-kernel-server Versions: 1:1.0.6-3.1(/var/lib/apt/lists/ftp.br.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/apt/lists/ftp.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/dpkg/status) 1:1.0-2woody3(/var/lib/apt/lists/security.debian.org_dists_stable_updates_main_binary-i386_Packages) Reverse Depends: nhfsstone,nfs-kernel-server sfs-server,nfs-kernel-server replicator,nfs-kernel-server nhfsstone,nfs-kernel-server nfsboot,nfs-kernel-server lessdisks,nfs-kernel-server harden-servers,nfs-kernel-server fai,nfs-kernel-server education-main-server,nfs-kernel-server cfs,nfs-kernel-server Dependencies: 1:1.0.6-3.1 - nfs-common (2 1:0.3.3-3) debconf (2 1.0) sysvinit (2 2.80-1) libc6 (2 2.3.2.ds1-4) libwrap0 (0 (null)) knfs (0 (null)) nfs-server (0 (null)) knfs (0 (null)) nfs-server (0 (null)) 1:1.0-2woody3 - debconf (2 1.0) nfs-common (2 1:0.3.3-3) libc6 (2 2.2.4-4) libwrap0 (0 (null)) knfs (0 (null)) nfs-server (0 (null)) knfs (0 (null)) nfs-server (0 (null)) Provides: 1:1.0.6-3.1 - nfs-server knfs 1:1.0-2woody3 - nfs-server knfs Reverse Provides: /etc/exports /home 10.1.8.0/255.255.248.0(rw,async,no_subtree_check) /backup/emailgdiniz 10.1.8.0/255.255.248.0(rw,async,no_subtree_check) Algúem já passou por isso ou tem alguma dica? Um abraço, Gonzaga. Yahoo! Mail, cada vez melhor: agora com 1GB de espaço grátis! http://mail.yahoo.com.br -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
Luiz Gonzaga da Mata wrote: Turma, Tenho instalado o Sarge com o kernel 2.4.27. É um servidor de homes e está acontecendo problema de travamento do Serviço NFS. As mensagens são as seguintes: Kernel: statd: server localhost not responding, timed out. Kernel: lockd : cannot unmonitor 10.1.8.9 Informações sobre os pacotes: Package: nfs-common Versions: 1:1.0.6-3.1(/var/lib/apt/lists/ftp.br.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/apt/lists/ftp.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/dpkg/status) 1:1.0-2woody3(/var/lib/apt/lists/security.debian.org_dists_stable_updates_main_binary-i386_Packages) Reverse Depends: nhfsstone,nfs-common nfs-kernel-server,nfs-common 1:0.3.3-3 ultrapossum-failover,nfs-common sfs-common,nfs-common nhfsstone,nfs-common nfs-kernel-server,nfs-common 1:0.3.3-3 netbase,nfs-common 1:0.3.2-1 gconf,nfs-common education-networked,nfs-common autofs,nfs-common netbase,nfs-common 1:0.3.2-1 Dependencies: 1:1.0.6-3.1 - portmap (0 (null)) debconf (2 1.0) sysvinit (2 2.80-1) libc6 (2 2.3.2.ds1-4) libwrap0 (0 (null)) nfs-client (0 (null)) nfs-client (0 (null)) 1:1.0-2woody3 - portmap (0 (null)) libc6 (2 2.2.4-4) libwrap0 (0 (null)) nfs-client (0 (null)) nfs-client (0 (null)) Provides: 1:1.0.6-3.1 - nfs-client 1:1.0-2woody3 - nfs-client Reverse Provides: Package: nfs-kernel-server Versions: 1:1.0.6-3.1(/var/lib/apt/lists/ftp.br.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/apt/lists/ftp.debian.org_debian_dists_testing_main_binary-i386_Packages)(/var/lib/dpkg/status) 1:1.0-2woody3(/var/lib/apt/lists/security.debian.org_dists_stable_updates_main_binary-i386_Packages) Reverse Depends: nhfsstone,nfs-kernel-server sfs-server,nfs-kernel-server replicator,nfs-kernel-server nhfsstone,nfs-kernel-server nfsboot,nfs-kernel-server lessdisks,nfs-kernel-server harden-servers,nfs-kernel-server fai,nfs-kernel-server education-main-server,nfs-kernel-server cfs,nfs-kernel-server Dependencies: 1:1.0.6-3.1 - nfs-common (2 1:0.3.3-3) debconf (2 1.0) sysvinit (2 2.80-1) libc6 (2 2.3.2.ds1-4) libwrap0 (0 (null)) knfs (0 (null)) nfs-server (0 (null)) knfs (0 (null)) nfs-server (0 (null)) 1:1.0-2woody3 - debconf (2 1.0) nfs-common (2 1:0.3.3-3) libc6 (2 2.2.4-4) libwrap0 (0 (null)) knfs (0 (null)) nfs-server (0 (null)) knfs (0 (null)) nfs-server (0 (null)) Provides: 1:1.0.6-3.1 - nfs-server knfs 1:1.0-2woody3 - nfs-server knfs Reverse Provides: /etc/exports /home 10.1.8.0/255.255.248.0(rw,async,no_subtree_check) /backup/emailgdiniz 10.1.8.0/255.255.248.0(rw,async,no_subtree_check) Algúem já passou por isso ou tem alguma dica? Olá Luiz, Eu já tive vários problemas com NIS e ele é bem xarope, alias eu diria que é um dos programas mais xaropes pra instalar... Eu tive muitos problemas com rede; coisa de mudar o micro de ponto de rede e passou a funcionar. Isso me levou a concluir que qquer probleminha que houver na sua rede e algum pacote se perder, ele não é retransmitido (NFS e NIS usam UDP) e ai dá timeout. Verifique os cabos, tanto no micro como no hub, até um desplugar-replugar pode ajudar. Outra coisa que pode ajudar são os passos que existem em /usr/share/doc/nis/how-to..gz É um documento simples, mas com todos os passos. Inclusive ele explica pq vc tem que colocar o '+:::' no final dos arquivos passwd, group e shadow. Em ultimo caso, tente mexer em alguns comandos do tipo yp*; faca um ypTABTAB como root pra ver a lista, e vá mexendo nas man pages -- Marcos -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
Marcos V Lazarini, Olá Luiz, Eu já tive vários problemas com NIS e ele é bem xarope, alias eu diria que é um dos programas mais xaropes pra instalar... Eu tive muitos problemas com rede; coisa de mudar o micro de ponto de rede e passou a funcionar. Isso me levou a concluir que qquer probleminha que houver na sua rede e algum pacote se perder, ele não é retransmitido (NFS e NIS usam UDP) e ai dá timeout. Verifique os cabos, tanto no micro como no hub, até um desplugar-replugar pode ajudar. O servidor é um dual processor(4X proc), 2 GB de RAM, e antigamente era um PC comum. Tinha instalado o Fedora e não apresentava problemas. Será que o fato deste servidor ter um troughput maior, pode estar ocorrendo problema de colisão na placa ou falta alguma configuração como timeo, rsize=8192,wsize=8192) em : http://www.faqs.org/docs/linux_network/x-087-2-nfs.mountd.html. Outra coisa que pode ajudar são os passos que existem em /usr/share/doc/nis/how-to..gz É um documento simples, mas com todos os passos. Inclusive ele explica pq vc tem que colocar o '+:::' no final dos arquivos passwd, group e shadow. Em ultimo caso, tente mexer em alguns comandos do tipo yp*; faca um ypTABTAB como root pra ver a lista, e vá mexendo nas man pages Vou dar uma avaliada no How-to amanhã lá no serviço. Uma dúvida, se o travamento é no Serviço NFS, por quê o enfoque no NIS? Ele pode ser o causador do problema no NFS, é isso? Eu chequei a ver alguns reportes com relação ao nolock no mount do cliente ou utilizar o daemon lockd se não fizer o mount com nolock, será que pode ter alguma relação? Um abraço, Gonzaga. -- To UNSUBSCRIBE, email to [EMAIL PROTECTED] with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]
Re: Problema NFS travando.
On Tue, 14 Jun 2005, Luiz Gonzaga da Mata wrote: Marcos V Lazarini, Olá Luiz, Eu já tive vários problemas com NIS e ele é bem xarope, alias eu diria que é um dos programas mais xaropes pra instalar... Eu tive muitos problemas com rede; coisa de mudar o micro de ponto de rede e passou a funcionar. Isso me levou a concluir que qquer probleminha que houver na sua rede e algum pacote se perder, ele não é retransmitido (NFS e NIS usam UDP) e ai dá timeout. Verifique os cabos, tanto no micro como no hub, até um desplugar-replugar pode ajudar. O servidor é um dual processor(4X proc), 2 GB de RAM, e antigamente era um PC comum. Tinha instalado o Fedora e não apresentava problemas. Me parece uma maquina bem nova, nao deve ser problema de HW... Será que o fato deste servidor ter um troughput maior, pode estar ocorrendo problema de colisão na placa ou falta alguma configuração como timeo, rsize=8192,wsize=8192) em : http://www.faqs.org/docs/linux_network/x-087-2-nfs.mountd.html. Olha, dificil dizer... realmente eh bem chato isso. Eu considero NIS/NFS os calcanhares de aquiles das redes linux Outra coisa que pode ajudar são os passos que existem em /usr/share/doc/nis/how-to..gz É um documento simples, mas com todos os passos. Inclusive ele explica pq vc tem que colocar o '+:::' no final dos arquivos passwd, group e shadow. Em ultimo caso, tente mexer em alguns comandos do tipo yp*; faca um ypTABTAB como root pra ver a lista, e vá mexendo nas man pages Vou dar uma avaliada no How-to amanhã lá no serviço. Uma dúvida, se o travamento é no Serviço NFS, por quê o enfoque no NIS? Ele pode ser o causador do problema no NFS, é isso? Bom, eu diria q 99% daz vezes que eu tinha problema, o NIS estava no meio. Qualquer 'ls' que voce faz (nao precisa ser nem 'ls -l'), o bandido do NIS vai la' e consulta o servidor em busca de converter os UID/GID em nomes. Se a rede caiu, a maquina congela ate' o servidor voltar. E pelo que me lembro, o NIS tem mais informacoes do que o proprio NFS. Pensando um pouco melhor no seu problema, acho que nao entendi quem trava: eh o servidor ou o cliente? Eu chequei a ver alguns reportes com relação ao nolock no mount do cliente ou utilizar o daemon lockd se não fizer o mount com nolock, será que pode ter alguma relação? O nolock tem a ver com transacoes assincronas; eu realmente nao lembro mais desses detalhes, mas sempre usei as configuracoes padroes e nao tive problemas (acho que sem o nolock). -- Marcos