On 15-09-2015 11:41, Danilo Egea Gondolfo wrote:
On 09/15/2015 06:28, Marcelo Gondim wrote:
Olá meus amigos,

Não sei se sou azarado ou o que. Um ano atrás tive problemas com as interfaces Intel X520-SR2 que do nada elas morriam e eu tinha que ficar dando down e up pra elas voltarem à vida. Fiquei mais de 1 ano com esse problema. Tentei as listas e cheguei à fazer até um PR e nada. Um belo dia atualizei o router no STABLE e pronto, problema resolvido. O que foi feito não faço ideia mas resolveu depois de 1 ano de sofrimento de ter trocado todo o hardware e achando que era temperatura interna da X520-SR2.

Patrick até tentou me ajudar nessa época mas o jeito foi deixar um script testando e levantando a interface sempre que caía. Pura gambiarra, coisa feia de se ver em um sistema. rsrsrsrsrs

Estava eu usando o router funcionando no 10.1-STABLE r281235 e aí então resolvi passar o mesmo para o FreeBSD 10.2-RELEASE-p2 devido às melhorias da 10.1 para a 10.2 e mais uma vez me decepcionei com o sistema.

Eu tenho 2 laggs nesse router e depois que atualizei, quando chegava no horário de pico e subia o tráfego nesses laggs, simplesmente meu load subia pra 40.x à 53.x, minha sessão BGP de um desses laggs com a operadora caía e levantava de 5 em 5 minutos me gerando grande problema aqui no provedor.

Nos logs ficavam aparecendo:

/var/log/messages:Sep 9 19:21:43 rt01 kernel: igb5: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:21:44 rt01 kernel: igb4: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:27:01 rt01 kernel: igb5: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:27:01 rt01 kernel: igb4: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:29:13 rt01 kernel: igb5: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:29:14 rt01 kernel: igb4: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:46:10 rt01 kernel: igb5: Interface stopped DISTRIBUTING, possible flapping /var/log/messages:Sep 9 19:46:11 rt01 kernel: igb4: Interface stopped DISTRIBUTING, possible flapping

Aí pensei comigo... estava tudo funcionando e não vou cometer o mesmo erro que cometi com a X520-SR2. Voltei para o 10.1-STABLE r281235 e pronto! Tudo voltou à funcionar como era antes. Assim fica difícil confiar na estabilidade e robustez de um sistema. Só Deus sabe agora quando que isso será resolvido no sistema. 1 ano? 2 anos? Bem, vou começar à pensar em algo como Juniper porque pelo menos vou poder cobrar de alguém quando isso acontecer. Uns anos atrás saí do Linux para FreeBSD porque este resolveu meus problemas, coisas que o Linux não me atendia mas que agora está me deixando chateado com essas coisas. Saí do problema do ksoftirq do Linux para outros problemas de instabilidade no FreeBSD.

Querem ver outra coisa feia que desde o FreeBSD 10.0 existe e já tem PR, já comentei na freebsd-stable? Tudo bem que pode não afetar o sistema mas já acertaram na CURRENT faz tempo, pelo menos foi o que me disseram na lista. É uma coisa feia demais para um sistema tão bem trabalhado:

Experimentem fazer:

# ipfw table 100 add 0.0.0.0/8

Agora o resultado:

 # ipfw table 100 list
::/8 0

iptables pode ser estranho ou difícil de aprender mas nunca vi algo assim nele. Venho desde o FreeBSD 10.0 falando na lista sobre isso e cá estamos no 10.2 e continua esse bug horrendo.

Bem eu abri o PR sobre o problema do LACP e agora vamos ver quando que isso vai ser resolvido porque ao meu ver isso é sério e muita gente usa lagg no sistema e com certeza é um problema porque voltei a versão e tudo normalizou. Fiquei 3 dias com esse problema me ferrando, para não dizer outra coisa, aqui no provedor.

 https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=203031

Desculpem o desabafo mas puts essa me deixou chateado demais com o sistema, ainda mais pela importância que ele tem para o meu negócio hoje.

Gondim
-------------------------
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd

Fala Gondim,

esse tipo de problema é osso mesmo...

Pelo que leio e ouço, esses problemas nas releases se devem a pelo menos duas coisas: boa parte dos desenvolvedores não usam FreeBSD em seus computadores principais (Mac!) (ouçam o adrian@ desabafando no bsdnow 101 sobre comer sua própria comida de cachorro) e boa parte dos que usam FreeBSD usam o CURRENT (tipo eu :P). Então nós mesmos acabamos não vendo os problemas que saem nas releases e acabamos não tendo a mesma experiência que os usuário tem, e isso está muito errado...

Outra zica é que esses problemas as vezes são difíceis de se reproduzir, pelo pouco que olhei no google aqui parece que seu problema está relacionado com lagg + igb + condições de tráfego. As vezes se o cara não tiver acesso ao mesmo cenário fica foda achar o problema.

Não sei qual é a sua política em relação a usar o CURRENT em produção (o próprio projeto FreeBSD usa) e também sei que é um transtorno enorme fazer testes em cenários como o seu, mas se um dia vc tiver uma máquina sobrando aí tenta rodar o CURRENT. Recentemente teve uma atualização nos drivers e1000 (o que inclui o if_igb) que vai ser mergeado no stable daqui uns dias também...

Boa sorte aí. Espero que essas experiências ruins não destruam a visão que vc tem do FreeBSD.
Opa Danilo,

Pois é e a única coisa que tenho é a revisão que funciona perfeito no 10.1-stable. Não sei se é simples achar a mudança entre as versões que saíram mas algo mudou nesse meio do caminho destruiu meu cenário.

Outra recente também que descobri e que sofri por muito mas muito tempo. Não sei se lembram dessa thread [1] que abri em abril do ano passado.
Sabe qual era a solução desse problema?

Colocar um simples: gateway_enable="YES" no /etc/rc.conf

Ou seja, mesmo colocando o net.inet.ip.forwarding=1 se você não colocar essa instrução no rc.conf e mandar criar uma vlan, simplesmente seu roteamento para completamente. Só reiniciando a máquina. Agora me diga porque o roteamento para de funcionar quando faço um ifconfig vlanX create se eu não tiver o gateway_enable no rc.conf? Onde que isso está escrito? Fiquei meses com esse problema e agora não tenho mais.

Pior é que os caras que me responderam isso na lista acham que isso não é um bug. Só teve 1 que achou que era um bug. Não faz sentido algum isso. Podem fazer esse teste. Peguem um FreeBSD 10.x coloquem 2 interfaces de rede pra fazer o roteamento de um lado pra outro e setem umas vlans. Sem o parâmetro acima experimentem fazer um simples:

# ifconfig vlan200 create

Depois tentem pingar de uma rede pra outra. Não vai nem à pau. Agora se colocarem o parâmetro acima no rc.conf vocês podem criar vlans sem problemas.

São essas coisas que matam a gente.

[1] http://www.fug.com.br/historico/html/freebsd/2014-04/msg00154.html
-------------------------
Histórico: http://www.fug.com.br/historico/html/freebsd/
Sair da lista: https://www.fug.com.br/mailman/listinfo/freebsd

Reply via email to