Gabriel Barazer a écrit :
Salut,

Alors c'est simple, dans le sens premier du terme:
- effectivement les 3 serveurs sur le même switch
- pas de vlan taggé, un seul global untag
- pas sur le switch en question
- 1 lien par serveur vers le switch (3 liens total sur un switch qui en a actuellement une quinzaine)
- aucune techno software style aggregation ni HA
- c'est un nouveau déploiement, mais qui fonctionne sans problèmes sur quelques autres installations du même type (web + mysql) - j'ai le problème depuis 3 jours, et c'est suite à une migration depuis une ancienne infrastructure (qui commencait à montrer des symptomes similaires, je n'ai malheuresement pas pu tester ni faire de captures sur cette ancienne installation)

- coté flux:
- aucun équipement de filtrage à ce niveau
les autres équipements n'interagissent pas avec les 3 serveurs en question, et fonctionnent d'eux même très bien. - Lorsque le problème survient, comme j'avais tenté de l'expliquer, c'est uniquement les connexions entre un serveur web et le serveur mysql qui font ce "bégaiement" TCP. toutes les autres communications entrantes et sortantes du serveur web et mysql fonctionnent (ssh sur les 2 serveurs, le http qui marche sur le web sans problème, mysql qui fonctionne sans problème avec l'autre serveur).

- la table arp n'a pas plus de 10 entrées et je controle le réseau local de bout en bout, donc pas de connexion sauvage ou de conflit d'IP.

N'ayant aucune piste, j'ai déjà vérifié tous ces élements jusqu'au trucs les plus absurdes sans rien trouver.

J'ajoute que lorsque le problème arrive, un netstat sur le serveur MySQL montre tout un tas de connexions venant du serveur web en état "SYN_RECV" prouvant bien que le serveur est en train d'attendre que le client accepte la connexion. Le client de son côté a envoyé le SYN initial, recu le ACK du serveur, mais au lieu de répondre, il attend 3 secondes et retransmet le SYN. Simultanément, le meme serveur accepte les connexions de l'autre serveur web sans broncher.

Je n'ai par ailleurs trouvé aucun élement ou serveur qui pourrait expliquer ce déclenchement du problème à intervalles si réguliers.

Et avec un autre switch ?

---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à