Gabriel Barazer a écrit :
Salut,
Alors c'est simple, dans le sens premier du terme:
- effectivement les 3 serveurs sur le même switch
- pas de vlan taggé, un seul global untag
- pas sur le switch en question
- 1 lien par serveur vers le switch (3 liens total sur un switch qui
en a actuellement une quinzaine)
- aucune techno software style aggregation ni HA
- c'est un nouveau déploiement, mais qui fonctionne sans problèmes sur
quelques autres installations du même type (web + mysql)
- j'ai le problème depuis 3 jours, et c'est suite à une migration
depuis une ancienne infrastructure (qui commencait à montrer des
symptomes similaires, je n'ai malheuresement pas pu tester ni faire de
captures sur cette ancienne installation)
- coté flux:
- aucun équipement de filtrage à ce niveau
les autres équipements n'interagissent pas avec les 3 serveurs en
question, et fonctionnent d'eux même très bien.
- Lorsque le problème survient, comme j'avais tenté de l'expliquer,
c'est uniquement les connexions entre un serveur web et le serveur
mysql qui font ce "bégaiement" TCP. toutes les autres communications
entrantes et sortantes du serveur web et mysql fonctionnent (ssh sur
les 2 serveurs, le http qui marche sur le web sans problème, mysql qui
fonctionne sans problème avec l'autre serveur).
- la table arp n'a pas plus de 10 entrées et je controle le réseau
local de bout en bout, donc pas de connexion sauvage ou de conflit d'IP.
N'ayant aucune piste, j'ai déjà vérifié tous ces élements jusqu'au
trucs les plus absurdes sans rien trouver.
J'ajoute que lorsque le problème arrive, un netstat sur le serveur
MySQL montre tout un tas de connexions venant du serveur web en état
"SYN_RECV" prouvant bien que le serveur est en train d'attendre que le
client accepte la connexion. Le client de son côté a envoyé le SYN
initial, recu le ACK du serveur, mais au lieu de répondre, il attend 3
secondes et retransmet le SYN. Simultanément, le meme serveur accepte
les connexions de l'autre serveur web sans broncher.
Je n'ai par ailleurs trouvé aucun élement ou serveur qui pourrait
expliquer ce déclenchement du problème à intervalles si réguliers.
Et avec un autre switch ?
---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/