[FRsAG] Galera Cluster

2014-11-28 Par sujet Greg
Bonjour la liste,

sur le papier, Galera Cluster semble parfait pour remplacer un ensemble de
master-slaves sans avoir les coûts d'un NDB.

En pratique, sur une maquette avec des vrais serveurs physiques et des
vrais données venant de la prod, je me prends des segfault, des arrêts
brutaux de mysqld, et une resynchro plutot aléatoire ... alors que cette
solution est vendue pour améliorer la haute-dispo.

Alors j'aimerais avoir des retours d'expériences, savoir si ça vaut le coup
que j'investisse encore du temps ou si elle est encore clairement immature
pour de la prod.
Sachant qu'un cluster Galera coûte plus cher en terme de ressources dans
certains cas, parce qu'il faut minimum 3 serveurs ce qui n'est pas le cas
pour une partie de mon archi qui ne comprend qu'un master + un slave.

Aussi, avec l'arrivée des GTIDs, élire un slave master et reconfigurer les
slaves devient très simple:
STOP SLAVE;
CHANGE MASTER TO MASTER_HOST=new_master;
START SLAVE;


Avez vous des retours en conditions réels ?
-- 
Greg
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet jocelyn fournier

Bonjour,

Quelle est la version de Galera Cluster utilisée ? MySQL (5.5 ou 5.6) ? 
Ou MariaDB (5.5 ou 10) ?


  Jocelyn

Le 28/11/2014 09:31, Greg a écrit :

Bonjour la liste,

sur le papier, Galera Cluster semble parfait pour remplacer un 
ensemble de master-slaves sans avoir les coûts d'un NDB.


En pratique, sur une maquette avec des vrais serveurs physiques et des 
vrais données venant de la prod, je me prends des segfault, des arrêts 
brutaux de mysqld, et une resynchro plutot aléatoire ... alors que 
cette solution est vendue pour améliorer la haute-dispo.


Alors j'aimerais avoir des retours d'expériences, savoir si ça vaut le 
coup que j'investisse encore du temps ou si elle est encore clairement 
immature pour de la prod.
Sachant qu'un cluster Galera coûte plus cher en terme de ressources 
dans certains cas, parce qu'il faut minimum 3 serveurs ce qui n'est 
pas le cas pour une partie de mon archi qui ne comprend qu'un master + 
un slave.


Aussi, avec l'arrivée des GTIDs, élire un slave master et reconfigurer 
les slaves devient très simple:

STOP SLAVE;
CHANGE MASTER TO MASTER_HOST=new_master;
START SLAVE;


Avez vous des retours en conditions réels ?
--
Greg


___
Liste de diffusion du FRsAG
http://www.frsag.org/


___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Alexandre Legrix
Bonjour.

 En pratique, sur une maquette avec des vrais serveurs physiques et
 des vrais données venant de la prod, je me prends des segfault, des
 arrêts brutaux de mysqld, et une resynchro plutot aléatoire ... alors
 que cette solution est vendue pour améliorer la haute-dispo.


Lorsque je l'avais test, et il y a déjà un moment dans MariaDB, je n'ai
pas remarque de segfault.

Peux tu effectivement nous en dire plus sur les versions que tu
utilises, et aussi ce que tu as téléchargé, sur quel OS, etc ... ?

Cdlt
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Greg
Je ne souhaite pas préciser les versions pour ne pas rentrer dans un débat
oui mais avec telle version de Percona ça marche par contre du coup tu
n'auras pas la feature X de MariaDB etc ...

Ce qui m'intéresse c'est un retour d'expérience en production.

Le 28 novembre 2014 10:36, Alexandre Legrix a...@bragonux.net a écrit :

  Bonjour.

   En pratique, sur une maquette avec des vrais serveurs physiques et des
 vrais données venant de la prod, je me prends des segfault, des arrêts
 brutaux de mysqld, et une resynchro plutot aléatoire ... alors que cette
 solution est vendue pour améliorer la haute-dispo.


   Lorsque je l'avais test, et il y a déjà un moment dans MariaDB, je n'ai
 pas remarque de segfault.

 Peux tu effectivement nous en dire plus sur les versions que tu utilises,
 et aussi ce que tu as téléchargé, sur quel OS, etc ... ?

 Cdlt




-- 
Greg
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Alexandre Legrix

On 11/28/14 10:44, Greg wrote:
 Je ne souhaite pas préciser les versions pour ne pas rentrer dans un
 débat oui mais avec telle version de Percona ça marche par contre du
 coup tu n'auras pas la feature X de MariaDB etc ...

 Ce qui m'intéresse c'est un retour d'expérience en production.


Ok alors sans entrer dans un debat de clocher puisque tu ne veux pas
parler de version ... (Chose que je trouve débile, soit dit en passant)
Sur des Gentoo (et/ou Debian) (Je ne dis pas la version) configurées aux
petits oignons, avec des MariaDB (sans dire la version) Galera (pas de
version du patch) dernière version de l’époque (mais je dis pas la date)
(puisqu'on ne doit pas parler de version ) , ça marchait en
production sans segfault ! avec un datadir d'environ 20Gb

Tu vois a quel point c'est ridicule de ne pas vouloir donner de versions ?

/fin

___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet veronique Loquet - AL'X Communication
Voici un retour d'expérience en prod que j'ai interrogé le mois dernier
http://alx-communication.over-blog.com/article-le-fournisseur-d-acces-a-internet-enter-a-fait-le-choix-de-galera-cluster-124922938.html
Il te manquera sans doute des précisions techniques, mais au cas où je
peux faire remonter tes questions à Codership

Véro


Le 28/11/2014 09:31, Greg a écrit :
 Bonjour la liste,

 sur le papier, Galera Cluster semble parfait pour remplacer un
 ensemble de master-slaves sans avoir les coûts d'un NDB.

 En pratique, sur une maquette avec des vrais serveurs physiques et des
 vrais données venant de la prod, je me prends des segfault, des arrêts
 brutaux de mysqld, et une resynchro plutot aléatoire ... alors que
 cette solution est vendue pour améliorer la haute-dispo.

 Alors j'aimerais avoir des retours d'expériences, savoir si ça vaut le
 coup que j'investisse encore du temps ou si elle est encore clairement
 immature pour de la prod.
 Sachant qu'un cluster Galera coûte plus cher en terme de ressources
 dans certains cas, parce qu'il faut minimum 3 serveurs ce qui n'est
 pas le cas pour une partie de mon archi qui ne comprend qu'un master +
 un slave.

 Aussi, avec l'arrivée des GTIDs, élire un slave master et reconfigurer
 les slaves devient très simple:
 STOP SLAVE;
 CHANGE MASTER TO MASTER_HOST=new_master;
 START SLAVE;


 Avez vous des retours en conditions réels ?
 -- 
 Greg


 ___
 Liste de diffusion du FRsAG
 http://www.frsag.org/



---
L'absence de virus dans ce courrier électronique a été vérifiée par le logiciel 
antivirus Avast.
http://www.avast.com
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Cyril Lavier
Bonjour. 

J'ai mis en prod un cluster Percona XtraDB (donc Galera) de 5 noeuds. 

Franchement, je n'en suis pas déçu, ça marche très bien. 

Un point négatif, c'est la répartition de charge, j'ai mis le cluster derrière 
un BigIP, et au niveau des écritures, j'ai dû créer un pool à part en mode 
actif/passif, avec un noeud actif pour les écritures, sans ça, j'avais une 
trouzaine de deadlocks dans tous les sens, et même avec des modifications de 
code, de requêtes SQL ou de schémas, il m'en restait. En passant sur le pool 
avec un noeud actif en écriture, je dois avoir 1 ou 2 deadlocks dans la 
journée, ce qui est bien mieux qu'avant. 

Pour la stabilité, les seuls incidents étaient causés par des pebkacs, avec une 
désynchro de tous les noeuds et donc le cluster qui tombe. 

J'ai déjà une machine du cluster qui a grillée, et à part quelques alertes de 
supervision, et un cluster légèrement plus lent, je n'ai eu aucun impact en 
production. 

J'espère que ça va t'aider. 

Merci. 


From: Greg greg-fr...@duchatelet.net 
To: French SysAdmin Group frsag@frsag.org 
Sent: Friday, 28 November, 2014 10:44:22 
Subject: Re: [FRsAG] Galera Cluster 

Je ne souhaite pas préciser les versions pour ne pas rentrer dans un débat oui 
mais avec telle version de Percona ça marche par contre du coup tu n'auras pas 
la feature X de MariaDB etc ... 
Ce qui m'intéresse c'est un retour d'expérience en production. 

Le 28 novembre 2014 10:36, Alexandre Legrix  a...@bragonux.net  a écrit : 



Bonjour. 


BQ_BEGIN

BQ_BEGIN

En pratique, sur une maquette avec des vrais serveurs physiques et des vrais 
données venant de la prod, je me prends des segfault, des arrêts brutaux de 
mysqld, et une resynchro plutot aléatoire ... alors que cette solution est 
vendue pour améliorer la haute-dispo. 





BQ_END
Lorsque je l'avais test, et il y a déjà un moment dans MariaDB, je n'ai pas 
remarque de segfault. 

Peux tu effectivement nous en dire plus sur les versions que tu utilises, et 
aussi ce que tu as téléchargé, sur quel OS, etc ... ? 

Cdlt 

BQ_END




-- 
Greg 

___ 
Liste de diffusion du FRsAG 
http://www.frsag.org/ 

-- 
Cyril Davromaniak Lavier 
KeyID 59E9A881 
http://www.davromaniak.eu 
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Greg
OK admettons alors voilà les versions :
Debian Wheezy (à jour)
MariaDB 5.5.40 et 10.1.1 (une seule version par Cluster)
Du coup, c'est Galera 25.3.5.

Il faut que j'essayer avec MariaDB 10.0.15 qui est plus stable.

Le segfault était du à un problème avec des binlogs, je ne sais pas
pourquoi. En supprimant tous les binlogs, je n'avais plus de segfault. En
supprimant les options wsrep_% dans la config mysql et avant de supprimer
ces binlogs, je n'avais plus les segfault. C'est donc le plugin Galera qui
faisait segfaulter mysqld.


Sinon, c'est curieux, mais j'ai reçu des retours négatifs off-list, et
uniquement off-list...
- Le problème des écritures simultanées sur plusieurs nodes, qui causent
des deadlocks, revient à chaque fois
- On m'a aussi signalé des problèmes de synchro de nodes.
- ce n'est visiblement pas adapté aux taux d'écritures trop élevés
- finalement la gestion d'un ensemble master-slaves semble plus fiable et
plus facile à gérer en cas de crash d'une ou plusieurs nodes
- les quelques success-stories concernent des clusters avec un fort taux de
lecture

Je vais continuer ma maquette, cette fois avec la version 10.0.15 de
MariaDB, et ferais des tests supplémentaires sur la charge.


Bon week-end !

Le 28 novembre 2014 10:50, Alexandre Legrix a...@bragonux.net a écrit :


 On 11/28/14 10:44, Greg wrote:
  Je ne souhaite pas préciser les versions pour ne pas rentrer dans un
  débat oui mais avec telle version de Percona ça marche par contre du
  coup tu n'auras pas la feature X de MariaDB etc ...
 
  Ce qui m'intéresse c'est un retour d'expérience en production.
 

 Ok alors sans entrer dans un debat de clocher puisque tu ne veux pas
 parler de version ... (Chose que je trouve débile, soit dit en passant)
 Sur des Gentoo (et/ou Debian) (Je ne dis pas la version) configurées aux
 petits oignons, avec des MariaDB (sans dire la version) Galera (pas de
 version du patch) dernière version de l’époque (mais je dis pas la date)
 (puisqu'on ne doit pas parler de version ) , ça marchait en
 production sans segfault ! avec un datadir d'environ 20Gb

 Tu vois a quel point c'est ridicule de ne pas vouloir donner de versions ?

 /fin




-- 
Greg
___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Cyril Lavier

Bonsoir.

Franchement, le point le plus gênant dans ce système de cluster, c'est 
l'effet dominos quand il y a un problème de synchro (encore plus quand 
on se retrouve avec une erreur humaine et des tables créées en MyISAM, 
alors là, c'est une boucherie), en 5 mins, tout le cluster tombe, et 
t'as gagné un bootstrap-pxc...


Je ne te cache pas que je suis d'accord avec les points que tu as 
résumé, ça représente mes 4 derniers mois à travailler sur cette techno.


Bonne soirée et bon weekend !

On 11/28/2014 07:02 PM, Greg wrote:

OK admettons alors voilà les versions :
Debian Wheezy (à jour)
MariaDB 5.5.40 et 10.1.1 (une seule version par Cluster)
Du coup, c'est Galera 25.3.5.

Il faut que j'essayer avec MariaDB 10.0.15 qui est plus stable.

Le segfault était du à un problème avec des binlogs, je ne sais pas 
pourquoi. En supprimant tous les binlogs, je n'avais plus de segfault. 
En supprimant les options wsrep_% dans la config mysql et avant de 
supprimer ces binlogs, je n'avais plus les segfault. C'est donc le 
plugin Galera qui faisait segfaulter mysqld.



Sinon, c'est curieux, mais j'ai reçu des retours négatifs off-list, et 
uniquement off-list...
- Le problème des écritures simultanées sur plusieurs nodes, qui 
causent des deadlocks, revient à chaque fois

- On m'a aussi signalé des problèmes de synchro de nodes.
- ce n'est visiblement pas adapté aux taux d'écritures trop élevés
- finalement la gestion d'un ensemble master-slaves semble plus fiable 
et plus facile à gérer en cas de crash d'une ou plusieurs nodes
- les quelques success-stories concernent des clusters avec un fort 
taux de lecture


Je vais continuer ma maquette, cette fois avec la version 10.0.15 de 
MariaDB, et ferais des tests supplémentaires sur la charge.



Bon week-end !

Le 28 novembre 2014 10:50, Alexandre Legrix a...@bragonux.net 
mailto:a...@bragonux.net a écrit :



On 11/28/14 10:44, Greg wrote:
 Je ne souhaite pas préciser les versions pour ne pas rentrer dans un
 débat oui mais avec telle version de Percona ça marche par
contre du
 coup tu n'auras pas la feature X de MariaDB etc ...

 Ce qui m'intéresse c'est un retour d'expérience en production.


Ok alors sans entrer dans un debat de clocher puisque tu ne veux pas
parler de version ... (Chose que je trouve débile, soit dit en
passant)
Sur des Gentoo (et/ou Debian) (Je ne dis pas la version)
configurées aux
petits oignons, avec des MariaDB (sans dire la version) Galera (pas de
version du patch) dernière version de l’époque (mais je dis pas la
date)
(puisqu'on ne doit pas parler de version ) , ça marchait en
production sans segfault ! avec un datadir d'environ 20Gb

Tu vois a quel point c'est ridicule de ne pas vouloir donner de
versions ?

/fin




--
Greg


___
Liste de diffusion du FRsAG
http://www.frsag.org/



--
Cyril Davromaniak Lavier
KeyID 59E9A881
http://www.davromaniak.eu

___
Liste de diffusion du FRsAG
http://www.frsag.org/


Re: [FRsAG] Galera Cluster

2014-11-28 Par sujet Guillaume Hilt
Avec un HAProxy pour faire la répartition en frontal, ça n'aurait pas 
réglé ton problème ?


  Guillaume Hilt

Le 28/11/2014 10:54, Cyril Lavier a écrit :

Bonjour.

J'ai mis en prod un cluster Percona XtraDB (donc Galera) de 5 noeuds.

Franchement, je n'en suis pas déçu, ça marche très bien.

Un point négatif, c'est la répartition de charge, j'ai mis le cluster 
derrière un BigIP, et au niveau des écritures, j'ai dû créer un pool à 
part en mode actif/passif, avec un noeud actif pour les écritures, 
sans ça, j'avais une trouzaine de deadlocks dans tous les sens, et 
même avec des modifications de code, de requêtes SQL ou de schémas, il 
m'en restait. En passant sur le pool avec un noeud actif en écriture, 
je dois avoir 1 ou 2 deadlocks dans la journée, ce qui est bien mieux 
qu'avant.


Pour la stabilité, les seuls incidents étaient causés par des pebkacs, 
avec une désynchro de tous les noeuds et donc le cluster qui tombe.


J'ai déjà une machine du cluster qui a grillée, et à part quelques 
alertes de supervision, et un cluster légèrement plus lent, je n'ai eu 
aucun impact en production.


J'espère que ça va t'aider.

Merci.


*From: *Greg greg-fr...@duchatelet.net
*To: *French SysAdmin Group frsag@frsag.org
*Sent: *Friday, 28 November, 2014 10:44:22
*Subject: *Re: [FRsAG] Galera Cluster

Je ne souhaite pas préciser les versions pour ne pas rentrer dans un 
débat oui mais avec telle version de Percona ça marche par contre du 
coup tu n'auras pas la feature X de MariaDB etc ...

Ce qui m'intéresse c'est un retour d'expérience en production.

Le 28 novembre 2014 10:36, Alexandre Legrix a...@bragonux.net 
mailto:a...@bragonux.net a écrit :


Bonjour.

En pratique, sur une maquette avec des vrais serveurs
physiques et des vrais données venant de la prod, je me
prends des segfault, des arrêts brutaux de mysqld, et une
resynchro plutot aléatoire ... alors que cette solution
est vendue pour améliorer la haute-dispo.


Lorsque je l'avais test, et il y a déjà un moment dans MariaDB, je
n'ai pas remarque de segfault.

Peux tu effectivement nous en dire plus sur les versions que tu
utilises, et aussi ce que tu as téléchargé, sur quel OS, etc ... ?

Cdlt




--
Greg

___
Liste de diffusion du FRsAG
http://www.frsag.org/

--
Cyril Davromaniak Lavier
KeyID 59E9A881
http://www.davromaniak.eu


___
Liste de diffusion du FRsAG
http://www.frsag.org/


___
Liste de diffusion du FRsAG
http://www.frsag.org/