Gracias Ernesto, cualquier información es bienvenida. Como ya he explicado, nosotros utilizamos la solución de IBM PowerHA mediante servicios de cluster y duplicación geográfica (antes Cross Site Mirroring - XSM).
Sé que puede ser complicado y quede en un intento. Lo que pretendo es automazar el rearrranque del nodo de cluster caído y la duplicación geográfica. Actualmente cuando se produce una partición en el cluster, es decir, por un corte de red los nodos dejan de verse y la duplicación se detiene. En QSYSOPR o QSYSMSG (no recuerdo ahora) se envía un mensaje indicando del corte, que se repite indefinidamente hasta que se levanta de nuevo la red. Quiero supervisar el histórico de anotacoines o la cola de mensajes (STRWCH) para detectar el mensaje de parada de la duplicación. A partir de ahí, puedo forzar directamente el arranque de los nodos (si fuera necesario) y la duplicación lanzando los mandatos pertinentes. Es lo que voy a intentar primero a ver que sale. Sin embargo, me gustaría poder revisar antes los elementos que debieran estar activos en cada nodo, de ahí mi pregunta. Un saludo y gracias por tu interés. Javier Mora El lun., 20 abr. 2020 a las 23:05, Ernesto Fonseca (<[email protected]>) escribió: > Hola Javier. > > Creo que en caso de corte de red, deberías de verificar si el estado del > cluster es "Feliz", lo cual implica revisar el estado de los nodos, el > dominio administrativo, el dominio de dispositivo, y las descripciones de > copia. > Automatizar el rearranque (o mejor dicho dejar feliz el cluster) puede no > ser algó fácil de hacer pues es necesario contemplar varios casos. Tal vez > una mejor opción es hacer un monitoreo del estado y en caso que algún punto > no se encuentre como debe, te llegue un aviso. > > El servicio INETD debería de estar siempre activo, aunque tengas un > pequeño corte de red. > Con respecto al XSM, si la replica es a nivel de SAN, no deberías de > afectarte los cortes de red salvo que tambien se corten > las conexiones de fibre channel. > En ese caso deberias de hacer un script que se conecte al storage(por > SSH) y obtenga un estado de la replica o revisar el estado delas > descripciones de copia a nivel de definición del cluster. > > > Espero haber sido de ayuda. > Saludos. > Ernesto Fonseca. > > > <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail> > Libre > de virus. www.avast.com > <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail> > <#m_-5204321853142650272_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2> > > El lun., 20 abr. 2020 a las 16:39, datil400 (<[email protected]>) > escribió: > >> Gracias Alex, los 5550 y 5551 estaban controlados, pero me despistaba >> INETD y no lo relacionaba con los servicios de cluster. >> >> No encuentro ninguna información sobre los puertos para XSM. >> >> Lo que quiero es chequear los puertos del equipo de respaldo para intenta >> averiguar si están activos. En el equipo principal podría hacerlo >> comprobando los trabajos de sistema relacionados con cluster. >> >> XSM se puede chequear desde las SST, pero hay que manualmente. >> >> Un saludo >> >> Javier >> >> El lun., 20 abr. 2020 21:30, Alex Martínez <[email protected]> escribió: >> >>> Hola >>> >>> De una mirada rápida y búsqueda en el manual >>> https://www.ibm.com/support/knowledgecenter/ssw_ibm_i_73/rzaig/rzaigpdf.pdf >>> >>> Lo recuerdo porque tuve un caso de conflicto en una instalación que ya >>> tenía un servicio escuchando en el puerto 5550 >>> >>> Considerations for using clusters with firewalls If you are using >>> clustering in a network that uses firewalls, you should be aware of some >>> limitations and requirements. If you are using clustering with a firewall, >>> you need to give each node the ability to send outbound messages to and >>> receive inbound messages from other cluster nodes. An opening in the >>> firewall must exist for each cluster address on each node to communicate >>> with every cluster address on every other node. IP packets traveling across >>> a network can be of various types of traffic. Clustering uses ping, which >>> is type ICMP, and also uses UDP and TCP. When you configure a firewall, you >>> can filter traffic based on the type. For clustering to work the firewall >>> needs to allow traffic of ICMP, UDP and TCP. *Outbound traffic can be >>> sent on any port and inbound traffic is received on ports 5550 and 5551. * >>> >>> In addition, if you are making use of advanced node failure detection, >>> any cluster node that is to receive failure messages from a Hardware >>> Management Console (HMC) or a Virtual I/O Server (VIOS) on an Integrated >>> Virtualization Manager (IVM) managed server must be able to communicate >>> with that HMC or VIOS partition. The cluster node will send to the HMC or >>> VIOS on the IP address that is associated with the HMC's or VIOS domain >>> name and to port 5989. The cluster node will receive from the HMC or VIOS >>> on the IP address that is associated with the cluster node's system name >>> and on port 5989. >>> >>> >>> >>> El lun., 20 abr. 2020 a las 13:16, datil400 (<[email protected]>) >>> escribió: >>> >>>> Hola a tod@s, >>>> >>>> actualmente utilizamos PowerHA como software de replicación, mediante >>>> los servicios de cluster y la duplicación por hardware "Cross Site >>>> Mirroring (XSM)" de una ASP independiente. >>>> >>>> Estoy intentando automatizar el rearranque del cluster y de la >>>> replicación después de una partición de cluster o corte de red (no estoy >>>> hablando de un "fail over"). >>>> >>>> Quiero chequear varios elementos, entre ellos los puertos TCP/IP >>>> utilizados por los servicios de Cluster y XSM para saber si están >>>> "levantados". >>>> >>>> ¿Conocéis los números de los puertos TCP/IP utilizados por estas >>>> herramientas? >>>> >>>> Un saludos a tod@s y gracias por vuestros comentarios. >>>> >>>> Javier Mora >>>> ____________________________________________________ >>>> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd ) >>>> Forum.Help400 © Publicaciones Help400, S.L. >>> >>> ____________________________________________________ >>> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd ) >>> Forum.Help400 © Publicaciones Help400, S.L. >> >> ____________________________________________________ >> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd ) >> Forum.Help400 © Publicaciones Help400, S.L. > > > > -- > Saludos. > Ernesto Fonseca > IT Specialist > O==00==O > ____________________________________________________ > Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd ) > Forum.Help400 © Publicaciones Help400, S.L.
____________________________________________________ �nete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd ) Forum.Help400 � Publicaciones Help400, S.L.
