Gracias Ernesto, cualquier información es bienvenida.

Como ya he explicado, nosotros utilizamos la solución de IBM PowerHA
mediante servicios de cluster y duplicación geográfica (antes Cross Site
Mirroring - XSM).

Sé que puede ser complicado y quede en un intento. Lo que pretendo es
automazar el rearrranque del nodo de cluster caído y la duplicación
geográfica. Actualmente cuando se produce una partición en el cluster, es
decir, por un corte de red los nodos dejan de verse y la duplicación se
detiene. En QSYSOPR o QSYSMSG (no recuerdo ahora) se envía un mensaje
indicando del corte, que se repite indefinidamente hasta que se levanta de
nuevo la red.

Quiero supervisar el histórico de anotacoines o la cola de mensajes
(STRWCH) para detectar el mensaje de parada de la duplicación. A partir de
ahí, puedo forzar directamente el arranque de los nodos (si fuera
necesario) y la duplicación lanzando los mandatos pertinentes. Es lo que
voy a intentar primero a ver que sale. Sin embargo, me gustaría poder
revisar antes los elementos que debieran estar activos en cada nodo, de ahí
mi pregunta.

Un saludo y gracias por tu interés.

Javier Mora

El lun., 20 abr. 2020 a las 23:05, Ernesto Fonseca (<[email protected]>)
escribió:

> Hola Javier.
>
> Creo que en caso de corte de red, deberías de verificar si el estado del
> cluster es "Feliz", lo cual implica revisar el estado de los nodos, el
> dominio administrativo, el dominio de dispositivo, y las descripciones de
> copia.
> Automatizar el rearranque (o mejor dicho dejar feliz el cluster) puede no
> ser algó fácil de hacer pues es necesario contemplar varios casos. Tal vez
> una mejor opción es hacer un monitoreo del estado y en caso que algún punto
> no se encuentre como debe, te llegue un aviso.
>
> El servicio INETD debería de estar siempre activo, aunque tengas un
> pequeño corte de red.
> Con respecto al XSM, si la replica es a nivel de SAN, no deberías de
> afectarte los cortes de red salvo que tambien se corten
> las conexiones de fibre channel.
> En ese caso deberias de hacer un script que se conecte al storage(por
> SSH)  y obtenga un estado de la replica o revisar el estado delas
> descripciones de copia a nivel de definición del cluster.
>
>
> Espero haber sido de ayuda.
> Saludos.
> Ernesto Fonseca.
>
>
> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
>  Libre
> de virus. www.avast.com
> <https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail>
> <#m_-5204321853142650272_DAB4FAD8-2DD7-40BB-A1B8-4E2AA1F9FDF2>
>
> El lun., 20 abr. 2020 a las 16:39, datil400 (<[email protected]>)
> escribió:
>
>> Gracias Alex, los 5550 y 5551 estaban controlados, pero me despistaba
>> INETD y no lo relacionaba con los servicios de cluster.
>>
>> No encuentro ninguna información sobre los puertos para XSM.
>>
>> Lo que quiero es chequear los puertos del equipo de respaldo para intenta
>> averiguar si están activos. En el equipo principal podría hacerlo
>> comprobando los trabajos de sistema relacionados con cluster.
>>
>> XSM se puede chequear desde las SST, pero hay que manualmente.
>>
>> Un saludo
>>
>> Javier
>>
>> El lun., 20 abr. 2020 21:30, Alex Martínez <[email protected]> escribió:
>>
>>> Hola
>>>
>>> De una mirada rápida y búsqueda en el manual
>>> https://www.ibm.com/support/knowledgecenter/ssw_ibm_i_73/rzaig/rzaigpdf.pdf
>>>
>>> Lo recuerdo porque tuve un caso de conflicto en una instalación que ya
>>> tenía un servicio escuchando en el puerto 5550
>>>
>>>   Considerations for using clusters with firewalls If you are using
>>> clustering in a network that uses firewalls, you should be aware of some
>>> limitations and requirements. If you are using clustering with a firewall,
>>> you need to give each node the ability to send outbound messages to and
>>> receive inbound messages from other cluster nodes. An opening in the
>>> firewall must exist for each cluster address on each node to communicate
>>> with every cluster address on every other node. IP packets traveling across
>>> a network can be of various types of traffic. Clustering uses ping, which
>>> is type ICMP, and also uses UDP and TCP. When you configure a firewall, you
>>> can filter traffic based on the type. For clustering to work the firewall
>>> needs to allow traffic of ICMP, UDP and TCP. *Outbound traffic can be
>>> sent on any port and inbound traffic is received on ports 5550 and 5551. *
>>>
>>> In addition, if you are making use of advanced node failure detection,
>>> any cluster node that is to receive failure messages from a Hardware
>>> Management Console (HMC) or a Virtual I/O Server (VIOS) on an Integrated
>>> Virtualization Manager (IVM) managed server must be able to communicate
>>> with that HMC or VIOS partition. The cluster node will send to the HMC or
>>> VIOS on the IP address that is associated with the HMC's or VIOS domain
>>> name and to port 5989. The cluster node will receive from the HMC or VIOS
>>> on the IP address that is associated with the cluster node's system name
>>> and on port 5989.
>>>
>>>
>>>
>>> El lun., 20 abr. 2020 a las 13:16, datil400 (<[email protected]>)
>>> escribió:
>>>
>>>> Hola a tod@s,
>>>>
>>>> actualmente utilizamos PowerHA como software de replicación, mediante
>>>> los servicios de cluster y la duplicación por hardware "Cross Site
>>>> Mirroring (XSM)" de una ASP independiente.
>>>>
>>>> Estoy intentando automatizar el rearranque del cluster y de la
>>>> replicación después de una partición de cluster o corte de red (no estoy
>>>> hablando de un "fail over").
>>>>
>>>> Quiero chequear varios elementos, entre ellos los puertos TCP/IP
>>>> utilizados por los servicios de Cluster y XSM para saber si están
>>>> "levantados".
>>>>
>>>> ¿Conocéis los números de los puertos TCP/IP utilizados por estas
>>>> herramientas?
>>>>
>>>> Un saludos a tod@s y gracias por vuestros comentarios.
>>>>
>>>> Javier Mora
>>>> ____________________________________________________
>>>> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd )
>>>> Forum.Help400 © Publicaciones Help400, S.L.
>>>
>>> ____________________________________________________
>>> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd )
>>> Forum.Help400 © Publicaciones Help400, S.L.
>>
>> ____________________________________________________
>> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd )
>> Forum.Help400 © Publicaciones Help400, S.L.
>
>
>
> --
> Saludos.
> Ernesto Fonseca
> IT Specialist
> O==00==O
> ____________________________________________________
> Únete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd )
> Forum.Help400 © Publicaciones Help400, S.L.
____________________________________________________
�nete a Recursos AS400, nuestra Comunidad ( http://bit.ly/db68dd )
Forum.Help400 � Publicaciones Help400, S.L.

Reply via email to