Network load Balancer app servers

Hernani

Buenas,

Tenemos una situación un poco rara en el curro desde hace un par de semanas y no logramos entender, igual alguno por aquí sabe cual es el problema explico.

Tenemos un NLB con dos VM's que son los servers para una aplicación.

Todas las maquinas están obviamente en la misma red pongo x pero vamos que están en la misma red.

App01 IP x.x.x.156

App02 IP x.x.x.157

app-nlb IP x.x.x.155

app-nlb es el nombre del nlb en si y es la IP a la que hace target la aplicación ,que el target es x.x.x.155 no los app servers directamente obviamente.

el NLB estaba funcionando en Unicast, ambas maquinas virtuales en el mismo host de VMware y ambas maquinas virtuales con un solo NIC(ya se que no era lo recomendado pero ha funcionado así años sin problema)

El caso es que los devs lanzaron un update que jodió el app pool de uno de los servers y lo sacamos del NLB mientras se arreglaba el problema bien pues , después de esto y de que el problema este resuelto, ya nos es imposible meter a los dos nodos en el NLB cluster, si metemos los dos uno funciona pero las peticiones enviadas al segundo no, con lo cual la aplicación funciona para algunos clientes y no para otros, si sacamos tanto el 01 o el 02 del NLB vuelve a funcionar pero no funciona ya añadiendo los dos a la vez, he de decir que lo que son webs funcionan y a unos los manda al app01 y a otros al app 02 pero no nuestra app( hecha en .net)

En el momento en que añadimos el otro nodo al cluster pum... las peticiones que van a uno de los nodos no son respondidas, la app utiliza protocolo net.tcp,no entendemos porque funcionaba antes y no ahora, es totalmente absurdo, los devs obviamente nos culpan a los de infra y nosotros no hemos realizado ningún cambio cosa que ellos si, pero dicen que han cambiado el modelo de una de las bases de datos y ya no hay opción a volver atrás( estupendo!!)

Hemos añadido un segundo NIC, en cada uno de los app servers dedicado exclusivamente para la comunicación con el NLB pero la situación es exactamente la misma, solo funciona uno de los app servers el otro se queda sin responder solo que esta vez al tener dos NIC's pues si que devuelve el ping vía el otro NIC.

A nivel de DNS tenemos dos entradas para cada uno de los app servers con sus dos NIC's.

Alguna idea? no entendemos como ha estado funcionando años y ahora sin mas ya no funciona ni siquiera siguiendo las indicaciones de VMware de añadir un segundo NIC para el NLB en cada VM.

Bueno si alguien tiene alguna idea de que puede ser, lo agradecería, de momento hemos abierto ticket con VMware a ver que nos dicen.

Un saludo y gracias.

Usuarios habituales

  • Hernani

Tags