Topología de muestra y recuperación de desastres

El siguiente diagrama muestra una topología de muestra con tres grupos de multiescritura. Cada grupo contiene tres agentes de sistema de directorio de multiescritura. Todos los agentes de sistema de directorio deben tener el mismo prefijo.
cad140es
Topología de muestra
El siguiente diagrama muestra una topología de muestra con tres grupos de multiescritura. Cada grupo contiene tres agentes de sistema de directorio de multiescritura. Todos los agentes de sistema de directorio deben tener el mismo prefijo.
Cada grupo tiene un concentrador de multiescritura configurado (en rojo). Se incluye un ejemplo de la precedencia de escritura para cada agente de sistema de directorio de enrutador.
Sample Topology
Recuperación de desastres
Aunque la recuperación de multiescritura-DISP garantiza la coherencia de los datos entre los distintos agentes de sistema de directorio de replicación del mismo nivel durante una interrupción, a veces se debe volver a crear un agente de sistema de directorio. Cuando se produce un error de hardware o disco, o cuando se dañan los datos, se debe volver a crear el agente de sistema de directorio. En tales casos, un procedimiento de recuperación de desastres permite garantizar que todos los agentes de sistema de directorio estén activos y en ejecución con datos coherentes. Normalmente, estas situaciones se producen cuando se debe volver a crear el agente de sistema de directorio desde la copia de seguridad o cuando el agente de sistema de directorio no se inicia debido a errores relacionados con la cuadrícula. La agregación de nuevos grupos de multiescritura o de nuevos agentes de sistema de directorio puede seguir un proceso similar para sincronizar los datos entre los diferentes agentes de sistema de directorio de datos. Después de una interrupción de larga duración, se puede ejecutar un procedimiento de recuperación de desastres. La utilización de un procedimiento de recuperación es más eficaz que conciliar grandes cambios mediante la multiescritura-DISP.
Del mismo modo que ocurre con cualquier procedimiento de recuperación de desastres, primero se debe utilizar en un entorno de prueba para poder documentar los pasos específicos de la implementación.
La utilización de concentradores para grupos de multiescritura lleva a dos escenarios de recuperación de desastres posibles. Los siguientes pasos permiten garantizar que los agentes de sistema de directorio siguen activos durante la recuperación.
Los pasos de recuperación utilizan la topología de muestra como referencia y se pueden personalizar para una implementación específica.
Recuperación de un DSA del mismo nivel de un grupo de multiescritura
Se debe volver a sincronizar un agente de sistema de directorio de grupo de multiescritura de un grupo de multiescritura para que el agente de sistema de directorio vuelva a estar en línea con el concentrador de multiescritura que proporciona servicio al grupo.
Escenario de desastres:
No se puede iniciar el agente de sistema de directorio US2 debido a un error relacionado con la cuadrícula después de que el equipo donde se ejecuta se haya detenido debido a una alerta grave de kernel.
Paso 1:
Asegúrese de que el agente de sistema de directorio de recuperación se encuentra en un estado de detención.
  • dxserver stop US2
Paso 2:
Establezca US2 a una hora (ahora) anterior a la captura de la instantánea de los datos (volcado en línea) desde US1. Este paso permite garantizar que los agentes de sistema de directorio que estén replicando en US2 solamente envíen las actualizaciones de recuperación desde el momento en que se haya capturado la instantánea de datos.
  • Host F: Ejecute dxdisp US2. Este comando establece la hora en que US3 se ha actualizado por última vez US2.
  • Host D: Ejecute dxdisp US2. Este comando establece la hora en que US1 ha actualizado por última vez US2.
Paso 3:
Cuando sea posible, realice un volcado en línea desde el agente de sistema de directorio de concentrador (US1). Cuanto antes se capture la instantánea después de ejecutar dxdisp, menor será el número de actualizaciones que se deberán volver a aplicar a US2 durante la recuperación. De esta forma, la recuperación será más eficaz.
  • Host D: Ejecute Telnet en la consola del agente de sistema de directorio de US1 (concentrador) y ejecute el comando "dump dxgrid-db;" para iniciar un volcado en línea. Utilice el comando "logout;" y, a continuación, salga de la consola del agente de sistema de directorio.
  • Host D: Compruebe el registro de advertencias de US1 para ver la hora de inicio y la hora de finalización (aún más importante) del volcado.
  • Host D: Una vez completado el volcado, se crea un archivo denominado $DXHOME/data/US1.zdb. Copie este archivo en el host E. Por ejemplo, cópielo en Host E:/tmp/US1.zdb.
Nota:
Se deben comprimir los archivos antes de copiarlos en los diferentes equipos; la mayoría de archivos de cuadrícula se comprimen sin problemas. Se debe comprobar que la marca de tiempo es reciente para asegurarse de que el comando de copia de seguridad en línea ha creado el archivo que se están copiando.
Paso 4:
Evite que US2 reproduzca las actualizaciones en el concentrador y en los agentes de sistema de directorio del mismo nivel.
  • Host E: dxdisp US1
  • Host E: dxdisp US3
Paso 5:
Ahora que se ha capturado una instantánea desde el concentrador, ya se puede copiar esta información.
  • Host E: Elimine el registro de transacciones antiguo (si está activado); elimine $DXHOME/data/US2.tx.
  • Host E: Copie (y descomprima) el archivo de cuadrícula de copia de seguridad generado en el paso 3; por ejemplo, copie /tmp/US1.zdb $DXHOME/data/US2.db.
  • Host E: dxserver start US2
  • Host E: Tras un breve período de tiempo, US2 está de nuevo sincronizado con US1. Se puede realizar un seguimiento del progreso de la recuperación de multiescritura-DISP en el registro de alarmas para US2.
Nota:
US2 no permite los enlaces desde enrutadores o aplicaciones hasta que se ha completado la recuperación. La recuperación puede tardar más tiempo si hay un gran volumen de actualizaciones simultáneas.
Recuperación de un concentrador de un grupo de multiescritura
El escenario en el que se debe resincronizar un agente de sistema de directorio de concentrador de grupo de multiescritura de un grupo de multiescritura es un poco más complicado. En tal caso, los agentes de sistema de directorio a los que presta servicio el concentrador también se debe sincronizar debido al modo en qué fluyen las actualizaciones en este estilo de topología de red. Cuando se sincroniza un concentrador, todos los agentes de sistema de directorio del grupo a los que presta servicio el concentrador necesitan sincronizarse.
Escenario de desastres:
No se puede iniciar el agente de sistema de directorio US1 debido a un error relacionado con la cuadrícula después de que el equipo donde se ejecuta se haya detenido debido a una alerta grave de kernel.
Paso 1:
Asegúrese de que el grupo de recuperación de agentes de sistema de directorio se encuentran en un estado detenido.
  • dxserver stop US1
  • dxserver stop US2
  • dxserver stop US3
Paso 2:
En cada concentrador, establezca US1 a una hora (ahora) anterior a la captura de la instantánea de los datos (volcado en línea) desde uno del resto de concentradores. Este paso permite garantizar que los agentes de sistema de directorio que estén replicando en US1 solamente envíen las actualizaciones de recuperación desde el momento en que se haya capturado la instantánea de datos.
  • Asegúrese de que la replicación entre AU3 y UK1 tenga el estado 
    OK
    . Este estado se puede comprobar mediante la emisión de un comando "get dsp;" en la consola del concentrador AU3. Este paso permite garantizar que, al capturar una instantánea desde UK1, los datos contengan las actualizaciones de AU3. Una vez ejecutado dxdisp, AU3 es responsable de recuperar las actualizaciones directamente.
  • Host C: Ejecute dxdisp US1. Este comando establece la hora en que el concentrador AU3 ha actualizado por última vez US1.
  • Host G: Ejecute dxdisp US1. Este comando establece la hora en que el concentrador UK1 ha actualizado por última vez US1.
Paso 3:
Cuando sea posible, realice un volcado en línea desde el concentrador (UK1).
  • Host G: Ejecute Telnet en la consola del agente de sistema de directorio de UK1 (concentrador) y ejecute el comando "dump dxgrid-db;" para iniciar un volcado en línea. Utilice el comando "logout;" y, a continuación, salga de la consola del agente de sistema de directorio.
  • Host G: Compruebe el registro de advertencias de UK1 para ver la hora de inicio y la hora de finalización (aún más importante) del volcado.
  • Host G: Una vez completado el volcado, se crea un archivo denominado $DXHOME/data/UK1.zdb.
  • Host G: Copie este archivo en el host D. Por ejemplo, cópielo en Host D:/tmp/UK1.zdb.
  • Host G: Copie este archivo en el host E. Por ejemplo, cópielo en Host E:/tmp/UK1.zdb.
  • Host G: Copie este archivo en el host F. Por ejemplo, cópielo en Host F:/tmp/UK1.zdb.
Nota:
Se deben comprimir los archivos antes de copiarlos en los diferentes equipos; la mayoría de archivos de cuadrícula se comprimen sin problemas. Se debe comprobar que la marca de tiempo es reciente para asegurarse de que el comando de copia de seguridad en línea ha creado el archivo que se están copiando.
Paso 4:
Evite que US1 reproduzca las actualizaciones en los concentradores. Evite también que US2 y US3 reproduzcan las actualizaciones en el concentrador US1.
  • Host D: dxdisp AU3
  • Host D: dxdisp UK1
  • Host D: dxdisp US2
  • Host D: dxdisp US3
  • Host E: dxdisp US1
  • Host E: dxdisp US3
  • Host F: dxdisp US1
  • Host F: dxdisp US2
Paso 5:
Cree una instancia de la instantánea de UK1 en cada agente de sistema de directorio del grupo de multiescritura US.
  • Host E: Elimine el registro de transacciones antiguo (si está activado); elimine $DXHOME/data/US1.tx.
  • Host D: Copie (y descomprima) el archivo de cuadrícula de copia de seguridad generado en el paso 3. Por ejemplo, copie /tmp/UK1.zdb $DXHOME/data/US1.db.
  • Host D: dxserver start US1
  • Host E: Elimine el registro de transacciones antiguo (si está activado); elimine $DXHOME/data/US2.tx.
  • Host E: Copie (y descomprima) el archivo de cuadrícula de copia de seguridad generado en el paso 3. Por ejemplo, copie /tmp/UK1.zdb $DXHOME/data/US2.db.
  • Host E: dxserver start US2
  • Host F: Elimine el registro de transacciones antiguo (si está activado); elimine $DXHOME/data/US3.tx.
  • Host F: Copie (y descomprima) el archivo de cuadrícula de copia de seguridad generado en el paso 3. Por ejemplo, copie /tmp/UK1.zdb $DXHOME/data/US3.db.
  • Host F: dxserver start US3
  • Host D: Tras un breve período de tiempo, US1 está de nuevo sincronizado con AU3 y UK1. Se puede realizar un seguimiento del progreso de la recuperación de multiescritura-DISP en el registro de alarmas para US1. La resincronización de US1 también incluye US2 y US3. El proceso de recuperación puede controlarse mediante el comando "
    get dsp;
    " en las consolas de AU3, UK1, US1, US2 y US3 para garantizar que la replicación funciona según lo previsto.
Nota:
US1, US2 y US3 no permiten los enlaces desde enrutadores o aplicaciones hasta que se ha completado la recuperación. La recuperación puede tardar más tiempo si hay un gran volumen de actualizaciones simultáneas.
Notas
  • Para Windows, la ruta a los archivos de cuadrícula es %DXHOME%\data.
  • No se deben copiar ni modificar nunca los archivos .dp.
  • En UNIX, estos pasos se deben realizar como el usuario agente de sistema de directorio, es decir, dsa.
  • No se debe copiar el archivo de cuadrícula hasta que no se haya completado el volcado. De hacerlo, se podrían dañar los datos o el volcado no se completaría correctamente. En tal caso, se deberá repetir el proceso.
  • Se debe comprobar la marca de tiempo del archivo .zdb para asegurarse de que se ha escrito recientemente y que no se ha utilizado una copia de seguridad más antigua de forma accidental.