5 Mejores Prácticas para Garantizar que su Solución de Alta Disponibilidad IBM i esté Lista para Cambios
Guía esencial para optimizar y mantener sus sistemas de Alta Disponibilidad
Descargue la guía completa
Obtenga acceso a la versión completa de esta guía, incluyendo ejemplos detallados y recomendaciones adicionales.
Introducción
La Alta Disponibilidad (HA) es una inversión significativa e importante de TI para muchas empresas con IBM i, que puede dar sus frutos en caso de que se produzca un fallo importante de hardware o un desastre en el sitio. Pero lo fundamental para garantizar el rendimiento de HA es tener confianza en poder cambiar de manera eficiente y exitosa sus aplicaciones comerciales y otros procesos críticos de su servidor de producción a una copia de seguridad completamente sincronizada.
Poder ejecutar cambios planificados y recuperaciones ante fallos sin problemas (y así minimizar el tiempo de inactividad y la pérdida de datos) depende de seguir una serie de mejores prácticas, que se describen en esta guía.
¡Simplemente instalar software de HA no significa que tenga una solución completa!
El software de Alta Disponibilidad es una pieza crítica de una solución completa, pero simplemente comprar e instalar el software no significa que la solución esté completa. A pesar de que nuestras soluciones de HA avanzadas incluyen muchas características de automatización y auto-reparación, sigue siendo fundamental realizar un monitoreo, optimización y pruebas regulares de la solución.
Mejores Prácticas
1Garantizar una Configuración Adecuada de HA
Antes de instalar HA, es fundamental determinar los datos y aplicaciones que necesita proteger realizando un inventario de datos y estableciendo prioridades de replicación. A partir de esto, su HA puede configurarse correctamente para su entorno.
Pero no pierda de vista el hecho de que los entornos de TI son dinámicos; por lo tanto, es posible que la configuración de su HA deba ajustarse de vez en cuando. Por ejemplo, cuando se actualizan las aplicaciones, es importante asegurarse de que su configuración de replicación sea revisada y, si es necesario, actualizada para reflejar las aplicaciones actualizadas.
Verifique que exista un proceso de replicación para todos los objetos que se necesitan en el sistema de respaldo para ejecutar completamente sus funciones comerciales esenciales.
Estos incluyen:
- Bibliotecas
- Perfiles de usuario
- Listas de autorización
- Autoridades de objetos
- Directorios IFS
- Archivos en spool
2Monitorear y Optimizar Regularmente la Salud de HA
Mantener su HA optimizado y listo para cambios requiere verificar regularmente la salud de sus entornos de replicación para garantizar que las funciones esenciales estén funcionando sin problemas.
Tareas diarias
Dependiendo de su software de HA, es posible que se le notifique automáticamente si surge un problema con uno de los procesos importantes que se enumeran a continuación y, en muchos casos, el software resolverá automáticamente el problema.
- Verificar que la replicación esté activa.
- Validar que se hayan ejecutado auditorías y asegurarse de que las diferencias descubiertas se hayan reparado automáticamente.
- Verificar que la comunicación esté activa entre la fuente y el destino.
- Verificar que el registro remoto desde la fuente hasta el destino esté activo.
- Verificar que haya poca o ninguna latencia en la replicación.
- Buscar errores de replicación no corregidos automáticamente.
- Responder rápidamente a las alertas generadas por el software HA.
Tareas semanales
- Revisar los errores de la semana para ver si hay patrones (por ejemplo, después de una ejecución por lotes nocturna, etc.).
- Enviar un informe a la gerencia sobre el estado de la solución para proporcionar la seguridad de que la solución está protegiendo el negocio como se esperaba.
Tareas mensuales
- Buscar e instalar nuevas correcciones de productos o paquetes de servicio.
- Buscar e instalar cualquier PTF recomendado/requerido del sistema operativo.
- Revisar los errores del mes para encontrar y corregir patrones más grandes.
- Verificar que el ancho de banda se mantenga optimizado para su carga de trabajo de replicación para no desperdiciar recursos del sistema.
- Revisar la configuración para asegurarse de que los cambios en su sistema de producción, y particularmente en sus aplicaciones comerciales, sean replicados correctamente por su HA.
Tareas trimestrales
- Realizar una prueba de cambio, o mejor aún, cambiar y quedarse (ejecutar en cada sistema durante un trimestre y luego cambiar). Esto asegura que puede ejecutar de manera confiable sus procesos comerciales en cada servidor.
- Actualizar su manual de HA según sea necesario en función de los resultados de las pruebas de cambio y los cambios en su entorno de HA.
Tareas anuales
- Buscar e instalar nuevas versiones de su software de HA para asegurarse de que siempre esté en una versión compatible. Si está en una versión no compatible y tiene problemas con su HA durante un cambio, es posible que primero deba actualizar su software antes de poder cambiar, lo que puede retrasar significativamente su recuperación.
- Hacer que un consultor certificado de HA realice una auditoría de su entorno de HA.
Consejo
Documente toda la configuración, monitoreo, mantenimiento y pruebas de cambio de su solución de HA. Además de facilitarle la realización de sus tareas de mantenimiento periódicas (porque puede consultar fácilmente procesos y procedimientos específicos), proporciona documentación importante para su gerente de TI y cualquier otro personal de TI que pueda necesitar cubrirlo.
3Probar Regularmente el Proceso de Cambio
Una cosa es ser diligente en mantenerse al día con el monitoreo y mantenimiento de su HA, pero si no prueba regularmente el proceso de cambio, simplemente está tirando los dados si necesita hacer una recuperación después de una falla de hardware o desastre del sitio.
Más allá de asegurarse de que todos los datos necesarios se repliquen a la copia de seguridad, una prueba de cambio incluye verificar que todos los objetos necesarios para ejecutar procesos comerciales existan en el entorno de respaldo y que cada uno funcione correctamente. Tenga en cuenta que las pruebas del proceso de cambio invariablemente revelan una serie de problemas que deben abordarse para que el proceso se complete con éxito. Y ese es el punto. Lo que aprende y ajusta durante estas pruebas es indispensable para garantizar que su HA esté realmente listo para el cambio.
Mantenga un "Manual" de HA
Un manual de HA documenta su proceso de cambio y lo guía paso a paso a través de un cambio planificado o una recuperación para que no se pierda nada que pueda retrasar el proceso. Su proveedor de HA debería poder ayudarlo a crearlo cuando se instala el software. El manual debe actualizarse según sea necesario después de cada prueba de cambio y resultará invaluable durante el estrés de una falla de hardware real o un desastre del sitio.
Consejos para realizar su prueba de cambio:
- Realice sus pruebas de cambio iniciales en un modo "cambio mientras está activo", que permite a los usuarios continuar trabajando en el servidor de producción mientras el software de HA emula el proceso de cambio. Una vez que esto funcione a su satisfacción, entonces es el momento de hacer una prueba completa en la que se detiene todo el trabajo en el servidor de producción y todos los procesos comerciales se inician y prueban en la copia de seguridad.
- Antes de comenzar su prueba, verifique si hay alguna latencia entre su máquina de origen (producción) y su máquina de destino (respaldo). Es importante que resuelva cualquier problema que esté causando una latencia prolongada antes de realizar sus pruebas. De hecho, es fundamental que trabaje para minimizar la latencia de manera continua. Cuando la presión es alta después de una falla de hardware o un desastre del sitio, cualquier latencia probablemente retrasará la finalización exitosa de su recuperación y también podría resultar en la pérdida de datos.
- Una vez que se haya completado el cambio, deberá verificar que los trabajos esenciales se hayan iniciado y que las aplicaciones esenciales estén disponibles.
- Verifique que la replicación de HA entre el nuevo sistema de origen (anteriormente el destino) y el nuevo sistema de destino (anteriormente la fuente) esté funcionando correctamente.
4Realizar una Auditoría Anual con un Consultor Certificado de HA
Hacer que un consultor certificado de HA realice una auditoría anual de su entorno de HA puede resultar invaluable para ayudarlo a detectar posibles problemas antes de que creen sorpresas durante un cambio planificado o no planificado. Durante esta auditoría, su entorno de producción y todos los procesos de replicación se revisan minuciosamente en busca de brechas u otros problemas, y se proporciona un informe de recomendaciones.
Si es necesario, su consultor de HA puede ayudarlo a implementar estas recomendaciones y capacitarlo sobre las mejores prácticas de configuración. Y si aún no lo ha hecho, su consultor de HA puede aplicar cualquier PTF y corrección necesarios o incluso actualizar su software de HA a la última versión y ayudarlo a probar la nueva versión en su entorno mientras también lo guía a través de las últimas características.
Incluso las organizaciones con experiencia interna conocen el valor de tener una auditoría externa periódica de su entorno de HA, que a menudo saca a la luz posibles problemas y también proporciona recomendaciones para mejorar.
5Asegurar que el Personal de TI Tenga la Capacitación y el Tiempo Necesarios
Por supuesto, es fundamental que alguien en su equipo de TI esté debidamente capacitado en el monitoreo y la gestión de su solución de HA. Como se mencionó al comienzo de esta guía, simplemente comprar e instalar software de HA no proporciona una solución completa.
Necesita a alguien en el personal que esté debidamente capacitado y que de manera confiable tenga el ancho de banda para realizar mantenimiento regular y pruebas de cambio. Además, de la misma manera que necesita un sistema de respaldo sincronizado en caso de que algo le suceda a su sistema de producción, también necesita una persona de respaldo debidamente capacitada que pueda cuidar de su HA cuando su gerente principal de HA no está disponible o de otra manera no está disponible.
¡Muchos factores de tiempo y personal entran en conflicto con el monitoreo regular de HA y la preparación para el cambio!
- Las empresas enfrentan una presión creciente para recortar los presupuestos de TI, lo que significa que el personal existente se extiende y la gestión de HA sufre.
- Un número creciente de profesionales de IBM i se están jubilando y se llevan su experiencia en HA con ellos.
- Los departamentos de TI más pequeños a menudo tienen solo una persona que sabe cómo administrar HA, lo que crea un problema cuando esa persona no está disponible o repentinamente abandona la empresa.
- Incluso si su departamento de TI tiene suficiente personal para administrar HA, no es raro que las urgencias a corto plazo hagan que la gestión de HA sea descuidada.
Tendencias Preocupantes: Las Expectativas de HA No Cumplen con la Realidad
En encuestas recientes realizadas con profesionales de TI, descubrimos que a pesar de invertir en HA, muchas empresas no están aprovechando completamente sus beneficios. La razón parece apuntar a que TI está sobrecargado. Como resultado, HA no se monitorea, optimiza y prueba regularmente.
Las tiendas de IBM Power no cumplen con sus requisitos de RPO y RTO
- RPO: 33% espera cero pérdida de datos después de una falla/desastre, pero pocos, si alguno, lo logran.
- RTO: 29% espera recuperarse dentro de los 30 minutos o menos después de una falla/desastre, pero solo el 20% lo logra.
Las tiendas de TI no administran adecuadamente su HA
44% dice que no están al día con las actualizaciones de HA, auditorías o pruebas de cambio de rol (o no saben si lo están).
- 30% dice que realizan una prueba de HA solo una vez al año.
- 18% dice que nunca han hecho una prueba de cambio.
El personal de TI está extendido en las tiendas de IBM Power
- 25% necesita más personal interno para la gestión de HA.
- 40% está buscando externalizar la gestión de HA.
- 10% necesita reasignar personal de HA a otros proyectos críticos.
- 10% está perdiendo personal de HA por jubilación.
Servicios Gestionados de HA/DR: La Alternativa Rentable para Garantizar la Preparación para el Cambio
Un número creciente de empresas con software de HA están optando por contratar un contrato de servicios gestionados con Sinaptrix en un esfuerzo por contrarrestar las vicisitudes de personal y prioridades de TI en conflicto, y para asegurar la preparación continua para el cambio.
Con Servicios Gestionados de HA/DR:
- Tiene expertos en HA dedicados que gestionan regularmente su entorno para que no tenga que preocuparse por mantener habilidades de HA internamente.
- Usted y su equipo quedan libres para centrarse en otras prioridades de TI más estratégicas.
- Su entorno de HA se audita regularmente para encontrar y resolver errores de manera proactiva y para garantizar que tenga una configuración óptima que esté debidamente ajustada para maximizar sus recursos de sistema y red.
- Su entorno de HA se mantiene actualizado con la última versión y paquetes de servicio para que nunca esté atrasado o sin soporte.
- Recibe informes regulares y oportunos sobre el estado de su entorno y cualquier acción correctiva tomada.
- Es contactado inmediatamente si se encuentran problemas críticos.
- Se beneficia de expertos líderes en HA/DR y nuestros productos, con cientos de años de experiencia colectiva.
- Puede realizar mantenimiento en su servidor de producción con poco o ningún tiempo de inactividad porque el sistema siempre está listo para el cambio.
- Puede elegir entre varios niveles de servicios gestionados disponibles según la necesidad y el presupuesto.
Lo mejor de todo:
Tiene confianza en que su HA está listo para el cambio en caso de que ocurra una falla de hardware o un desastre del sitio.
¿Listo para optimizar su solución de HA?
Contáctenos hoy para una evaluación gratuita de su entorno actual.
Descargue la guía completa
Obtenga acceso a la versión completa de esta guía en formato PDF, incluyendo ejemplos detallados y recursos adicionales.