Replique los datos dentro y entre las regiones de AWS mediante la replicación de Amazon S3
Información general
La replicación de Amazon S3 es una característica rentable, completamente administrada y elástica que replica objetos entre buckets de Amazon S3. Esta característica le ofrece la posibilidad de replicar datos desde un bucket de origen a varios buckets de destino en la misma región de AWS o en regiones diferentes. Ya sea que desee mantener una copia secundaria de sus datos para la protección de datos o tener datos en múltiples localidades para brindarles a los usuarios la latencia más baja, la replicación de S3 brinda los controles que necesita para satisfacer sus necesidades comerciales. Esta guía de introducción a Amazon S3 le muestra cómo seguir las prácticas recomendadas de replicación de S3 con la replicación en la misma región (SRR) de S3, la replicación entre regiones de S3 (CRR), el control del tiempo de replicación de S3 (S3 RTC) y la replicación por lotes de S3.
Con la replicación en la misma región (SRR) de S3, puede replicar de manera automática los datos entre los buckets de la misma región de AWS para ayudar a agrupar los registros en un único bucket, replicarlos entre las cuentas de desarrollador y de prueba y cumplir con las leyes de soberanía de los datos. Con la replicación entre diferentes regiones (CRR) de S3, puede replicar objetos (así como sus metadatos y etiquetas de objeto respectivos) en otras regiones de AWS para cumplir sus requisitos de latencia reducida, conformidad, seguridad, recuperación de desastres y eficiencia regional. También puede habilitar el control del tiempo de replicación de S3 (S3 RTC) para ayudarlo a cumplir con los requisitos comerciales o de conformidad para la replicación de datos. S3 RTC replica la mayoría de los objetos que usted “carga” en Amazon S3 en cuestión de segundos, y el 99,99 % de esos objetos en un plazo de 15 minutos. Si desea replicar objetos existentes, puede utilizar la replicación por lotes de S3 para reponer un bucket creado recientemente con objetos existentes, reintentar la replicación de objetos que no se pudieron replicar anteriormente, migrar datos entre cuentas o agregar nuevos buckets a su lago de datos. Para obtener más información sobre la replicación de S3, visite la sección Replicación de objetos de la Guía del usuario de Amazon S3. Al final de este tutorial, podrá replicar datos dentro de las regiones de AWS y entre ellas mediante la replicación de Amazon S3.
Qué logrará
En este tutorial, hará lo siguiente:
- Crear un bucket de S3
- Crear una regla de replicación de S3 en su bucket de S3
- Elegir el bucket de S3 de destino
- Elegir o crear roles de IAM para la replicación
- Especificar el tipo de cifrado (opcional)
- Elegir la clase de almacenamiento de S3 de destino
- Habilitar opciones de replicación adicionales (opcional)
Requisitos previos
Para realizar este tutorial, necesita una cuenta de AWS. Acceda a esta página de soporte para obtener más información acerca de cómo crear y activar una nueva cuenta de AWS.
Experiencia en AWS
Principiante
Tiempo de realización
20 minutos
Costo de realización
Menos de 1 USD (página de precios de Amazon S3)
Requisitos
Servicios utilizados
Última actualización
17 de octubre de 2022
Implementación
Paso 1: Crear un bucket de Amazon S3
1.1: Iniciar sesión en la consola de Amazon S3
- Si aún no lo ha hecho, cree una cuenta de AWS.
- Inicie sesión en la Consola de administración de AWS con la información de su cuenta.
- En la barra de búsqueda de servicios de la consola de AWS, ingrese S3. Debajo de la sección de resultados de la búsqueda de servicios, seleccione S3.
1.2: Crear un bucket de S3
- Elija Buckets en el menú de Amazon S3 que aparece en el panel de navegación de la izquierda y, a continuación, pulse el botón Crear bucket.
1.3
- Ingrese un nombre descriptivo globalmente único para el bucket. Seleccione en qué región de AWS desea crear el bucket. Para este ejemplo, se selecciona la región eu-central-1 de la UE (Fráncfort). La replicación de S3 requiere que el control de versiones del bucket esté habilitado para los buckets de S3 de origen y de destino. Para obtener más información, consulte Using versioning in S3 buckets.
- Puede dejar las opciones restantes como predeterminadas. Desplácese hasta la parte inferior de la página y elija la opción Crear bucket.
1.4
- Repita los pasos anteriores para crear otro bucket de S3 que sirva como bucket de destino para la replicación de objetos. Asegúrese de habilitar también el control de versiones del bucket para el bucket de S3 de destino.
Paso 2: Crear una replicación de S3 en su bucket de S3
2.1: Seleccionar el bucket de S3 de origen
- En la lista de buckets de S3, elija el bucket de S3 que desee configurar como origen de replicación.
2.2
Una vez que seleccione el bucket de S3 de origen, la consola le llevará a la página de inicio del bucket de S3, como se muestra en la siguiente captura de pantalla. Aquí puede revisar los objetos, las propiedades, los permisos, las métricas, la administración y los puntos de acceso del bucket de S3 seleccionado.
2.3: Crear una regla de replicación de S3 para el bucket de S3 seleccionado
- Elija la pestaña Administración del bucket de origen de replicación. En Administración, verá Reglas de replicación. Seleccione Crear regla de replicación.
Paso 3: Configurar una regla de replicación
3.1: Habilitar la regla de replicación
- Proporcione un nombre de regla de replicación y habilite la regla de replicación al seleccionar Habilitada en la sección Estado. Si la regla de replicación está desactivada, no se ejecutará.
Prioridad indica qué regla tiene prioridad cuando dos o más reglas de replicación entran en conflicto. Tendrá la opción de editar la prioridad de cada regla de replicación en la página de configuración de replicación. Amazon S3 intenta replicar los objetos de acuerdo con todas las reglas de replicación. Sin embargo, si hay dos o más reglas con el mismo bucket de destino, los objetos se replican según la regla con la prioridad más alta. Una regla con prioridad 1 se ejecuta antes que una regla con prioridad 2. Cuanto menor sea el número, mayor será la prioridad. Por ejemplo, supongamos que tiene una regla de replicación para replicar todos los objetos con la etiqueta foo1 y otra regla de replicación para replicar todos los objetos con la etiqueta foo2. Si tiene un objeto etiquetado con foo1 y foo2, solo se replicará con la regla de replicación de mayor prioridad. Cuando solo tiene una regla de replicación que va a un bucket de destino, no se tiene en cuenta la prioridad.
3.2: Elegir qué replicar
- Para reducir el alcance de la replicación, defina un Tipo de filtro (Prefijo o Etiquetas) o seleccione replicar todo el bucket. Por ejemplo, si solo desea replicar los objetos que están en el Prefijo “Finanzas”, especifique ese alcance. Para obtener más información sobre el filtrado de objetos para la replicación, visite la documentación sobre la especificación de un filtro en la Guía del usuario de S3.
3.3: Elegir el bucket de S3 de destino
- Para elegir el bucket de destino, seleccione el botón Examinar S3. Puede replicar en un bucket de destino en la misma región de AWS o en una diferente, y en la misma cuenta de AWS o en una diferente. Tenga en cuenta que necesitará dos buckets de S3 diferentes para configurar la replicación y que ambos buckets (de origen y de destino) deben tener habilitado el control de versiones de S3. La consola de S3 no le proporciona una forma de crear un nuevo bucket de S3 en el proceso de configuración de la replicación. En este ejemplo, elegimos el bucket de destino como “aws-s3-replication-tutorial-destination-bucket”.
3.4: Consideraciones sobre IAM
- Al crear nuevas reglas de replicación desde el mismo bucket de origen, asegúrese de que el rol de IAM asociado a esta configuración tenga permisos suficientes para escribir objetos nuevos en el nuevo bucket de destino. Puede elegir entre crear un nuevo rol de IAM o seleccionar un rol de IAM existente con el conjunto de permisos adecuado. Para obtener más información, consulte la documentación sobre la configuración de permisos para la replicación de S3.
3.5: Opciones de cifrado (omita este paso si sus objetos no están cifrados)
- Si sus objetos están cifrados con claves de cifrado administradas por Amazon S3 (SSE-S3) o AWS Key Management Service (AWS KMS), tendrá que especificar las opciones de cifrado al configurar la replicación. La replicación de S3 admite SSE-S3 (cifrado predeterminado) y el cifrado del lado del servidor de AWS KMS. Si elige el cifrado de AWS KMS, tendrá que proporcionar las claves de AWS KMS para descifrarlas en el origen y volver a cifrarlas en el destino. Para ahorrar en los costos de AWS KMS, también tiene la opción de habilitar las claves de bucket de Amazon S3.
3.6: Seleccionar la clase de almacenamiento S3 para su destino
- A continuación, tendrá la opción de elegir una clase de almacenamiento de S3 diferente para los objetos replicados en el bucket de destino. Considere la posibilidad de elegir clases de almacenamiento de menor costo según sea apropiado para sus cargas de trabajo. Por ejemplo, puede elegir la clase de almacenamiento S3 Glacier Instant Retrieval si se va a acceder a los objetos replicados con poca frecuencia, pero es necesario recuperarlos en milisegundos, S3 Glacier Deep Archive para archivar datos a los que rara vez se necesita acceder y S3 Intelligent-Tiering para optimizar los costos de almacenamiento de los datos con patrones de acceso impredecibles o cambiantes. Para obtener más información, consulte la documentación sobre el uso de las clases de almacenamiento de Amazon S3.
3.7: Opciones de replicación adicionales
- Elija Opciones de replicación adicionales, como habilitar el Control del tiempo de replicación de S3 (S3 RTC), Métricas y notificaciones de replicación, Replicación de eliminación de marcadores y Sincronización de modificaciones de réplicas. S3 RTC lo ayuda a cumplir con los requisitos empresariales y de conformidad, ya que proporciona un SLA de 15 minutos para replicar el 99,99 % de sus objetos. El RTC se puede habilitar junto con la replicación entre regiones de S3 (S3 CRR) y la replicación en la misma región de S3 (S3 SRR) y tiene habilitadas las métricas y notificaciones de replicación de forma predeterminada. Para las reglas que no son de RTC, tiene la opción de seleccionar Métricas y notificaciones de replicación, que proporcionan métricas detalladas para rastrear el progreso minuto a minuto de los bytes pendientes, las operaciones pendientes y la latencia de replicación de la regla de replicación. Al seleccionar Eliminar replicación de marcadores, las eliminaciones del bucket de origen se replicarán en el bucket de destino. Esta opción debería estar habilitada si quiere mantener sincronizados los buckets de origen y destino, pero no si el objetivo es protegerlo contra eliminaciones accidentales o malintencionadas. Para establecer una replicación bidireccional entre dos buckets de S3, cree reglas de replicación bidireccionales (de A a B y de B a A) y habilite Sincronización de modificaciones de réplicas para ambas reglas de replicación en los buckets de S3 de origen y de destino. Esto lo ayudará a mantener sincronizados los metadatos de los objetos, como las etiquetas, las ACL y la configuración de bloqueo de objetos, entre las réplicas y los objetos de origen.
- Revise la configuración de replicación y seleccione Guardar.
Paso 4: Crear otra regla de replicación de S3 en el mismo bucket de S3 de origen y en otro bucket de S3 de destino
- Repita los pasos anteriores para crear otra regla de replicación de S3 desde el mismo bucket de S3 de origen a otro bucket de S3 de destino. Proporcione un nombre de regla de replicación y habilite la regla de replicación al seleccionar Habilitada en la sección Estado. Seleccione el alcance de la regla de replicación para elegir el alcance de la regla de replicación.
- Para elegir el bucket de destino, seleccione el botón Examinar S3. En este ejemplo, elegimos el bucket de destino “ack-test-bucket-us-east-1”.
- Seleccione la clase de almacenamiento de S3 de destino. En este ejemplo, elegimos replicar en la clase de almacenamiento S3 Standard del bucket de destino.
- Elija Opciones de replicación adicionales para la regla de replicación. En este ejemplo, elegimos habilitar el Control de tiempo de replicación (RTC) de S3.
Paso 5: Revisar la configuración de replicación
Una vez guardada la regla de replicación, volverá a la página de inicio de Replicación de S3, como se muestra en la siguiente captura de pantalla. Aquí puede revisar la configuración de replicación con todas las diferentes reglas de replicación, las prioridades de las reglas y las opciones adicionales, como el cifrado y el RTC.
A continuación, cargue un objeto nuevo en el bucket de origen de replicación para probar la configuración de replicación recién agregada. Confirme que ve ese objeto replicado en el nuevo bucket de destino. Las métricas de replicación pueden tardar unos minutos en aparecer en la consola de S3.
Paso 6: Supervisar el progreso de la replicación
6.1
Ahora que ha configurado la replicación para este bucket, puede realizar un seguimiento de las métricas y notificaciones por destino. Abra la pestaña Métricas del bucket de origen.
6.2
Navegue hacia abajo para ver las métricas de replicación y seleccione una o más reglas de replicación para la supervisión. Seleccione Mostrar gráficos para ver las operaciones pendientes de replicación, los bytes pendientes de replicación y la latencia de replicación de todas las reglas de replicación.
Además, puede utilizar el enlace Ver en CloudWatch para ver las métricas de replicación en Amazon CloudWatch. Aquí puede obtener una vista completa de las métricas de replicación para cada regla de replicación, bucket de origen y bucket de destino en un solo lugar. Además, puede recopilar información útil y configurar alarmas para supervisar las métricas. Para obtener más información, consulte Using Amazon CloudWatch alarms.
Paso 7: Supervisar el estado de replicación de objetos individuales
Puede usar Amazon S3 Inventory para hacer una auditoría e informar sobre el estado de replicación de sus objetos para sus necesidades de negocio, de cumplimiento y reglamentarias. El estado de replicación puede ayudarle a determinar el estado actual de un objeto que se está replicando. El estado de replicación de un objeto de origen devolverá los valores Pendiente, Completado o Fallido. El estado de replicación de una réplica devolverá Réplica. Para obtener más información sobre el estado de la replicación, consulte Obtención de información del estado de replicación. Para obtener más información sobre la configuración de Amazon S3 Inventory, consulte la documentación sobre la administración y el análisis de los datos a escala con Amazon S3 Inventory y Amazon Athena.
Paso 8: Eliminar los recursos
8.1: Eliminar el objeto de prueba
- Si ha cerrado sesión en la consola de administración de AWS, vuelva a iniciarla. Navegue a la consola de S3 y seleccione la opción de menú Buckets. Primero, tiene que eliminar los objetos de prueba del bucket de prueba. Seleccione el nombre del bucket con el que ha estado trabajando en este tutorial.
- Marque la casilla de verificación a la izquierda del nombre del objeto de prueba y luego elija el botón Eliminar.
- En la página Eliminar objetos, verifique que ha seleccionado el objeto apropiado para eliminarlo e ingrese eliminar en la casilla de confirmación Eliminar objetos permanentemente. Luego, elija el botón Eliminar objeto para continuar.
- A continuación, verá un anuncio que le indicará si la eliminación se ha realizado correctamente.
8.2: Eliminar el bucket de prueba
- Finalmente, debe eliminar los buckets de prueba que creó. Regrese a la lista de buckets de su cuenta. Seleccione el botón de selección que está a la izquierda del bucket de origen que ha creado para este tutorial y, posteriormente, pulse el botón Eliminar.
- Revise el mensaje de advertencia. Si desea continuar con la eliminación de este bucket, ingrese el nombre de este en la casilla de confirmación Eliminar bucket y elija la opción Eliminar bucket.
- Repita también los pasos anteriores para eliminar el bucket de destino creado como parte de este tutorial. Regrese a la lista de buckets de su cuenta. Seleccione el botón de selección que está a la izquierda del bucket de origen que ha creado para este tutorial y, posteriormente, pulse el botón Eliminar.
- Revise el mensaje de advertencia. Si desea continuar con la eliminación de este bucket, ingrese el nombre de este en la casilla de confirmación Eliminar bucket y elija la opción Eliminar bucket.
Conclusión
¡Felicitaciones! Ha aprendido a usar la replicación de S3 para replicar objetos desde los buckets de S3 de origen a destino en una o varias regiones de AWS a fin de cumplir con los requisitos de conformidad, minimizar la latencia y aumentar la eficiencia operativa.
La replicación de S3 es una característica de administración de almacenamiento basada en políticas, completamente administrada y de bajo costo, diseñada para requerir poca o ninguna intervención manual. Le recomendamos que habilite las métricas y notificaciones para cada regla de replicación, active Notificaciones de eventos de Amazon S3 en su bucket de origen y habilite las métricas y alertas de Amazon CloudWatch adecuadas. Una vez habilitadas, podrá realizar un seguimiento del progreso de la replicación de S3 en uno o más buckets de S3.