Quản lý dữ liệu trong Amazon S3
Amazon S3 không chỉ lưu trữ dữ liệu mà còn cung cấp nhiều công cụ để quản lý, tối ưu và bảo vệ dữ liệu. Các kỹ thuật quản lý này giúp tiết kiệm chi phí, đảm bảo an toàn và đáp ứng các yêu cầu tuân thủ.
S3 Lifecycle Rules là gì
Lifecycle Rules cho phép bạn tự động di chuyển hoặc xóa dữ liệu dựa trên thời gian lưu trữ.
Các hành động phổ biến:
- Chuyển object sang class rẻ hơn (ví dụ: S3 Standard → S3 Glacier) sau X ngày.
- Xóa object hoặc version cũ sau một thời gian.
Ví dụ:
- Sau 30 ngày → chuyển sang S3 Standard-IA.
- Sau 180 ngày → chuyển sang S3 Glacier.
- Sau 365 ngày → xóa object.
S3 Versioning là gì?
- Lưu nhiều phiên bản của cùng một object.
- Giúp khôi phục dữ liệu khi bị xóa hoặc ghi đè nhầm.
- Khi bật versioning:
- Mỗi object có một Version ID.
- Xóa object chỉ tạo một delete marker, có thể khôi phục lại.
Lưu ý: Versioning tăng chi phí lưu trữ vì lưu tất cả phiên bản.
S3 Replication là gì?
Replication cho phép sao chép dữ liệu tự động từ bucket này sang bucket khác.
Hai loại replication:
- Cross-Region Replication (CRR) - Sao chép sang bucket ở region khác.
- Same-Region Replication (SRR) - Sao chép trong cùng region.
Ứng dụng:
- Tuân thủ quy định lưu trữ đa khu vực.
- Cải thiện độ trễ truy cập.
- Dự phòng khi xảy ra sự cố.
⚠️
Khi dùng S3 Replication thì cần enable “Versioning” của Source/Destination Bucket
S3 Object Lock là gì?
- Ngăn xóa hoặc sửa object trong một khoảng thời gian.
- Hỗ trợ WORM (Write Once, Read Many).
- Hai chế độ:
- Governance mode - Người dùng đặc biệt có thể Override.
- Compliance mode - Không ai (bao gồm cả Root user) có thể override trước khi hết hạn.
Ứng dụng: Lưu trữ dữ liệu cần tuân thủ quy định pháp luật (ví dụ: tài liệu tài chính).
Tìm hiểu S3 Intelligent-Tiering
- Tự động di chuyển object giữa các tier lưu trữ dựa trên mức độ truy cập.
- Giảm chi phí mà không cần cấu hình thủ công Lifecycle.
- Các tier:
- Frequent Access
- Infrequent Access
- Archive Access
- Deep Archive Access
S3 Batch Operations là gì?
- Thực hiện cùng một hành động trên hàng triệu object.
- Hỗ trợ:
- Copy dữ liệu sang Bucket, Region khác
- Thay đổi ACL/metadata
- Chạy AWS Lambda trên nhiều object (VD: resize ảnh, xử lý dữ liệu…)