AWS Database Migration Service (DMS) là gì?
AWS Database Migration Service (DMS) là dịch vụ được quản lý toàn phần bởi AWS, giúp migrate dữ liệu và cơ sở dữ liệu từ on-premises, AWS service khác, hoặc nền tảng cloud bên thứ ba sang AWS. DMS hỗ trợ migrate dữ liệu với ít hoặc không có downtime, giúp ứng dụng vẫn hoạt động trong suốt quá trình migration.
Đặc điểm nổi bật
- Hỗ trợ đa dạng nguồn và đích (source/target):
- Quan hệ (Relational): Oracle, SQL Server, MySQL, PostgreSQL, MariaDB.
- NoSQL: MongoDB, Amazon DynamoDB.
- Data warehouse: Amazon Redshift, SAP ASE, v.v.
- Downtime tối thiểu: Dữ liệu có thể đồng bộ liên tục từ source sang target trong quá trình migration.
- Tự động quản lý hạ tầng: AWS sẽ quản lý server replication, vá lỗi và monitor tiến trình.
- Hỗ trợ cả Homogeneous và Heterogeneous Migration:
- Homogeneous (cùng loại DB, ví dụ MySQL → Amazon RDS MySQL).
- Heterogeneous (khác loại DB, ví dụ Oracle → Amazon Aurora).
Các thành phần chính trong DMS
- Replication Instance
- Máy chủ do DMS quản lý, thực hiện việc đọc dữ liệu từ source, chuyển đổi và ghi vào target.
- Source Endpoint
- Nơi dữ liệu được lấy (ví dụ: Oracle On-premises).
- Target Endpoint
- Nơi dữ liệu được ghi đến (ví dụ: Amazon Aurora PostgreSQL).
- Migration Task
- Định nghĩa cách thức migrate dữ liệu: full load, ongoing replication, hoặc cả hai.
Cách sử dụng DMS
-
Chuẩn bị
- Xác định database source và target.
- Nếu chuyển đổi khác loại database (heterogeneous), cần dùng AWS Schema Conversion Tool (SCT) để chuyển đổi schema.
-
Cấu hình DMS
- Tạo replication instance.
- Tạo endpoint cho source và target.
-
Tạo và chạy Migration Task
- Lựa chọn chế độ:
- Full Load: Tải toàn bộ dữ liệu một lần.
- Ongoing Replication: Đồng bộ dữ liệu thay đổi liên tục từ source.
- Kết hợp: Full load + ongoing replication để giảm downtime.
- Giám sát
- DMS cung cấp metrics trong Amazon CloudWatch để theo dõi tiến trình migration.
Các trường hợp sử dụng (Use Cases)
- Migrate cơ sở dữ liệu lên AWS RDS hoặc Aurora từ môi trường on-premises.
- Chuyển đổi cơ sở dữ liệu thương mại sang nguồn mở (Oracle → PostgreSQL).
- Migrate data warehouse lên Amazon Redshift.
- Đồng bộ dữ liệu theo thời gian thực giữa các hệ thống cơ sở dữ liệu.
Lợi ích
- Giảm thiểu downtime trong quá trình migration.
- Tiết kiệm chi phí, chỉ trả cho replication instance đang sử dụng.
- Hỗ trợ nhiều loại cơ sở dữ liệu, cả SQL và No-SQL.
- Tích hợp chặt chẽ với các dịch vụ AWS khác (RDS, Aurora, Redshift, DynamoDB).
Hạn chế
- Cần cấu hình replication instance phù hợp để tránh nghẽn hiệu năng.
- Với heterogeneous migration, cần thêm bước chuyển đổi schema bằng AWS SCT.
- Một số tính năng nâng cao của database source (ví dụ stored procedure phức tạp) có thể không hỗ trợ trực tiếp.