Giới thiệu về Amazon Rekognition

Amazon Rekognition là gì?

Amazon Rekognition là một dịch vụ Computer Vision được quản lý hoàn toàn bởi AWS. Dịch vụ này sử dụng Deep Learning Models được huấn luyện sẵn để phân tích hình ảnh và video, giúp bạn dễ dàng tích hợp các tính năng nhận diện vào ứng dụng mà không cần phải tự phát triển mô hình machine learning.

Với Rekognition, bạn có thể:

Nhận diện đối tượng, cảnh vật, hoạt động.
Phát hiện khuôn mặt, so sánh và xác minh danh tính.
Phát hiện nội dung nhạy cảm hoặc không phù hợp.
Trích xuất văn bản từ hình ảnh (OCR).
Phân tích video gần như real-time.

Các tính năng chính

1. Object and Scene Detection

Tự động phát hiện và gắn nhãn (label) cho đối tượng, cảnh vật, hoạt động trong ảnh/video.
Ví dụ: “person”, “car”, “tree”, “outdoor”.

2. Facial Analysis & Recognition

Phát hiện khuôn mặt trong ảnh/video.
Phân tích thuộc tính (giới tính, cảm xúc, độ tuổi ước lượng).
So sánh khuôn mặt để xác minh danh tính (1:1 matching).
Tìm kiếm khuôn mặt trong một bộ sưu tập (1:N search).

3. Text Detection (OCR)

Nhận diện văn bản trong ảnh (biển số xe, biển hiệu, tài liệu).

4. Content Moderation

Phát hiện nội dung nhạy cảm (bạo lực, khỏa thân, thuốc phiện).
Giúp ứng dụng/social media lọc nội dung trước khi hiển thị.

5. Celebrity Recognition

Nhận diện người nổi tiếng trong ảnh/video.

6. Video Analysis

Phân tích video trong thời gian thực hoặc batch.
Phát hiện đối tượng chuyển động, tracking người/vật trong video.

Cách sử dụng Amazon Rekognition

Tải ảnh hoặc video lên S3.
Gọi API Rekognition (DetectLabels, DetectFaces, RecognizeCelebrities, DetectText, v.v.).
Nhận kết quả JSON với thông tin đối tượng, tọa độ bounding box, confidence score.

Ví dụ:

Input: ảnh chứa một chiếc ô tô và một người.
Output: { "Labels": [ { "Name": "Car", "Confidence": 98.5 }, { "Name": "Person", "Confidence": 99.2 } ] }.

Tích hợp với các dịch vụ AWS khác

Amazon S3: lưu trữ ảnh/video để phân tích.
AWS Lambda: xử lý kết quả phân tích theo sự kiện.
Amazon Kinesis Video Streams: phân tích video trực tiếp từ stream.
AWS Step Functions: xây dựng workflows xử lý hình ảnh/video.

Use cases điển hình

An ninh: giám sát camera, nhận diện khuôn mặt để kiểm soát ra vào.
Social media: gắn nhãn ảnh/video, lọc nội dung nhạy cảm.
E-commerce: tìm kiếm sản phẩm qua ảnh.
Marketing: phân tích phản ứng cảm xúc của khách hàng.
Chính phủ/Y tế: nhận diện danh tính, xác minh danh sách tội phạm hoặc bệnh nhân.

Lợi ích khi dùng Rekognition

Không cần ML expertise: chỉ cần gọi API.
Tích hợp nhanh: có thể gắn vào ứng dụng hiện tại dễ dàng.
Scalable: phân tích hàng triệu ảnh/video mà không lo hạ tầng.
Trả phí theo sử dụng: không cần chi phí upfront để huấn luyện mô hình.

Giới thiệu AWS App Runner Giới thiệu Transcribe, Polly