Catalog Data

Catalog Data

Next, chúng ta sẽ đăng ký các bộ dữ liệu trong AWS Glue Data Catalog. Chúng ta sẽ tự động hóa việc thu thập thông tin về siêu dữ liệu bằng cách sử dụng Glue Crawlers.

Sau khi các thực thể trong catalog được tạo, chúng ta sẽ có thể bắt đầu truy vấn định dạng dữ liệu nguyên thủy từ Amazon Athena.

  1. Tạo role IAM

  2. Tạo AWS Glue Crawlers

  3. Xác minh các bảng vừa tạo trong catalog