Giới thiệu

Giới thiệu

Chào mừng bạn đến với workshop về Analytics trên AWS. workshop này được thiết kế nhằm giúp bạn làm quen với các dịch vụ phân tích dữ liệu khác nhau trong danh mục AWS Analytics.

workshop sẽ bao gồm một loạt các module, bao gồm các khía cạnh khác nhau của việc xây dựng một nền tảng phân tích dữ liệu trên AWS. Bạn sẽ được học cách nhập dữ liệu, lưu trữ, biến đổi và tiêu thụ dữ liệu bằng một số dịch vụ phân tích như AWS Glue, Amazon Athena, Amazon Kinesis, Amazon EMR, Amazon QuickSight cùng với AWS Lambda và Amazon Redshift.

Một biểu đồ chi tiết hơn về thiết kế được trình bày trong kiến trúc dưới đây -

Data Analytics on AWS

Các kết quả học tập từ buổi workshop này:

  1. Thiết kế kiến trúc data lake serverless.
  2. Xây dựng đường ống xử lý dữ liệu và Data Lake bằng cách sử dụng Amazon S3 để lưu trữ dữ liệu.
  3. Sử dụng Amazon Kinesis cho dữ liệu truyền phát thời gian thực.
  4. Sử dụng Amazon Kinesis Data Analytics cho phân tích dữ liệu thời gian thực.
  5. Sử dụng AWS Glue để tự động lập chỉ mục các bộ dữ liệu.
  6. Biến đổi dữ liệu.
  7. Chạy các script ETL tương tác trong một cuốn sổ Jupyter trên AWS Glue Studio sử dụng AWS Glue (interactive sessions).
  8. Sử dụng Glue Studio để chạy và giám sát các ETL jobs trong AWS Glue.
  9. Sử dụng Glue DataBrew để chuẩn bị dữ liệu.
  10. Sử dụng EMR để chạy một job biến đổi Spark.
  11. Tải dữ liệu lên Amazon Redshift từ Glue.
  12. Giới thiệu về các quy practices thiết kế tốt cho Amazon Redshift.
  13. Truy vấn dữ liệu bằng Amazon Athena và trực quan hóa dữ liệu bằng Amazon QuickSight.

Tham khảo workshop bản tiếng Anh: Analytics on AWS