Hiển thị dữ liệu trong Quicksight
Hiển thị dữ liệu trong Quicksight
Trong module này, chúng ta sẽ sử dụng Amazon Quicksight để xây dựng một số biểu đồ trực quan dựa trên dữ liệu đã được thu thập và lưu trữ trên S3.
Hãy thoải mái khám phá các tùy chọn trực quan hóa khác nhau có sẵn trong Quicksight!
Thiết lập QuickSight
- Trong bước này, chúng ta sẽ trực quan hóa dữ liệu đã được xử lý bằng cách sử dụng QuickSight.
- Truy cập: Bảng điều khiển QuickSight
- Chọn vào Sign up for QuickSight
- Đảm bảo chọn Enterprise và Chọn vào Continue
- Tên tài khoản QuickSight: yournameanalyticsworkshop
- Địa chỉ email thông báo: you@youremail.com
Chọn Amazon Athena - điều này cho phép QuickSight truy cập vào cơ sở dữ liệu Amazon Athena
- Chọn Amazon S3
Chọn yourname-analytics-workshop-bucket
Chọn vào Finish
- Chọn vào Finish
Chờ đợi tài khoản QuickSight của bạn được tạo
- Thêm một New Dataset
- Truy cập:
- Ở phía trên bên phải, Chọn vào New Dataset
- Chọn vào Athena
- New Athena data source
- Data source name: analyticsworkshop
- Chọn vào Validate connection
- Điều này sẽ kiểm tra xem QuickSight của bạn có thể truy cập Athena hay không
- Chọn vào Create data source
- Chọn bảng của bạn:
- Database: chứa các bộ bảng - chọn analyticsworkshopdb
- Tables: chứa dữ liệu bạn có thể trực quan hóa - chọn processed_data
- Chọn vào Select
- Hoàn thành việc data set creation:
- Chọn Directly query your data
- Chọn vào Visualize
- Sử dụng Amazon Quick Sight để Visualize Our Processed Data
Trực quan hóa 1: Heat map của người dùng và các bài hát mà họ đang nghe
- Trong bước này, chúng ta sẽ tạo một trực quan hóa để xem người dùng nào đang nghe các bài hát lặp đi lặp lại.
- Trên bảng điều khiển phía dưới bên trái ((Visual types):
- Di chuột lên các biểu tượng để xem tên của các trực quan hóa có sẵn
- Chọn vào Heat Map
- Trên bảng điều khiển phía trên bên trái (Fields list)
- Chọn vào device_id
- Chọn vào track_name
- Ngay phía trên trực quan hóa, bạn sẽ thấy Field wells: Rows: device_id | Columns: track_name
- Nếu bạn di chuột lên các vùng màu xanh đậm trên bản đồ nhiệt, bạn sẽ thấy rằng những người dùng cụ thể đó đang nghe cùng một bài hát nhiều lần.
Hình minh họa 2: Tree map về các nghệ sĩ được phát nhiều nhất
- Trong bước này, chúng ta sẽ tạo một hình minh họa hiển thị các nghệ sĩ được phát nhiều nhất.
- Ở góc trên bên trái, Chọn vào ‘+ Add’ > Add Visual. Điều này sẽ thêm một bảng điều khiển mới vào bảng bên phải.
- Ở bảng dưới bên trái (Visual types):
- Di chuột lên các biểu tượng để xem tên của các hình minh họa
- Chọn vào Tree Map
- Ở bảng trên bên trái (Fields list):
- Chọn vào artist_name
- Thử nghiệm và khám phá Bảng điều khiển Amazon QuickSight. Bạn có thể thử các bộ lọc, các loại hình minh họa khác, v.v.
- Cho đến nay, chúng ta đã thể hiện dữ liệu bằng cách sử dụng Kinesis firehose, lưu trữ dữ liệu trong S3, đăng ký các bảng trong AWS Glue data catalog, biến đổi dữ liệu bằng cách sử dụng Glue ETL/EMR và truy vấn và hiển thị dữ liệu bằng cách sử dụng Athena và Quicksight.
- Điều này cung cấp một kiến trúc end-to-end, từ nguồn đến bảng điều khiển doanh nghiệp, trong một mô hình triển khai phân tích serverless.
- Hai module Next giới thiệu Lambda và Redshift và bao gồm các cải tiến Next cho kiến trúc này, để đáp ứng các yêu cầu bổ sung khác nhau để cung cấp dữ liệu theo yêu cầu cho phân tích.