Phân tích với Athena

Phân tích với Athena

Vì Athena sử dụng AWS Glue Catalog để theo dõi các nguồn dữ liệu, tất cả các bảng trong Glue có thể được truy vấn thông qua Athena.

  1. Truy cập AWS Management Console

    • Tìm kiếm Athena
    • Chọn Athena

    Phân tích dữ liệu với Athena

  2. Trong giao diện Athena:

    • Tại mục Data Source, chọn AwsDataCatalog

    • Tại mục Database, chọn summitdb

    • Thực hiện câu truy vấn SQL sau:

      SELECT artist_name,
             count(artist_name) AS count
      FROM processed_data
      GROUP BY artist_name
      ORDER BY count DESC
      
    • Nhấn Run Query

    • Chờ đến khi trạng thái chuyển thành Complete

    • Xem kết quả của câu truy vấn

    Phân tích dữ liệu với Athena

  3. Khám phá giao diện của Athena và thử thực hiện thêm một số câu truy vấn khác.

    • Câu truy vấn dưới đây sẽ trả về danh sách các bài hát được nghe đi nghe lại nhiều lần bởi các thiết bị. Bạn cũng có thể sử dụng câu truy vấn này để tạo biểu đồ trên QuickSight.

      SELECT device_id,
             track_name,
             count(track_name) AS count
      FROM processed_data
      GROUP BY device_id, track_name
      ORDER BY count DESC
      

    Phân tích dữ liệu với Athena