Kiểm tra dữ liệu

Kiểm tra dữ liệu

  1. Truy cập AWS Management Console

    • Tìm S3
    • Chọn S3

    Verify Ingested Data

  2. Trong giao diện S3

    • Chọn Buckets
    • Chọn asg-datalake-demo-bucket bucket

    Verify Ingested Data

  3. Chúng ta sẽ tạo một thư mục dành cho Athena

    • Chọn Create folder

    Verify Ingested Data

  4. Trong giao diện Create folder

    • Folder name, nhập Athena
    • Chọn Create folder

    Verify Ingested Data

  5. Tạo folder thành công

    Verify Ingested Data

  6. Truy cập AWS Management Console

    • Tìm Athena
    • Chọn Athena

    Verify Ingested Data

  7. Trong giao diện Athena

    • Chọn View settings để cài đặt đường dẫn lưu trữ kết quả truy vấn

    Verify Ingested Data

  8. Trong giao diện Amazon Athena

    • Chọn Settings
    • Chọn Manage

    Verify Ingested Data

  9. Chọn đường dẫn đến thư mục Athena vừa tạo, sau đó chọn Choose

    Verify Ingested Data

  10. Trở về giao diện Manage settings kiểm tra lại và chọn Save

    Verify Ingested Data

  11. Chúng ta sử dụng Amazon Athena để truy vấn dữ liệu

    • Data Source, chọn AwsDataCatalog
    • Database, chọn summitdb
    • Chọn raw2022 table
    • Chọn Preview Table

    Verify Ingested Data

  12. Thực hiện truy vấn 10 dòng dữ liệu từ table raw2022 trong database summitdb

    • Truy vấn thành công
    • Kiểm tra dữ liệu

    Verify Ingested Data

  13. Tiếp tục kiểm tra dữ liệu. Trong khung query editor, copy và dán đoạn query dưới đây

    SELECT activity_type,
           count(activity_type)
    FROM raw2022
    GROUP BY activity_type
    ORDER BY activity_type
    
    • Chọn Run Query
    • Kiểm tra kết quả

    Verify Ingested Data