Tại sao cần Data Warehouse?
Dữ liệu vận hành của bạn nằm rải rác: CRM, ERP, IoT sensors, web analytics, Excel của kế toán. Không ai nhìn thấy bức tranh tổng thể vì không có nơi kết hợp tất cả.
Kiến trúc Modern Data Stack
[Sources] → [EL: Fivetran/Airbyte] → [DW: BigQuery] → [T: dbt] → [BI: Metabase/Redash]
Xây dựng mô hình với dbt
dbt (data build tool) là tiêu chuẩn ngành cho tầng transformation:
-- models/marts/consumption_daily.sql
WITH readings AS (
SELECT
meter_id,
DATE(recorded_at) AS date,
MAX(value_m3) - MIN(value_m3) AS daily_consumption
FROM {{ ref('stg_meter_readings') }}
GROUP BY 1, 2
)
SELECT
r.*,
z.zone_name,
z.district
FROM readings r
JOIN {{ ref('dim_meters') }} m USING (meter_id)
JOIN {{ ref('dim_zones') }} z USING (zone_id)
Semantic Layer: Democratize Data
Sử dụng Metabase hoặc Looker để tạo tầng semantic layer – không cần viết SQL, mọi người đều có thể tự tạo báo cáo.
Kết quả thực tế
Sau 3 tháng triển khai cho một công ty cấp nước 300,000 khách hàng: thời gian tạo báo cáo giảm từ 3 ngày xuống 15 phút, 80% bộ phận có thể tự truy vấn dữ liệu.