Skip to content

Latest commit

 

History

History

04_analytics_engineering

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

가이드

  • dbt.md : 프로젝트 구축에 대한 가이드
  • dbt 개요 : dbt에 대한 설명

사전 준비

  • 구글 빅쿼리 또는 PostgreSQL과 같은 데이터 웨어하우스를 운영하고 있어야 합니다.
  • 데이터
    • Yellow taxi data - 2019년과 2020년
    • Green taxi data - 2019년과 2020년
    • FHV(For Hire Vehicle) 데이터 - 2019년

워크플로우

  • image

dbt 프로젝트

  • image
  • 이 프로젝트는 dbt starter project를 기반으로 합니다.
    • dbt init
    • dbt run
    • dbt test
  • 파일
    • dbt_project.yml: dbt 프로젝트를 구성하는 파일
    • models, seeds, macros 폴더 아래의 *.yml 파일: 문서화 파일
    • seeds 폴더의 csv 파일: 소스 데이터
    • models 폴더 내부의 파일: sql 파일에는 staging, core, datamarts 모델을 실행하기 위한 스크립트가 포함되어 있습니다. 모델의 구조 staging -> core -> datamarts

프로젝트 실행

  • 필요한 도구들을 설치하고 해당 레포지토리를 복제합니다.
  • $ cd [..]/taxi_rides_ny : 커맨드 라인에서 프로젝트 디렉토리로 이동합니다.
  • $ dbt seed : CSV 파일들을 데이터베이스에 로드합니다. 이 작업은 CSV 파일들을 타겟 스키마의 테이블로 구성합니다.
  • $ dbt run : 모델을 실행합니다.
  • $ dbt test : 데이터를 테스트합니다. 3개의 단계를 한번에 실행하려면 $ dbt build를 사용할 수 있습니다.
  • $ dbt docs generate : 프로젝트 문서를 생성합니다.
  • $ dbt docs serve : 프로젝트 문서를 확인합니다. 이 단계는 문서 페이지를 웹서버에서 열지만 http://localhost:8080에서도 확인할 수 있습니다.

Lookerstudio

  • image