Skip to content

data catalog

LeeNamGyu98 edited this page Jul 25, 2020 · 43 revisions

정부 정책 및 대응 데이터 링크

사회 데이터 링크

  • 기타 폴더 :

    • 고용 : 2020.01-2020.06 고용 현황(연령별, 교육정도, 산업별)
    • 노동 : 성별-연령별 경제활동인구 데이터(2019.04-2020.04)와, 성별-직업별 취업자 데이터(2019.11-2020.04)가 있음.
    • 범죄 : 사이버 범죄, 관서별 청소년 5대 범죄 현황, 아동학대 신고접수 이미지 등의 데이터가 있음. 하지만, 대부분 2019년도의 데이터이기 때문에 코로나 관련 분석엔 부적합.
    • 언론 : 이태원 사건이후 동성애자 혐오 관련 언론보도에 대한 데이터. 빅카인즈에서 ‘게이클럽’, ‘성소수자’, ‘이태원’ 검색한 데이터.
    • 이혼율 : 2019-2020.3까지의 인구동향(출생, 사망, 혼인, 이혼) 데이터.
    • 자살율 : 2020-2020.3까지의 사망원인(고의적 자해) 데이터
  • 지역별 확진자 데이터 :

    • 경기도, 대구, 부산, 서울, 세종, 전북의 확진자 경로 현황 데이터. 각 시청, 도청의 데이터를 크롤링함.
    • 확진자수 데이터 : 시군구별의 세분화된 확진자 정보는 각 구청 홈페이지에 들어가 직접 계수하여 엑셀로 만듦. 엑셀에 각 구청 URL 첨부. 해외유입 포함과 해외유입 제외된 데이터 존재.
  • 청와대 청원 문서 군집화 :

    • 청와대 청원 홈페이지에서 ‘코로나’,’코비드’,’corona’,’covid19’,’covid’,’우한폐렴’를 검색하여 크롤링함. 청원일시, 청원내용, 동의한사람 수 등의 데이터가 들어있음.
  • 취약계층 회귀 분석 :

    • 시각화 : 혜식님코드 이용한 전국 시군구별 시각화 코드와 결과 엑셀 파일.

    • 원데이터 :

      • 지역별 산업체 원데이터: 행정구역(시군구)별로 총사업체수, 총종사자수, 성별 등의 지역구별 산업체 데이터. 인구 가구 및 주택 읍면동, 시군구 : 인구 데이터. (2015,2016기준)
      • 1차 가공 코드 및 데이터:
        • 전체 산업체별 데이터 전처리 : 원데이터/지역별 산업체 원데이터 파일을 임의로 조작하기 위한 데이터 전처리 코드. ipynb형식
        • 대분류 산업별 데이터 : 임의의 전처리를 통해 행정구역-산업체대분류 데이터를 나누었음.
        • 소분류 산업별 데이터 : 임의의 전처리를 통해 행정구역-산업체 대분류안에 있는 소분류 산업별 데이터를 나누었음.
    • 최종 산업별 분석 코드 및 데이터 :

      • 확진자 인구 산업별 데이터 merge.ipynb : 시군구별 확진자수와 인구대비 산업체수, 인구대비 종사자수, 총 산업체수 등의 데이터를 취합하기 위한 코드.
      • 최종 대분류 산업별 데이터 : 취합한 데이터를 산업체 대분류로 나눈 데이터.
      • 최종 소분류 산업별 데이터 : 취합한 데이터를 산업체 소분류로 나눈 데이터.
      • 상관계수 이측정 코드 : 시군구별로 인구대비 산업체 종사자수와 확진자수의 상관관계, 인구대비 산업체수와 확진자수의 상관관계 등을 알아보기 위한 ipynb 코드와, 그 결과인 csv파일 있음.

경제 데이터 링크

  • 고용동향:

    • 데이터: 통계청 고용동향 6월

    • 전체: 고용동향(1월-6월)에서 전체 취업자 수, 고용률, 실업자 수, 실업률 수치, 일시휴직자, 확산실업률을 정리해 시각화한 자료

    • 산업별: 고용동향(1월-6월)에서 산업별 취업자 증감률을 정리해 시각화한 자료

  • 업종별 동향(매출 소비):

    • 데이터: (보도자료)2020년 14분기_가계동향조사 결과

    • 전체: 소득부문과 지출부문을 통합 및 개편한 조사 내용으로, 가계의 소득 및 지출 통계와 소득과 지출을 연계한 가계수지 지표(평균소비 성향, 흑자율 등)를 분석한 결과

    • 업종별: 업종별 가구당 월평균 소비지출 중 전년동월대비 증감률이 얼마나 늘었고, 줄었는지를 중점적으로 분석

    • 데이터: 2020년 3월 및 1분기 온라인쇼핑 동향

    • 전체: ‘PC기반 인터넷 쇼핑 거래액’과 ‘모바일기반 인터넷쇼핑 거래액’을 포괄한 다양한 상품군의 기간별 합계, 구성비, 증감률을 보여주는 자료이다.

    • 상품군별: 상품군별 온라인 쇼핑거래액의 전년동월비 증감률을 중점적으로 분석

    • 데이터: 소비자동향조사_전국

    • 전체: 사람들의 분야 및 기간별 소비동향을 나타내는 지표이며 성별, 소득, 지역, 업종 등 다양한 기준을 통해 많은 유의미한 소비동향 데이터를 제공해준다.

    • 업종별: 의료 및 보건비, 교육비 지출전망 CSI를 중점적으로 분석

  • 동학개미운동:

  • 국내 미세먼지 통계:

    • 가공 data: 미세먼지 각 시도 수치를 전체 시도의 평균으로 수치냄.
    • airKorea raw data/KOSIS raw data: 2019년 11월 이전의 자료는 KOSIS에서 사용.
  • 국내 교통량 통계:

    • 가공 data: '한국 도로공사 공공데이터 포털'에 있는 전구간 교통량 (캘린더형) 수치에 따른 값임. '전구간'은 국내 고속도로 및 민자 고속도로 중 한국 도로공사와 정보를 공유하는 도로에 한정함. 위 사이트의 dataset>전국 교통량 의 csv data와 캘린더형의 데이터가 대부분 일치 했으나, 2018/11/29-30, 2018/12/28-31, 2019/1/31, 2/26-28, 3/28-31, 4/29-30, 5/30-31, 6/28-30, 2020/1/31, 2/27-29, 3/31, 4/27-30, 5/29-31, 6/29-30 의 총 35개의 데이터가 일치하지 않았음. (캘린더형 표에서 각 값에 마우스 올리면 정확한 수치 확인 가능) csv data의 일부 값들이 누락되어 발생한 불일치로 판단하여, 캘린더형을 기준으로 분석함.
    • 한국도로공사 raw data: 월별 '전국 교통량'자료를 다운 받은 뒤, 입출구 코드의 출구 코드 '1'에 해당하는 값만 더해야 캘린더형의 수치와 일치한 값을 구할 수 있음.
  • 국내 석유 소비량:

    • 가공 data: 대한 석유협회에서 사진 파일로 제공하는 값 중 석유, 경유, 나프타의 값만 수치로 정리함. 전년 동월 대비 비교 가능하나, 월 갱신 될 때 마다 전년 데이터 사라짐.
    • 대한 석유 협회 pdf: xlsx나 csv 파일 없음.
  • 국내 항공량 통계:

    • 가공 data: 공항별 전년 대비 통계 중 운항(편수)에 대한 데이터만 정리함. (여객(명), 화물(ton)에 대한 자료도 있음.)
    • 한국 항공 공사 raw data: 국내 15개 공항별로 월별 자료, 동월 전년 대비 자료 구할 수 있음. (2018~2020 특정 자료만 다운)
  • 수원시 재활용 처리 통계:

    • 가공 data: '수원도시공사 자원 순환센터' 월별 재활용품 반입량 분석. (반출량과 대형폐기물, 가로모래에 대한 통계도 있음.)
    • 수원시 raw data: 이미지 파일 xlsx로 변환.
  • 온실가스 처리 통계

    • 가공 data: '국가 온실가스 배출 추이' 연도별 데이터(1990~2017)년 분석. 총배출량만 분석하였음, 'Energy related CO2 emissions, 1990-2019'
  • 등교수업 현황

    • 등교수업 조정현황 데이터:

    • 날짜별 지역별 등교수업 조정현황 데이터:

      • 교육부에서 공개한 등교수업현황자료를 수집 후, xlsx형식 구축했고 이후 한 파일에 날짜별로 추합하여 날짜별 등교수업 조정현황 데이터를 구축했다.
    • 날짜별 시군구별 등교수업 조정 현황 데이터:

      • 기존의 날짜별 등교수업 조정현황 데이터를 지역구분을 시,군,구로 세분화하여 데이터 구축
  • 코로나 19 지역 확진현황

Clone this wiki locally