목표
해당 데이터는 "세계 인플레이션 시대의 경제지표" 도서를 참고하여 작성하였으며, 중요한 경제지표에 대한 데이터 수집 자동화 및 시각화를 목표로 한다. 자본주의 사회에서 많은 사람들은 본인들의 정의에 입각해서 미래를 예측 또는 주장한다. 상황이라는 것은 확정된 사실이며, 나의 가치관에 따라 가치판단을 해서는 안된다. 역사적으로 누적된 데이터 기반으로 사실만을 바라보고 판단하기 위해, 나의 평생 자산이 될 CW 프로젝트를 시작해 보려고 한다.
참고도서: 세계 인플레이션 시대의 경제지표 : 주식 차트나 기업 실적보다 더 중요한 경제 흐름 읽는 법
고용통계 정의
미국시간 오전 8시 30분 발표되는 고용지표는 타 경제지표와 달리 준실시간 데이터로서 매우 중요시 되는 경제 지표이다. 고용통계 추세를 통해 경제 사이클에 대한 변동을 파악할 수 있다.
- 노동 참가율 : 노동 가능 경제 인구 중 경제활동을 하고 있는 인구의 비
- 실업율 : 스스로 일자리를 찾기 위한 노력을 했음에도 찾지 못한 인구의 비
- 비농업부분 고용자 수 : 농업 종사자를 제외한 고용자 수 증감의 전월 대비. 15만~20만 명 증가일 때 호조로 본다.
- 제조업 노동시간 : 경기 전환의 신호. 40시간을 넘기면 경기 확대 국면의 신호. (트럭기사 또는 어린이집 직원 모집 수도 중요한 요소)
- 실업급여 신청 건수 : 매주 발표되는 정확도 높은 지표. 장기적으로 신청 건수가 밑돌 경우 경기 회복 국면으로 볼 수 있다.
참고) ADP 고용통계 : 민간 기업이 2일 일찍 작성 및 발표 : 실제 급여 데이터 바탕으로 통계를 내며, 모수가 적어 실제 발표와 다를 수 있으나, 예측 자료로 활용 가능
데이터 수집 및 처리
Airflow의 PythonOperator를 활용하여 각 지표들의 값을 수집한다.
데이터는 pandas-datareader를 활용하여 Fred에서 데이터를 수집 후, DB에 Upsert 하는 로직으로 구현하였다.
(앞으로 여기에 수많은 Task들이 쌓일것을 생각하니 벌써부터 뿌듯하다..)
- CIVPART : Fred Labor Force Participation Rate
- UNRATE : Fred Unemployment Rate
- PAYEMS : Fred All Employees Total Nonfarm
- AWHMAN : Hours: Hours Worked: Manufacturing, Average Weekly Hours of Production and Nonsupervisory Employees, Manufacturing
- CCSA : Continued Claims (Insured Unemployment)
데이터 시각화
위와 같이 DAG를 구성하고 Job을 수행하면 Grafana에서 결과를 확인 할 수 있다.
Insight
- 경제위기가 왔을때마다 실업률이 증가하하고 노동 참가율은 감소한다.
- 경제위기가 왔을때마다 제조업 노동시간은 40시간 미만이며, 고용자수는 하락한다.
- 고용통계가 좋으면 금리는 상승하고 채권 가격은 떨어진다.
- 고용통계가 나쁘면 금리는 하락하고 채권 가격은 상승한다.
- 다만, 경기침체에서 막 벗어난 단계라면 고용상태가 좋더라도 채권 가격에 영향이 미미할 수 있다.
- 2008년 리먼사태
- 2020년 코로나 펜데믹
'Devops > CW Project' 카테고리의 다른 글
[Geomap] Postgis 쿼리 활용 (1) | 2024.07.12 |
---|---|
2. 미국 GDP와 소매 매출액 (1) | 2024.06.29 |