Endless Motivation

ELK Stack으로 지하철 역 특성 분석하기 본문

교통 이야기

ELK Stack으로 지하철 역 특성 분석하기

Renesys 2020. 5. 13. 21:58

ELK Stack을 사용하여 서울 열린데이터 광장에서 제공하는 지하철 승하차량 데이터를 분석해보았다. 아직은 이것저것 건드려가면서 개선중이긴 한데 지금까지 만든 것으로도 어느정도 패턴이 보이는 역들을 적어본다

아래 캡쳐의 3개 그래프는 각각

시간대별 승하차량 평균 / 월별 승하차량 평균 / 연도별 승하차량 평균을 나타낸다.

주거지역

4호선 쌍문역 그래프

역 주변에 아파트나 주택 등 주거지역이 많을 때 보이는 패턴이다. 승차량은 출근하는 승객들로 아침 6시부터 승차량이 높아져 9시 이후 급격하게 내려가 그대로 햐항선을 탄다. 하차는 반대로 18~19시에 퇴근 승객으로 정점을 찍는다. 대다수의 주거지역을 상업중심구역으로 이어주는 대중교통의 특성 상 많은 역이 이러한 그래프를 갖는다.

상업지역

2호선 을지로입구역 그래프

회사와 사무실 밀집지역이 많은 역에서 보이는 패턴으로 주거자역과 정반대의 그래프롤 보여준다. 대부분의 회사 출근시간인 9시 직전 급격하게 피크를 찍었다가 내려오고 퇴근시간대에는 반대로 승차량이 치솟으며 집으로 돌아가는 승객들의 모습을 그대로 보여준다.

번화가

2호선, 경의중앙선, 공항철도 홍대입구역 그래프

유흥시설이 많은 지역의 경우 오후를 지나 밤이 될수록 승차/하차량 모두 증가하는 모습을 볼 수 있다. 18시를 넘어 하차량이 많이 늘어나고 늦은 밤 승차량이 올라가는 모습은 이 지역에서 모임이 많다는 것을 보여준다.

복합형

위의 3가지 케이스가 섞여있는 지역일 경우 그래프 또한 패턴이 섞인 모습을 보여준다.

4호선 명동역 그래프

서울의 대표적인 관광지이자 번화가로 유명하면서 사무실도 많은 명동은 상업지역+번화가 그래프가 섞은 모습을 보여준다. 출근인파로 오전시간 하차량이 폭등하지만 그 뒤 관광객들로 인해 하차량이 어느정도 선을 유지하는 모습을 보여준다. 승차량의 경우 퇴근시간은 물론 번화가답게 밤 늦은 시간에도 꽤 많은 사람들이 타는 모습을 알 수 있다.

4호선 범계역 그래프

주거지역과 소규모 상업지역이 같이 있는 신도시 중심의 경우 주거+상업지역 느낌의 그래프를 볼 수 있다. 출근시간대 승차량이 높긴하지만 하차량도 오르는 모습을 볼 수 있으며 퇴근시간대는 그와 반대 모습이 나타난다. 재밌는 부분은 낮시간대에는 승하차량 모두 일정한 수준을 유지하는 그래프를 보여준다는 것.

특이 케이스

2호선 한양대역 그래프

대학교가 근처에 있는 역인 경우 학사일정에 영향을 받는 것을 여실히 보여준다. 오전에 등교하고 오후에 하교하는 학생들의 패턴은 물론이며 왼쪽 하단의 월별 승하차량 그래프를 보면 방학기간인 1~2월, 7~8월은 승하차량 자체가 낮음을 알 수 있다.

2호선, 9호선 종합운동장역

야구 경기가 열리는 종합운동장역은 관중들의 영향을 많이 받는 것으로 보인다. 주중 경기 시작시간인 이른 저녁 하차량이 늘어났다가 경기가 끝나는 시간 쯤 승차량이 높아진다. 월별 그래프를 봐도 프로야구 시즌인 3~10월에 승하차량이 높은 모습을 보여준다.

1호선 제기동역

노인들이 많이 찾는 역의 경우 특이한 그래프가 만들어지는데 약령시가 있는 제기동역의 경우 NH시간대인 10~17시에 승하차량이 높아지는 그래프를 볼 수 있었다. 오른쪽 밑의 연도별 승하차량 그래프를 보면 미묘하게 계속 올라가는 모습이 보이는데 인구 고령화로 인해 제기동을 찾는 사람들이 점점 많아진다는 것을 알 수 있다.

여담이지만 모든 역의 연도별 그래프에서 2020년에 수치가 뚝 떨어진 것을 알 수 있는데 코로나 바이러스로 사람들이 대중교통을 이용하지 않는 모습을 생생하게 보여준다.

Comments