Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.20 No.1 pp.86-99
DOI : https://doi.org/10.12815/kits.2021.20.1.86

Speed Prediction of Urban Freeway Using LSTM and CNN-LSTM Neural Network

Boogi Park*, Sang hoon Bae**, Bokyung Jung***
*Master’s Student, Dept. of Spatial Information Eng., Pukyong National University
***Professor, Dept. of Spatial Information Eng., Pukyong National University
**Bachelor’s Student, Dept. of Spatial Information Eng., Pukyong National University
Corresponding author : Sang hoon Bae, sbae@pknu.ac.kr
28 December 2020 │ 18 January 2021 │ 25 January 2021

Abstract


One of the methods to alleviate traffic congestion is to increase the efficiency of the roads by providing traffic condition information on road user and distributing the traffic. For this, reliability must be guaranteed, and quantitative real-time traffic speed prediction is essential. In this study, and based on analysis of traffic speed related to traffic conditions, historical data correlated with traffic flow were used as input. We developed an LSTM model that predicts speed in response to normal traffic conditions, along with a CNN-LSTM model that predicts speed in response to incidents. Through these models, we try to predict traffic speeds during the hour in five-minute intervals. As a result, predictions had an average error rate of 7.43km/h for normal traffic flows, and an error rate of 7.66km/h for traffic incident flows when there was an incident.



LSTM 및 CNN-LSTM 신경망을 활용한 도시부 간선도로 속도 예측

박 부 기*, 배 상 훈**, 정 보 경***
*주저자 : 부경대학교 지구환경시스템과학부 공간정보시스템공학전공 석사과정
**교신저자 : 부경대학교 공간정보시스템공학과 교수
***공저자 : 부경대학교 공간정보시스템공학과 학부과정

초록


교통혼잡을 완화하기 위한 방안 중 하나로 도로 이용자에게 교통상황 예측정보를 제공함으 로써 교통량을 분산 시켜 도로 이용 효율을 증대시키는 방법이 있다. 이를 위해서는 신뢰성이 보장되고 정량적인 실시간 교통 속도 예측이 필수적이다. 본 연구에서는 상황별 교통속도 분 석을 기반으로 이력 속도 데이터와 이력 속도 외의 교통류에 상관관계가 있는 데이터를 LSTM 입력 데이터로 활용하였다. 정상 교통류 상황에 대응하여 속도를 예측하는 LSTM 모델과 유고 상황에 대응하여 속도를 예측하는 CNN-LSTM 모델을 개발하여 유고발생 후 1시간까지 5분 단위로 교통속도 예측을 시도하였다. 모델의 검증은 테스트 데이터를 통하여 교통상황별 예측 성능을 분석하였다. 그 결과 정상 교통류에서는 평균 7.43km/h, 유고상황에서는 7.66km/h의 오 차율로 각각 예측되었다.



    Ⅰ. 서 론

    1. 연구 배경 및 목적

    유고는 교통혼잡의 원인 중 비반복적인 혼잡(Non-recurrent congestion)으로 교통사고, 도로통제, 차량고장 등으로 인하여 정체 현상이 생기는 것을 말한다. 유고 발생 직후 유고 발생지점의 상류부에서 급속한 교통량 의 증가와 속도 저하를 발생시키고 상류부로 지체가 퍼져 나가는 충격파를 발생시킨다(FHWA, 2006). 우리나 라에서 유고 중 교통사고는 2011년부터 2019년까지 연평균 222,256건을 기록(TAAS, 2020)하고 있다. 이는 국 가 GDP의 2.3%를 차지한다(KOTI, 2019). 유고 중 교통사고는 고장과 같은 기타 유고와 지체로 발생하는 지 체손실비용을 포함하지 않은 수치이며 포함했을 시 더 많은 비용이 발생할 것으로 추정할 수 있다.

    과거의 교통류 분석과 예측 연구는 실제 교통 데이터를 수집하는 데 한계가 있었기 때문에 수학적 모델, 시뮬레이션, 현장 조사에 의존하여 수행되었다. 따라서 실제 교통류를 정확하게 추론할 수 없었으며 모델의 공간적 범위가 제한적이었다. 그러나 최근 GPS, 도로 네트워크의 센서, 유고 데이터 수집의 구체성이 증가하 여 유고에 대한 분석이 용이해졌다. 또한, 인공지능 분야 중 인공신경망의 급속한 발전으로 인하여 인공신경 망을 활용한 유고 지속시간 예측과 함께 유고 발생 이후 교통류의 변화 양상을 통하여 유고가 발생시키는 대기행렬과 충격파에 대한 예측을 목표로 하는 연구가 활발히 수행되고 있다. 기존 연구들은 인공신경망과 통계적 방법으로 정상 교통류 상태의 속도 예측과 반복적 혼잡(Recurrent congestion)을 예측하는 것에 중점을 두고 있다. 그러나 본 연구에서는 정상 교통류에 대응하는 인공신경망과 돌발상황 이후의 교통류에 대응하 는 인공신경망을 이원적으로 개발하여 정상 교통류와 유고상황 이후의 속도를 정량적으로 예측하고자 하였 다. 본 연구의 속도 예측 모델을 통해 정상 교통류와 유고 발생 이후 교통류 상황을 예측하고 첨단 교통관리 시스템(Advanced traffic management system)에서 실시간 우회 경로나 경로 안내를 효과적으로 계획하여 운전 자에게 제공함으로써 유고로 인한 지체손실비용을 줄일 수 있을 것으로 기대한다.

    2. 연구 범위

    본 연구의 공간적 범위는 서울특별시 마포구 성산대교 북단에서 성동구 성수동 동부간선도로 분기점까지 연결하는 도시부 간선도로인 내부순환로이며 방향별로 동향(East bound) 30개 링크, 서향(West bound) 35개 링크를 포함하는 총연장 21.1 km, 왕복 4에서 6차로 구간이다.

    <Fig. 1>

    The spatial scope of research

    KITS-20-1-86_F1.gif

    시간적 범위는 개발된 모형의 검증 과정을 거쳐 주요 입력 데이터인 링크 속도, 강수량 데이터 등이 실시 간 수집 가능한 시점인 2022년으로 설정하였다.

    내용적 범위는 2018년 10월 1일에서 2019년 9월 23일까지 총 356일 23시간 55분의 GPS 기반 프로브 차량 데이터를 통해 얻은 링크별 5분 단위 구간 속도 데이터를 활용하고 1분 단위의 GPS 좌표값, 유고상황의 종 류가 포함된 유고데이터와 기상자료를 사용하였다. 정상 교통류 속도 예측을 위한 인공신경망 모형으로 LSTM 모델을 활용하고 돌발상황 이후 속도 예측을 위한 인공신경망으로 CNN-LSTM 모델을 활용하였다. 각 모델은 교통상황별, 예측 거리별 시·공간 평균 절대 오차율(Mean absolute error, MAE)을 통하여 검증하였다.

    Ⅱ. 문헌고찰

    인공신경망을 통한 교통류의 속도예측 연구는 기존 통계적 모델을 통한 속도예측에 비해 다양한 형태의 교통 데이터와 교통류에 영향을 미칠 수 있는 다양한 데이터 간의 비선형적인 관계를 조합하여 동시에 활용 할 수 있다는 장점으로 인해 최근 많은 연구가 이뤄지고 있다. 또한, 인공신경망 구조의 특성을 활용하여 다 층구조를 활용함으로써 복잡한 데이터 관계를 해석하거나 특정한 패턴을 보이는 시계열 데이터 학습에 용이 한 RNN, LSTM 모델을 활용하는 연구도 활발하다(Sepp and Jurgen, 1997). CNN 모델의 경우 기존 DNN 모델 에서 2차원 이상의 입력 데이터를 입력하고 신경망이 데이터의 공간적 상관관계를 학습 하여 이미지 데이터 와 공간적 분포 해석에 용이하다(Simard et al., 2003). 최근에는 CNN 모델의 특성과 LSTM 모델의 특성을 활용하기 위하여 두 모델을 결합한 CNN-LSTM 모델 속도 예측 연구들이 시도되어지고 있다.

    기존 인공신경망을 통한 교통류 속도 예측 연구 중 순환 인공신경망(RNN)을 이용한 대도시 도심부 교통 혼잡 예측 연구에서는 실시간 소통정보와 이력 패턴데이터를 지체도로 측정하는 지표로 변환하고 이를 사고 정보 데이터와 함께 RNN 모델에 입력하여 1시간 주기로 다음 1시간 동안의 소통상황을 예측하였다(Jung et al., 2017). 장단기 교통흐름 예측을 위한 딥러닝 LSTM 신경망 연구에서는 차량별 교통량, 속도, 점유율 등 총 6개의 입력 데이터를 활용하여 멀티 출력을 발생시키는 LSTM을 설계하여 24시간 동안과 1시간 동안의 속도 예측을 하였다(Lee and Bui, 2019). 심층 인공신경망(DNN)과 다각도 상황 정보 기반의 서울시 도로 링 크별 교통 혼잡도 예측 연구에서는 도로의 외부 상황을 표현하는 휴일, 요일, 시간, 기온 등 교통속도에 영향 을 주는 외부 요인을 활용하여 지체도를 3가지로 분류하여 예측을 시도하였다(Kim et al., 2019).

    단기 교통속도 예측을 위한 Conv-LSTM 기반의 하이브리드 딥러닝 모델 연구에서는 도심지 도로와 고속 도로에 대하여 링크·시간대별 속도 데이터를 2차원 입력데이터로 활용하여 기존의 교통속도 예측모델과 CNN-LSTM, Conv-LSTM, 양방향 LSTM과 혼합한 Conv-LSTM 모델을 비교 분석 하였다(Zheng et al., 2020).

    교통 돌발 상황을 고려한 도로 속도 예측 기법 연구에서는 예측 대상 도로와 하류부 이웃 도로 데이터로 입력데이터를 구성하고 LSTM 모델을 통해 30분 후의 속도를 1차 예측하고 돌발상황이 발생했을 시 이벤트 가중치를 적용하여 교통류 속도 감소 가중치와 회복 가중치를 적용하여 2차 처리하여 도로 속도 예측의 오 차를 줄이는 방법으로 예측 오차를 줄였다(Park et al., 2020).

    기존 인공신경망을 활용한 교통속도를 예측 연구에서는 교통속도 데이터와 교통류에 영향을 주는 교통속 도 외의 데이터를 활용하는 시도가 있었으며 교통류의 장기예측과 단기 예측을 동시에 할 수 있는 인공신경 망 개발의 시도가 있었다. 또한 유고상황에 대응하는 교통속도 예측을 위해 속도 데이터와 유고상황 데이터 를 동시에 활용하거나 유고상황 발생 시 교통속도의 영향을 분석하여 인공신경망의 예측을 통계적 방법을 통하여 예측 오차를 줄이려는 노력이 있었다. 본 연구에는 기존 연구와 달리 정상적인 교통상황에서 대응하 는 인공신경망으로 1시간 동안의 예측을 5분 단위로 링크별 km/h 단위의 정량적 속도 예측을 하되 유고상황 발생 시 유고상황에 대응하는 인공신경망으로 유고상황 영향권의 속도를 km/h 단위로 예측하고자 하였다.

    Ⅲ. 연구 내용

    1. 연구 수행 과정

    본 연구의 수행 과정은 입력 데이터 처리와 정상 교통류 예측을 위한 인공신경망 개발과 유고상황 발생 시 유고 영향권 내의 속도를 예측하는 인공신경망 개발 부분으로 구분하여 수행하였다.

    <Fig. 2>

    Research flow

    KITS-20-1-86_F2.gif

    GPS 기반 프로브차량의 구간 속도 데이터, 유고 데이터, 기상 데이터를 수집하였다. 링크 속도 데이터에 대한 결측을 보정하고 각 데이터의 시계열을 통일시킴으로써 데이터를 전처리하였다. 데이터 분석으로 교통 류에 영향을 미치는 데이터와 교통류를 비교하였다. 데이터 분석을 바탕으로 정상 교통속도 예측을 위한 인 공신경망으로 LSTM 모델을 만들고 입력데이터별 성능 비교를 통해 입력데이터를 선정하였다. 유고상황 발 생 시 교통류에 발생하는 영향권에 대하여 분석하고 예측 범위를 선정하여 유고상황 교통속도 예측 모델인 CNN, LSTM, CNN-LSTM 모델을 비교 검증을 하였다.

    2. 데이터 처리 및 분석

    1) 데이터 수집 및 전처리

    속도 데이터는 진·출입로를 제외한 본선 링크 구간의 속도로 5분 단위 구간 평균 속도 데이터를 사용하였 다. 속도 데이터에 대한 전처리는 프로브차량의 누락으로 인하여 결측된 9.15%의 링크 속도 데이터에 대하 여 패턴 데이터와 인근 링크의 속도를 활용한 결측 보정으로 처리하였다. 유고 데이터는 총 987건으로 사고, 고장, 장애물 등으로 구분하여 유고의 발생 시간, 유고가 발생한 경위도 좌표, 유고가 발생한 국가표준링크 를 포함한다. 기상 데이터는 표준지점번호 108의 일 단위 종관기상관측 기상 데이터로 적설(cm) 및 강수량 (mm) 데이터를 수집하였다(KMA). 일자 데이터는 [0, 1, 2, 3, 4, 5, 6]으로 월요일부터 일요일을 구분하고 휴 일은 주말 및 공휴일과 평일을 구분하여 [0, 1]로 구성한다. 시간 데이터로 0부터 23으로 시간을 구분하고 분 단위는 0부터 55로 구분하였다. 각 데이터는 가장 작은 시간 단위인 5분 단위로 시계열을 통일 하였다. 데이 터 분석과 입력 데이터 별 인공신경망 속도 예측을 비교한 데이터는 <Table 1>의 데이터를 기반으로 하였다.

    <Table 1>

    Contents of collected data

    KITS-20-1-86_T1.gif

    2) 링크별 속도 데이터 분석

    적용할 인공신경망과 입력할 데이터를 선정하기 위하여 시·공간별 속도 분포와 속도 외의 데이터와 속도 데이터의 관계를 분석하였다. 데이터별 시·공간 속도 패턴 분석으로 각 데이터와 속도 간의 평균속도, 표준 편차를 분석하여 각 데이터별 속도의 영향을 파악하고 이를 바탕으로 도시부 간선도로 속도 예측 모델의 입 력데이터의 우선순위를 선정하였다.

    링크별 시간대별 평균 속도 히트 맵(Heatmap)으로 시·공간별 속도 분포를 파악하였다. 서울시 내부순환로 구간 내 공간적 정체는 East bound에서 흥지문터널 입구 부근(Link 7, Link 8, Link 9)과 사근IC 부근에서 상 습 정체가 발생하는 것을 파악하였고 West bound에서는 용두역 방면부터 흥지문 터널과 길음역 방면부터 연 희 IC(Link 8 ~ Link 33)까지 비교적 넓은 공간으로 정체가 발생하며 오전 첨두시는 8시부터 9시 30분, 오후 첨두시는 16시부터 20시까지 발생하는 것을 파악하였다.

    <Fig. 3>

    Heatmap of east bound speed

    KITS-20-1-86_F3.gif
    <Fig. 4>

    Heatmap of west bound speed

    KITS-20-1-86_F4.gif

    링크별 시간대별 속도 데이터 외의 입력데이터인 요일 데이터, 휴일·평일 데이터, 기상 상황 데이터별로 일평균 속도와의 관계를 분석하였다.

    요일별 속도 데이터는 일요일이 가장 높은 평균속도인 73.26km/h로 분석되었으며 가장 낮은 표준편차인 10.62km/h로 분석되었다. 반면 금요일의 경우 가장 낮은 평균속도로 66.81km/h로 분석되었고 가장 높은 표준 편차로 13.46km/h로 분석되었다.

    <Fig. 5>

    Average speed by week (East bound)

    KITS-20-1-86_F5.gif
    <Fig. 6>

    Average speed by week (West bound)

    KITS-20-1-86_F6.gif

    강수와 적설을 포함하는 링크 속도의 경우 강우 시 평균 링크속도는 64.83km/h, 표준편차는 9.54km/h로 전 체 평균 속도인 68.72km/h보다 비교적 낮았으나 적설이 발생한 경우 68.73km/h로 평균속도와 유사하였다. 적 설의 분석 결과는 전체 데이터와 비교해 데이터의 수가 적었으며 활용한 데이터 범위 내에서 링크속도에 큰 영향을 미치지 못하는 것으로 판단하여 입력 데이터에서 소거하였다.

    <Fig. 7>

    Average speed by weather conditions (East bound)

    KITS-20-1-86_F7.gif
    <Fig. 8>

    Average speed by weather conditions (West bound)

    KITS-20-1-86_F8.gif

    휴일과 평일의 경우 평일의 평균속도는 68.73km/h, 표준편차는 12.78km/h로 분석되었으며 휴일의 경우는 평균속도 68.73km/h, 표준편차는 11.54km/h로 분석하였다. <Table 2>와 같이 각 데이터와 속도 간의 관계를 분석하였다. 분석의 결과를 바탕으로 간선도로 속도예측 모델 입력 데이터 조합의 우선순위를 선정하였다.

    <Table 2>

    Daily average speed

    KITS-20-1-86_T2.gif

    평균속도와 표준편차를 이용하여 속도 외의 데이터가 속도 데이터에 미치는 영향을 파악하였으며 항목별 평균 속도의 차이와 분산의 정도를 나타내는 표준편차가 큰 순서대로 정리하였다. 시계열 데이터인 시간과 분 데이터, 요일과 휴일·평일 데이터, 강수량 데이터 순으로 정리하였으며 적설량 데이터의 경우 전체대비 1.61%의 비율로 인공신경망 훈련에서 데이터 불균형과 분산으로 인한 학습에 어려움이 있어 소거하였다.

    <Fig. 9>

    Spatial bias of Incidents

    KITS-20-1-86_F9.gif
    <Fig. 10>

    Temporal bias of Incidents

    KITS-20-1-86_F10.gif

    3) 유고 영향 속도 데이터 분석

    유고를 포함하는 링크 속도를 분석하였을 때 사고인 경우 62.96km/h, 고장인 경우 64.13km/h로 비교적 낮 은 속도 분포를 보였으나 시·공간적인 편향을 파악하였다. 또한 유고의 특성인 사고 다발 지역과 사고 다발 시간대는 존재하나 규칙적으로 발생하지 않고 연속적인 시계열 예측의 한계점으로 인하여 정상 교통류에 대 응하여 예측하는 모델과 유고 상황에 대응하여 예측하는 모델을 분리하여 개발하였다.

    유고 상황에 대응하여 예측하는 모델의 예측 범위를 선정하기 위해 유고의 시·공간 영향권 분석을 하였 다. 분석 방법으로 동향(East bound)과 서향(East bound)의 유고에 대하여 유고 검지 5분 전 속도와 유고(사고, 고장) 전후로 인근 링크(유고 발생링크, 상류부 링크 5개, 하류부 링크 5개)와 인근 시간대(유고 발생 이후 1 시간)의 속도 차이로 분석을 수행하였다. 분석 결과 유고 발생 이후 <Fig. 11>과 같이 충격파(Shock wave)가 발생하며 상류부에서 급격한 속도 감소를 발생시키며 유고 영향의 진행에 따라 시·공간적인 영향이 전이되 었다. 사고와 고장의 영향권은 유사한 패턴을 보였으며 유고 영향의 평균 시간적 범위는 유고 검지 5분 전 속도와 비교하여 유고 발생 이후 1시간, 상류부 링크 5개를 유고의 시·공간적 영향권으로 선정하였다.

    <Fig. 11>

    Average speed of incident impact area

    KITS-20-1-86_F11.gif

    3. 도시부 간선도로 속도 예측 모델 개발

    본 연구의 도시부 간선도로 속도 예측 알고리즘은 <Fig. 12>를 따라 방향별(동향 30개 링크, 서향 35개 링 크)로 반복 정체를 포함하는 정상적인 교통류에 대하여 5분마다 1시간까지 5분 단위로 모든 링크에 대하여 링크별 속도 및 기타 데이터를 통해 지속적인 예측을 하고 유고 검지 시 정상적인 교통류에 대응하는 모델 의 유고 영향권에 대하여 <Fig. 13>과 같이 유고 발생 인근 링크의 시·공간 속도 데이터를 입력하여 유고 영 향권에 해당하는 링크의 속도를 대체하여 예측하는 모델을 개발하고자 하였다.

    <Fig. 12>

    Flow of speed prediction

    KITS-20-1-86_F12.gif
    <Fig. 13>

    Prediction when incident occurs

    KITS-20-1-86_F13.gif

    본 연구에서 예측 모델을 구축하고 평가한 환경은 Intel core i7-8700 CPU @ 3.20GHz, 32GB RAM, Windows 10 Pro 64-bit, Nvidia GeForce GTX 1060 6GB이며 언어는 Anaconda Python 3.7이다. 인공신경망을 구축을 위 한 플랫폼으로 TensorFlow 2.0의 Keras API를 활용하였다.

    1) 정상 교통류 속도 예측 모델

    정상 교통류에 대응하는 속도 예측 모델은 시계열 예측에 용이한 Stacked many-to-many LSTM 모델 구조 를 사용하여 입력되는 모든 링크(동향 방향 링크 : 30개, 서향 방향 링크 : 35개)의 예측 시점(t)부터 5분 단 위로 120분(t - 24)까지의 이력 속도 데이터와 이력 속도 데이터 외의 데이터를 입력받아 예측 시점(t)부터 지속해서 5분 단위의 60분(t + 12)까지의 모든 링크의 속도를 예측하는 모델로 구성하였다.

    입력 데이터와 예측 데이터 세트는 한 방향 기준으로 102,746개의 데이터 세트를 만들었으며 모델의 학습 과 검증은 기하구조와 교통량의 시·공간적 변화가 다른 서향 방향과 동향 방향에 대하여 교차검증을 할 수 있도록 방향별로 두 모델에 대하여 6:2:2 비율로 학습 데이터, 검증 데이터, 테스트 데이터로 분리하여 학습 과 검증을 수행하였으며 입·출력 데이터 세트의 시계열을 혼합하지 않고 실시하였다. 학습의 최적화 함수는 Adam(Adaptive moment estimation) optimizer, 손실함수는 MSE(Mean squared error), 활성화 함수는 Keras API의 LSTM의 기본 값으로 입력하였다.

    이력 속도 데이터만 입력데이터로 활용하여 실험적인 방법으로 LSTM 속도 예측 모델의 형태별로 9개 이 상의 모델을 생성하여 MAE 오차율이 중앙값인 모델을 Baseline LSTM 모델로 선정하였다. 최종 Baseline LSTM 모델은 [512, 256] 레이어 형태이며 산정한 표는 <Table 3>과 같다.

    <Table 3>

    Baseline LSTM selection (MAE)

    KITS-20-1-86_T3.gif

    Baseline LSTM 모델을 구성한 후 링크별 이력 속도(LS) 외의 시간(SH), 분(SM), 요일(SW), 휴일(SF), 강수 량(WR) 정보를 학습시키기 위하여 입력 데이터를 조합하여 예측에 대한 비교를 하였다. 입력 데이터 조합의 순서는 링크별 속도 데이터 분석의 결과를 바탕으로 우선순위를 정하였다. 인공신경망에 대한 검증은 Baseline LSTM 모델을 선정한 방법과 동일하게 실험적인 방법으로 선정하였다. <Table 4>의 과정으로 정상 교통류에 대응하는 속도 예측 모델은 [512, 256] 레이어 형태의 Stacked many-to-many LSTM 구조이며 입력 데이터로 링크 속도, 시간, 휴일, 요일, 강수량 데이터를 입력하는 모델로 선정하였다. 입력 데이터의 선정은 각 방향별 오차율을 고려하여 선정하였다. 이력속도, 시간, 휴일, 요일 정보를 입력데이터로 활용한 모델의 평균 MAE와 이력속도, 시간, 휴일, 요일, 강수량 정보를 입력데이터로 활용한 모델의 평균 MAE가 동일하였 으나 데이터 분석 결과 강수량과 교통류 속도의 상관관계가 있으므로 후자의 모델을 선정하였다.

    <Table 4>

    Input data combination (MAE)

    KITS-20-1-86_T4.gif

    최종적으로 선정한 정상 교통류 속도 예측 모델은 MAE 기준으로 서향 방향 8.44 km/h, 동향 방향 6.43 km/h의 오차율로 분석하였다.

    2) 유고상황 속도 예측 모델

    유고상황에 대응하는 속도 예측 모델은 유고 영향 속도 데이터 분석을 바탕으로 모든 방향에 대하여 평균 적인 유고 영향권으로 선정한 유고 검지 시점(t)부터 이후 60분(t + 12)까지 5분 단위로 상류부 5개와 유고 발생 링크를 포함한 6개의 링크를 예측하는 모델을 구성하였다.

    유고 이후 속도 변화의 특성인 상류부에서의 충격파(Shock wave)의 영향을 예측하기 위하여 데이터의 공 간적인 해석이 가능한 CNN 모델, 시계열 해석이 가능한 LSTM 모델, 두 모델을 혼합한 CNN-LSTM 모델을 비교하였다. 입력 데이터와 예측 데이터 세트는 한 방향 기준으로 총 987개의 데이터 세트를 만들었다. 학습 과 검증은 6:2:2 비율로 학습 데이터, 검증 데이터, 테스트 데이터로 분리하여 학습과 검증을 실시하였다. 유 고의 규칙적이지 않고 연속성이 부족한 특성을 반영하기 위하여 입력과 예측 데이터 세트는 랜덤함수를 기 반으로 순서를 섞어 실시하였다. LSTM 신경망의 학습 파라미터는 정상 교통류 속도 예측 모델과 같으며 CNN 신경망의 활성화 함수는 ReLU(Rectified linear unit)로 입력하였다.

    CNN 신경망은 Conv2D 망을 활용하여 시간별 링크 속도를 2차원으로 입력하는 방법으로 활용하였으며 LSTM 신경망은 정상 교통류 속도 예측 모델과 같이 Many-to-Many 망을 활용하였다. 각 신경망의 형태별로 35개의 모델을 생성하여 MAE 오차율이 중앙값인 모델을 형태별 대표 모델로 선정하여 최적화하였다. 모델 별 최적화는 <Table 5>의 과정을 따라 하였으며 CNN은 MAE 12.15 km/h, LSTM은 MAE 9.07 km/h로 분석하 였다. CNN-LSTM 모델은 Conv2D [32, 16]에 Dropout [20%, 0%], LSTM [16]으로 구성하여 검증한 결과 MAE 7.66 km/h로 분석하였으며 유고상황 속도 예측 모델로 선정하였다.

    <Table 5>

    Comparison of error rates by model type (MAE)

    KITS-20-1-86_T5.gif

    Ⅳ. 연구 결과

    개발된 모델에 대한 방향별 예측 수준을 MAE 기준으로 분석하였다. 분석의 방법으로 정상 교통류 속도 예측 모델은 링크별 예측의 시간대별 평균 오차율 비교를 수행 하였다. 강수 유무, 첨두·비첨두시 오차율을 비교하였다. 유고상황 속도 예측 모델은 모델별 예측을 비교하였으며 유고 발생이후 링크별 예측의 시간대 별 평균 오차율과 유고 발생 링크와 상류부 5개 링크의 예측을 비교하였다.

    정상 교통류 속도 예측 모델은 <Fig. 14>, <Fig. 15>와 같이 예측의 시간적 거리가 멀어질수록 예측 오차율 이 커지는 경향이 있음을 파악하였다. 동향과 서향 방향 모델 모두 비첨두 시, 강우 상황, 평균 오차가 유사 하였으나 첨두시의 경우 동향 방향 모델은 예측 오차가 적은 것으로 분석되었다. 이는 동향방향의 첨두시의 시·공간적 변화량이 비교적 균일한 패턴을 보이고 있기 때문으로 판단된다. 서향 방향 모델은 평균적으로 8.35 km/h, 동향 방향 모델은 6.42 km/h의 예측 오차율을 보였으며 정상 교통류 속도 예측 모델의 오차율 분 석의 결과는 <Table 6>과 같다.

    <Fig. 14>

    East bound normal state prediction

    KITS-20-1-86_F14.gif
    <Fig. 15>

    West bound normal state prediction

    KITS-20-1-86_F15.gif
    <Table 6>

    Results of normal state prediction

    KITS-20-1-86_T6.gif

    유고상황 속도 예측 모델의 예측 시간별 평균 오차율을 분석하였을 때 <Fig. 16>과 같이 CNN-LSTM 모델 은 CNN, LSTM 모델과 비교하여 예측시점의 직후 5분 예측거리는 비교적 높은 오차율을 보였으나 이후의 예측에서는 낮은 오차율을 보였으며 평균 7.66 km/h의 예측 오차율로 가장 낮은 오차로 예측하였다. 예측 링 크별 평균 오차율을 분석하였을 때 유고 <Fig. 17>과 같이 발생 링크와 상류부 2번째 링크에서는 비교적 LSTM 모델의 예측 오차율이 가장 낮았으나 이외의 링크에서는 CNN-LSTM 모델의 예측 오차율이 낮은 것 으로 분석되었다. 유고상황 속도 예측 모델의 오차율 분석 결과는 <Table 7>과 같다.

    <Fig. 16>

    Incident state prediction (Time)

    KITS-20-1-86_F16.gif
    <Fig. 17>

    Incident state prediction (Space)

    KITS-20-1-86_F17.gif
    <Table 7>

    Results of incident area prediction

    KITS-20-1-86_T7.gif

    정상 교통류의 예측 모델과 유고상황 속도 예측 모델의 예측된 속도와 실제 속도의 유의확률(p값, p-value) 과 산점도 그래프를 통하여 통계적 유의성 검정을 하였다. 정상 교통류 모델은 방향별 예측 모델의 예측 링 크 및 시간대의 평균 예측 속도로 유의성 파악을 하였고 유고상황 속도 예측 모델은 표본 수의 부족으로 예 측 시간대별 링크의 평균 예측 속도로 파악하였다. 정상 교통류 예측 모델은 동향 방향 0.001 유의확률로 95% 신뢰수준에서 만족하였으나 서향 방향은 0.059 유의확률로 신뢰수준이 비교적 부족하였다. 유고상황 속 도 예측 모델의 경우는 예측 이후 25분 까지는 유고 영향권에 대하여 0.037 유의확률로 95%의 신뢰수준을 만족하였으나 1시간까지의 예측은 0.21 유의확률로 비교적 예측이 어려웠다.

    <Fig. 18>

    Scatter plot of normal state model predictions (East bound)

    KITS-20-1-86_F18.gif
    <Fig. 19>

    Scatter plot of normal state model predictions (West bound)

    KITS-20-1-86_F19.gif
    <Fig. 20>

    Scatter plot of incident state model predictions (Up to 25 minutes)

    KITS-20-1-86_F20.gif
    <Fig. 21>

    Scatter plot of incident state model predictions (Up to an hour)

    KITS-20-1-86_F21.gif

    Ⅴ. 결 론

    도시부 간선도로 내의 여러 링크에 대한 정량적 속도 예측을 위하여 속도 데이터와 기타 이력데이터를 분 석하고 입력데이터로 활용하였다. 속도 예측 모델은 두 가지의 모델을 유고 유무에 따라 예측하는 방법으로 유고 상황이 없는 정상 교통류 속도 예측을 하는 모델과 유고 상황 발생 시 유고 영향권에 대하여 속도 예 측을 하는 모델을 구성하여 5분 단위의 1시간 동안의 속도 예측을 하는 모델을 개발하였다. 이력 속도, 시간, 휴일, 요일, 강수량 데이터를 입력받는 LSTM 신경망으로 정상 교통류에 대응하는 속도 예측을 시도 하였다. 각 방향별 유고상황에 대하여 급변하는 속도를 예측하기 위하여 유고 상황에 대한 교통속도의 영향을 분석 하여 유고 영향권을 선정하였으며 이력 속도 데이터를 입력받는 CNN-LSTM 신경망으로 유고 상황에 대응하 는 속도 예측을 시도하였다. LSTM 신경망을 활용하여 각 입력 데이터간의 비선형적 조합으로 예측을 학습 시킴으로서 동향 방향과 서향 방향의 서울시 내부순환로에서 정상 교통류에 대하여 평균 7.43km/h의 오차율 로 링크별 속도 예측을 할 수 있었으며 유고 발생 시 CNN-LSTM 망을 활용하여 유고 발생링크와 상류부 링 크 5개에 대하여 시공간적인 속도 변화를 평균 7.66km/h의 오차율로 예측이 가능하였다.

    본 연구를 통하여 연속류 상 다수의 링크에 대하여 정상 교통류 상황과 유고발생 시 속도를 예측하고 이 를 통하여 지체의 시·공간적 변동 상황을 쉽게 이해 할 수 있다. 본 연구 결과물은 향후 도로 이용자에게 합 리적인 교통 정보를 제공하고 교통류 분산을 통하여 지체손실비용을 줄일 수 있을 것으로 기대된다.

    그러나 속도 데이터 수집의 링크 길이가 일정하지 않고 프로브차량 데이터의 특성으로 약 10%의 결측 데 이터가 있어 전처리를 수행하였기 때문에 정확한 속도 데이터의 확보가 추가적으로 필요하다. 또한 유고 데 이터 수집은 사람이 수집한 데이터로 발생 시간의 정확도의 신뢰성에서 한계가 있으며 일부의 유고 이후 속 도 데이터는 유고 이후 프로브 차량 수의 급감으로 교통류 수집에 어려움이 있다. 향후 보완된 데이터를 활 용하여 다양한 연속류에 대한 추가적인 속도 예측 연구와 검증이 필요할 것으로 판단된다. 또한 공간별·상황 별 유고에 따라 교통류에 어떤 영향을 미치는지에 대하여 추가 연구가 필요하다.

    Figure

    KITS-20-1-86_F1.gif

    The spatial scope of research

    KITS-20-1-86_F2.gif

    Research flow

    KITS-20-1-86_F3.gif

    Heatmap of east bound speed

    KITS-20-1-86_F4.gif

    Heatmap of west bound speed

    KITS-20-1-86_F5.gif

    Average speed by week (East bound)

    KITS-20-1-86_F6.gif

    Average speed by week (West bound)

    KITS-20-1-86_F7.gif

    Average speed by weather conditions (East bound)

    KITS-20-1-86_F8.gif

    Average speed by weather conditions (West bound)

    KITS-20-1-86_F9.gif

    Spatial bias of Incidents

    KITS-20-1-86_F10.gif

    Temporal bias of Incidents

    KITS-20-1-86_F11.gif

    Average speed of incident impact area

    KITS-20-1-86_F12.gif

    Flow of speed prediction

    KITS-20-1-86_F13.gif

    Prediction when incident occurs

    KITS-20-1-86_F14.gif

    East bound normal state prediction

    KITS-20-1-86_F15.gif

    West bound normal state prediction

    KITS-20-1-86_F16.gif

    Incident state prediction (Time)

    KITS-20-1-86_F17.gif

    Incident state prediction (Space)

    KITS-20-1-86_F18.gif

    Scatter plot of normal state model predictions (East bound)

    KITS-20-1-86_F19.gif

    Scatter plot of normal state model predictions (West bound)

    KITS-20-1-86_F20.gif

    Scatter plot of incident state model predictions (Up to 25 minutes)

    KITS-20-1-86_F21.gif

    Scatter plot of incident state model predictions (Up to an hour)

    Table

    Contents of collected data

    Daily average speed

    Baseline LSTM selection (MAE)

    Input data combination (MAE)

    Comparison of error rates by model type (MAE)

    Results of normal state prediction

    Results of incident area prediction

    Reference

    1. ALIO (2013), Korea Road Traffic Authority Traffic Science Institute, pp.86-87.
    2. FHWA (2006), Traffic Detector Handbook, pp.3-17.
    3. Jung H. J. , Yoon J. S. and Bae S. H. (2017), “Traffic Congestion Estimation by Adopting Recurrent Neural Network,” The Journal of the Korea Institute of Intelligent Transport Systems, vol. 16, no. 6, pp.67-78.
    4. Kim D. H. , Hwang K. Y. and Yoon Y. (2019), “Prediction of Traffic Congestion in Seoul by Deep Neural Network,” The Journal of the Korea Institute of Intelligent Transport Systems, vol. 18, no. 4, pp.44-57.
    5. Korea Meteorological Administration Data Center ASOS Data,https://data.kma.go.kr, 2020.07.27.
    6. Lee H. S. and Bui K. H. N. (2019), “Deep Learning LSTM for Long-Short Term Traffic Flow Prediction,” The Korean Institute of Information Scientists and Engineers 2019, pp.724-726.
    7. Park S. H. , Choi D. J. , Bok K. S. and Yoo J. S. (2020), “Road Speed Prediction Scheme Considering Traffic Incidents,” The Journal of the Korea Contents Association, vol. 20, no. 4, pp.25-37.
    8. Sepp H. and Jurgen S. (1997), “Long Short-Term Memory,” Neural Computation, vol. 9, no. 8, pp.1735-1780.
    9. Simard P. Y. , Steinkraus D. and Platt J. C. (2003), “Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis,” Proceedings of the 7th International Conference on Document Analysis and Recognition, no. 3, pp.958-963.
    10. The Korea's Transport Institute Press Release,https://www.koroad.or.kr, 2020.10.13.
    11. Traffic Accident Analysis System,http://taas.koroad.or.kr, 2020.10.13.
    12. Zheng H. , Lin F. , Feng X. and Chen Y. (2020), “A Hybrid Deep Learning Model With Attention-Based Conv-LSTM Networks for Short-Term Traffic Flow Prediction,” IEEE Transactions on Intelligent Transportation Systems, pp.1-11.

    저자소개

    Footnote