Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.20 No.5 pp.100-112
DOI : https://doi.org/10.12815/kits.2021.20.5.100

A Study on Traffic Prediction Using Hybrid Approach of Machine Learning and Simulation Techniques

Yeeun Kim*, Sunghoon Kim**, Hwasoo Yeo***
*Dept. of Civil and Environmental Eng., KAIST
**The Korea Transport Institute
***Dept. of Civil and Environmental Eng., KAIST
Corresponding author : Hwasoo Yeo, hwasoo@kaist.ac.kr
25 May 2021 │ 21 June 2021 │ 3 August 2021

Abstract


With the advent of big data, traffic prediction has been developed based on historical data analysis methods, but this method deteriorates prediction performance when a traffic incident that has not been observed occurs. This study proposes a method that can compensate for the reduction in traffic prediction accuracy in traffic incidents situations by hybrid approach of machine learning and traffic simulation. The blind spots of the data-driven method are revealed when data patterns that have not been observed in the past are recognized. In this study, we tried to solve the problem by reinforcing historical data using traffic simulation. The proposed method performs machine learning-based traffic prediction and periodically compares the prediction result with real time traffic data to determine whether an incident occurs. When an incident is recognized, prediction is performed using the synthetic traffic data generated through simulation. The method proposed in this study was tested on an actual road section, and as a result of the experiment, it was confirmed that the error in predicting traffic state in incident situations was significantly reduced. The proposed traffic prediction method is expected to become a cornerstone for the advancement of traffic prediction.



기계학습과 시뮬레이션 기법을 융합한 교통 상태 예측 방법 개발 연구

김 예 은*, 김 성 훈**, 여 화 수***
*주저자 : 한국과학기술원 건설 및 환경공학과 박사과정
**공저자 : 한국교통연구원 스마트시티교통연구센터 부연구위원
***교신저자 : 한국과학기술원 건설 및 환경공학과 교수

초록


빅데이터의 등장과 더불어 교통 상태 예측은 과거 이력 데이터 분석 방식에 힘을 싣고 발전 되어 왔으나, 이 방법은 관측된 적 없는 돌발 상황에 충분히 대응하지 못한다는 약점이 있다. 본 연구에서는 기계학습과 시뮬레이션 기법의 융합을 통해 돌발 상황 발생 시 교통 상태 예측 정확도 감소를 보완할 수 있는 예측 기법을 제시한다. 데이터 기반 방식의 맹점은 과거에 관측 된 적 없는 데이터 패턴이 인지되었을 때 드러난다. 본 연구에서는 시뮬레이션을 이용하여 과 거 이력 데이터를 보강하는 방법으로 문제를 해결하고자 하였다. 제시한 방법은 기계학습 기 반의 교통 예측을 수행하고, 예측 결과와 실시간으로 수집되는 교통 데이터를 지속적으로 비 교하여 돌발 상황 발생 여부를 판단한다. 돌발 상황이 인지되었을 시, 시뮬레이션을 통해 생성 한 데이터베이스를 활용하여 예측을 수행한다. 본 연구에서 제시한 방법은 실제 도로 구간을 대상으로 검증되었으며, 검증 결과 돌발 상황에서의 교통 상태 예측 정확도 향상을 확인할 수 있었다. 본 연구에서 제시한 융합 교통 예측 방법은 향후 교통 예측 고도화에 이바지할 수 있 을 것으로 전망된다.



    Ⅰ. 서 론

    도시의 교통 문제 해결을 위하여 다양한 지능형 교통 시스템(Intelligent Transportation Systems, ITS) 관련 기술이 연구·개발되고 있으며, 최근에 적용 중인 교통 관리 시스템(Traffic Management System, TMS)와 도로 이용자 보조 시스템은 효과적인 도로 운영과 사용자 편의 향상에 공헌하고 있다. 이러한 시스템들이 교통 상 황 예측치를 기저에 두고 있다는 점에서 교통 상황 예측은 성공적인 ITS 운영의 한 축을 이룬다.

    교통 예측 방법은 접근 방법에 따라 모델 기반(model-based) 방식과 데이터 기반(data-driven) 방식으로 구분 된다. 모델 기반, 즉 시뮬레이션 기법은 교통류 이론을 기반으로 관심 경로의 교통 상태를 모사하며, 예측 대 상 지역의 데이터가 충분하지 않을 경우 유용하게 사용된다. 시뮬레이션 설정에 따라 다양한 상황을 재현할 수 있다는 점은 시뮬레이션 기법의 가장 큰 이점으로, 시뮬레이션 기법은 신규 시스템 효과 검증 등의 용도 로 널리 사용된다 (Kuchipudi and Chien, 2003;Kotsialos et al., 2002). 그러나 교통류 이론이 본질적으로 내포 하고 있는 몇 가지 가정들을 비롯하여 시뮬레이션 수요와 세부 설정이 분석 결과에 미치는 영향이 크다는 점으로 인해 교통 상황 예측 측면에서는 상대적으로 낮은 정확도를 보인다.

    데이터 기반 방법은 도로의 속도, 교통량, 시공간적 특성, 날씨 등의 과거 데이터를 기반으로 통계적 방법 을 사용하여 예측하고자 하는 시점의 교통 상태를 예측하며, 교통 예측에서 좋은 성능을 보여 왔다. 다양한 교통 데이터의 수집 및 저장이 용이해진 현 시점에서, 빅데이터의 등장과 더불어 대부분의 교통 예측 방법론 들은 데이터 기반 방식을 사용하고 있다 (Oh et al., 2015). 다만 과거 이력 데이터 사용 특성상 공사나 사고 등의 예기치 못한 상황, 즉, 과거에 재현된 적 없는 상황에서는 예측 정확도가 현저히 떨어지는 경우가 발생 한다.

    갑작스럽게 발생하는 돌발 상황은 짧게는 수 분에서 길게는 수 시간까지 교통에 영향을 미치기 때문에, 교통 예측 결과의 신뢰성을 높이기 위해서는 돌발 상황에 대응할 수 있는 교통 예측 방법이 필요하다. 이와 관련하여 교통사고 탐지, 사고 위험도 예측 등의 연구가 수행되고 있으나, 그로 인한 교통 상황 예측까지 이 어진 연구는 소수에 불과하다.

    Pan, Demiryurek, and Shahabi의 논문에서는 ARIMA (Auto-Regressive Integrated Moving Average) 방법론에 과거 이력 데이터를 결합하였고, 돌발 상황과 통행 속도의 상관관계 분석을 기반으로 교통 상황 예측 정확도 를 향상시켰다 (Pan et al., 2021). 해당 방법론을 이용한 돌발 상황 발생 시 교통 상태 예측 결과, 통행 속도 평균절대백분율오차(Mean Absolute Percentage Error, MAPE)를 120%에서 45%까지 줄여 성능 향상을 확인하 였다. 해당 연구는 교통 상태 예측에서 돌발 상황을 고려하였다는 점에서 분명 기여가 있으나, 돌발 상황을 입력 정보로 가정하였다는 점과 예측 정확도가 여전히 낮다는 점에서 개선이 필요할 것으로 보인다. Tak and Yeo의 논문에서는 과거 이력 데이터를 기반으로 교통 상태를 예측함과 동시에 돌발 상황에서 교통 시뮬레이 션을 수행하는 방법을 제안하였다 (Tak and Yeo, 2016). 이 연구에서는 사고 유형과 날씨에 따라 도로용량을 조절하여 사고 상황 시뮬레이션을 구현하였고, 시뮬레이션 결과로 데이터 기반 방식의 예측 결과를 대체하 였다. 이는 모델 기반 방식과 데이터 기반 방식을 상호보완적으로 활용한 대표적인 예시이다. 그러나 사고의 규모나 지속 시간을 빠르게 파악할 수 없는 실시간 교통 예측에서 시뮬레이션으로 돌발 상황을 모사하는 것 은 상당히 어려운 일이다.

    선행 연구를 통해 알아본 기존 연구는 돌발 상황 발생에 의한 교통 상태를 예측하기 위하여 돌발 상황 세 부사항을 입력 값으로 받아야 한다는 한계점이 있으며, 이는 제시된 방법들의 실시간 교통 예측에 활용을 막 는 장벽이 된다. 본 연구에서는 이러한 기존 교통 예측 방법의 문제점을 보완할 수 있도록 기계학습과 시뮬 레이션 기법의 융합을 통하여 돌발 상황에 신속하게 대응할 수 있는 교통 예측 기법을 제시하고자 한다. 논 문의 구성은 다음과 같다. 다음 장에서 개발 알고리즘에서 사용한 기계학습 알고리즘과 교통 시뮬레이션 모 델에 관해 설명하고, 3장에서 본 연구에서 제시하는 교통 예측 방법 프레임워크와 상세 내용을 소개한다. 개 발 모델 성능 평가를 위하여 실제 도로 구간에서 사례 연구를 수행하였으며, 4장에서 해당 사례 연구를 위한 방법과 내용을 설명한다. 사례 연구 결과는 5장에서 확인할 수 있으며, 마지막으로 6장에서 연구 내용 요약 과 더불어 추후 연구 방향을 논의하며 논문을 마무리한다.

    Ⅱ. 이론적 고찰

    본 연구에서 소개하는 교통 예측 방법은 시뮬레이션과 기계학습을 융합하여 사용한다. 기계학습으로는 교 통 예측에서 높은 정확도를 보이는 k-최근접 이웃 이론(k-nearest neighborhood, k-NN) 기반의 다계층 k-최근접 이웃 알고리즘을 사용하였다. 교통 시뮬레이션의 경우 목표로 하는 시뮬레이션 속도, 모사 정도에 따라 다양 한 선택지가 존재한다. 실시간 교통 예측에 활용하고자 하는 실리적인 관점에서 본 연구에서 사용되는 시뮬 레이션은 세밀한 교통현상 모사보다는 돌발 상황이 발생하였을 경우 유의미한 차이를 보여줄 수 있는 것이 중요하다. 또한 3장에서 후술할 시뮬레이션 사용 목적과 관련하여 빠른 시뮬레이션 속도가 요구되기에 대표 적 거시 모델인 셀 전이 모델(Cell Transmission Model, CTM)을 사용하였다 (Smith et al., 2002). 본 장에서는 각각에 대한 상세 내용을 설명한다.

    1. 다계층 k-최근접 이웃 알고리즘 (Multilevel k-Nearest Neighborhood algorithm, Mk-NN)

    k-최근접 이웃 알고리즘(k-nearest neighborhood, k-NN)은 과거 이력 데이터 중 현재 데이터와 유사한 k개를 선택하고, 이를 기반으로 미래 데이터를 예측하는 방법으로 단기(short-term) 교통 예측에서 유용하게 사용된 다. Tak et al.이 제시한 Mk-NN은 계층적 구조를 기반으로 교통 데이터 예측 정확도를 높인 알고리즘으로 장·단기 교통 예측 모두에서 뛰어난 성능을 보였다 (Tak et al., 2014).

    Mk-NN은 교통 상태와 연관이 있는 날짜 특성, 도로의 광역구역(Global section), 지역구역(Local section)을 기준으로 과거 이력 데이터를 다계층으로 분류한다. 일차적으로 요일, 휴일, 날씨를 기준으로 날짜 특성에 따라 데이터를 분류한다. 예측 대상 지역은 공간적으로 수만 미터 범위의 광역구역과 광역구역 내부 수천 미 터 범위의 지역구역으로 분류된다. 날짜 특성이 일치하는 데이터 중 k-NN 알고리즘을 통해 광역구역 단위로 수요패턴과 통행량 패턴이 유사한 데이터를 선별하여 2차 분류를 수행한다. 광역구역에서 분류된 데이터 내 에서 k-NN 알고리즘을 이용하여 지역구역 단위로 속도 패턴과 점유율 패턴이 유사한 데이터를 찾는다. 여기 서 얻은 결과는 식 (1)을 통해 도로의 링크별 속도 및 교통량 예측에 활용된다. Mk-NN의 프레임워크는 <Fig. 1>에서 확인할 수 있으며, 자세한 내용은 (Tak et al., 2014;Tak et al., 2016)에서 확인할 수 있다.

    P ( t + Δ t ) = k = 1 K L V k l ( t ) d k l ( t ) / 1 d k l t , d n l < d n + 1 l for n [ 1 , K G ) , K L _ K G
    (1)

    <Fig. 1>

    Data-driven framework for predicting speed and travel time in real-time (Tak et al., 2016)

    KITS-20-5-100_F1.gif

    여기서,

    • Pl(t): 시간 t때, 도로 링크 l의 예측 속도 또는 교통량

    • KG: 광역구역 매칭에 사용할 최근접 이웃 수

    • KL: 지역구역 매칭에 사용할 최근접 이웃 수

    • Δt: 예측 주기

    • V k l ( t ) : 시간 t때, 도로 링크 l의 광역구역 분류를 수행한 과거 데이터 k의 속도 또는 교통량

    • d k l ( t ) : 시간 t때, 도로 링크 l의 실시간 데이터와 과거 데이터 k의 유클리드 거리

    2. 셀 전이 모델 (Cell Transmission Model, CTM)

    CTM은 1994년 Daganzo가 제안한 거시 교통 시뮬레이션 모델로 연속교통류 재현에 있어 괄목할 만한 성 능이 입증되었다 (Daganzo, 1994). CTM은 도로구간을 셀(cell)로 나누고, 셀 내부 도로 상태가 균질 (homogeneous)하다는 가정하에 셀 간 차량 이동량을 계산한다. 교통량(flow)는 셀의 수요와 공급 교통량에 따 라 결정되며, 식 (2)와 같이 표현된다.

    q = min [ v f k , q max , w ( k jam k ) ] , 0 _ k _ k jam
    (2)

    여기서,

    • q: 교통량,

    • κ: 밀도,

    • υf: 자유흐름 속도,

    • w: 충격파 속도,

    • qmax: 최대 교통량,

    • κjam: 혼잡 밀도

    따라서 상류부 셀 i에서 하류부 셀 i+1로 이동하는 교통량 yi는 식 (3)과 같이 표현할 수 있다.

    y i ( t + δ t ) = min [ n i ( t ) , Q i ( t ) , w υ ( N i ( t ) n i + 1 ( t ) ) ]
    (3)

    여기서,

    • yi (t ): 시간 t때, 셀 i에서 셀 i+1로 이동하는 교통량

    • t: 시간,

    • δt: 시뮬레이션 타임스텝

    • ni : 셀 i의 차량 수,

    • Ni : 셀 i의 최대 차량 수,

    • Qi : 셀 i의 최대 전송량

    Ⅲ. 기계학습과 시뮬레이션 기법을 융합한 교통 예측 기법

    본 연구에서는 사고나 공사 등의 돌발 상황에 대응이 가능한 교통 예측 알고리즘을 개발하고자 하며, 이 를 위하여 기계학습과 시뮬레이션 기법을 융합하여 활용하였다. 앞서 데이터 기반 방식의 문제점으로 관측 된 적 없는 패턴에서의 예측 성능 저하를 언급하였다. 본 연구에서 제안하는 알고리즘의 핵심 아이디어는 교 통 예측 과정에서 돌발 상황을 판단하고, 돌발 상황 발생 시 교통 예측에 사용할 과거 이력 데이터를 강화하 기 위하여 교통 시뮬레이션을 활용하는 것이다. 다양한 유형의 교통 돌발 상황은 갑작스러운 통행속도 저하 로 이어진다. 제시하는 알고리즘은 돌발 상황에 대한 입력 값이 필요했던 선행연구들과 다르게 예측 주기마 다 통행속도 변화 탐지를 통해 돌발 상황을 판단하여 대응하므로 실시간 교통 예측에서의 활용이 가능하다. 또한 시뮬레이션을 통해 돌발 상황의 영향으로 인해 발생할 수 있는 다양한 속도 프로파일을 과거 이력 데 이터로 활용하여, 과거에 재현된 적 없는 상황에 취약한 데이터 기반 예측의 약점을 보완하고 과대 오차 발 생 가능성을 낮출 수 있다.

    <Fig. 2>, <Fig. 3>을 통해 제안하는 알고리즘 프레임워크를 확인할 수 있다. 본 시스템은 크게 Mk-NN 기 반 교통 예측 모듈(모듈 1), 돌발 상황 판단 모듈(모듈 2), 돌발 상황 대응 교통 예측 모듈(모듈 3)로 구성된 다. 교통 예측은 기본적으로 모듈 1의 Mk-NN 방법을 통해 이루어진다. <Fig. 3> 상단 그림의 검은 실선은 실 시간 관측값으로 과거 이력 데이터(점선)과의 매칭을 통해 예측 시간 간격(Δt) 이후까지의 교통 상황(붉은 실선)을 예측한다.

    <Fig. 2>

    Framework of the hybrid simulation and machine learning methods for traffic prediction

    KITS-20-5-100_F2.gif
    <Fig. 3>

    Hybrid traffic prediction procedure in case of event situation

    KITS-20-5-100_F3.gif

    해당 예측값은 다음 예측 주기에서 모듈 2의 입력값으로 사용된다. 모듈 2는 이전 주기의 예측값과 실시 간 관측 데이터를 비교하여 오차가 특정 기준 이상일 경우 돌발 상황으로 판별한다. <Fig. 3> 하단 그래프의 검은 실선은 시간 t+Δt때의 실시간 관측 데이터로, 돌발 상황 판단을 위하여 최근 비교 구간(te)동안의 예 측값(붉은 실선)과 관측값(검은 실선)을 비교한다. 이때, 전체 예측값이 아닌 최근 일부 구간을 비교하는 것 은 이미 종료된 돌발 상황의 오차가 다음 예측에 영향을 주는 등의 영향을 줄이기 위함이며, 비교 구간의 길 이는 예측 대상 지역의 교통 데이터 취득 주기, 평균 속도 저하 지속 시간 등을 고려하여 정할 수 있다. 모듈 2의 돌발 상황 판단 여부에 따라 모듈 1 또는 모듈 3을 통해 다음 주기 예측이 이루어지며, 식 (4)와 같이 표 현된다.

    P l ( t + Δ t ) = { f 1 ( · ) if T = t t e t ( P i l ( T ) O i l ( T ) ) ( c min , c max ) f 3 ( · ) if T = t t e t ( P i l ( T ) O i l ( T ) ) ( c min , c max )
    (4)

    여기서,

    • Pl(t): 시간 t때, 도로 링크 l의 예측 속도 또는 교통량

    • Ol(t): 시간 t때, 도로 링크 l의 실제 속도 또는 교통량

    • fi (∙): 모듈 i를 이용한 교통 예측값

    • Δt: 예측 주기

    • te: 돌발 상황 판단 비교 기간 (te <Δt)

    • cmin: 돌발 상황 판단 기준 최솟값

    • cmax: 돌발 상황 판단 기준 최댓값

    모듈 3은 돌발 상황 대응 교통 예측 모듈로 <Fig. 4>와 같이 수행된다. 모듈 3에는 교통 데이터 생성을 위 한 시뮬레이션(모듈 3-1)과 교통 상태 예측을 위한 세부 모듈(모듈 3-2)가 있으며, 모듈 1과 비교하여 모듈 3 의 가장 큰 특이점은 교통 시뮬레이션(모듈 3-1)과 시뮬레이션을 통해 생성한 교통 데이터다. 앞서 모델 기반 방식의 이점으로 시뮬레이션 설정에 따라 다양한 상황을 재현할 수 있음을 언급하였다. 시뮬레이션 교통 데 이터는 기존 과거 이력 데이터를 보완하는 것이 주요 목적이며, 데이터 기반 방법의 데이터 원으로 사용되는 만큼 돌발 상황의 종류나 구체적인 교통 상황보다는 돌발 상황의 결과로 나타날 수 있는 다양한 교통 상태 데이터를 다량 생성하는 것이 중요하다. 따라서 본 알고리즘에서는 시뮬레이션 수행 속도가 빠르고 전체적 인 교통 상황 모사가 가능한 거시 교통 시뮬레이션 모델인 CTM을 사용하였다. 모듈 3의 교통 예측 모듈은 k-NN방법을 기반으로 하며, 예측값은 식 (5)와 같이 산출된다. 식 (4)의 f1(∙), f3(∙)이 각각 식 (1), 식 (5) 로 대체될 수 있다.

    P l ( t + Δ t ) = 1 K k = 1 K S k l ( t ) , d n l < d n + 1 l for n [ 1 , K )
    (5)

    <Fig. 4>

    Framework of the Module 3

    KITS-20-5-100_F4.gif

    여기서,

    • Pl(t): 시간 t때, 도로 링크 l의 예측 속도 또는 교통량

    • K: 예측에 사용할 최근접 이웃 수

    • Δt: 예측 주기

    • S k l ( t ) : 시간 t때, 도로 링크 l의 시뮬레이션 교통 데이터 k의 속도 또는 교통량

    • d k l ( t ) : 시간 t때, 도로 링크 l의 실시간 데이터와 시뮬레이션 교통 데이터 k의 유클리드 거리

    Ⅳ. 사례 연구 방법 및 내용

    1. 교통 예측 대상지

    본 연구에서 제시한 교통 예측 기법의 성능을 검증하기 위하여 미국 캘리포니아 SR22-E 고속도로의 교통 상태를 예측하였다. SR22-E 고속도로는 미국 캘리포니아주에서 가든 그로브를 거쳐 로스앤젤레스 남부와 오 렌지카운티 북부를 운행하는 동서 방향 도로로 PM(Postmile) 4.897부터 PM 14.261까지 총 15.07km의 도로를 예측 대상지로 선정하였다. 이 구간은 11개의 진입 차선(on-ramp)와 12개의 진출 차선(off-ramp)이 존재하며, 각 램프와 주도로에 설치된 루프 검지기를 통해 5분마다 교통정보를 수집한다 (PeMS, Caltrans Performance Measurement System). <Fig. 5>에서 예측 대상지의 도로 구조를 확인할 수 있으며, 해당 도로 구간은 차로 감 소가 이루어지는 PM 10 부근에서 특히 정체가 많이 발생한다.

    <Fig. 5>

    Case study cite: SR22-E

    KITS-20-5-100_F5.gif

    2. 데이터 구축

    1) 과거 이력 데이터 구축

    본 연구에서 제시한 교통 예측 기법을 수행하기 위해서는 과거 이력 데이터와 시뮬레이션 교통 데이터 구 축이 필요하다. 주요 데이터원은 PeMS에서 제공하는 고속도로 교통 데이터로 2017년 9월 1일 ~ 2019년 7월 31일까지의 5분 단위 속도, 교통량 데이터를 구축하여 Mk-NN의 과거 이력 데이터로 사용하였다. 구축 데이 터를 Mk-NN에 활용하기 위하여 일차적으로 요일에 따라 데이터를 분류하였으며, 다음으로 2개의 광역구역 과 5개의 지역구역으로 구분하였다. 광역구역과 지역구역 구분은 <Fig. 5>의 하단에서 확인할 수 있다.

    2) 시뮬레이션 교통 데이터 구축

    다음으로 시뮬레이션 교통 데이터를 구축하기 위하여 예측 대상지에서 CTM으로 시뮬레이션을 수행하였 다. 시뮬레이션 단위시간은 30초, 자유 흐름 속도는 미국 캘리포니아주의 고속도로 제한속도인 104.6km/h (65mph)로 설정하였다. Daganzo의 논문에서 제시한 셀 길이 제한 조건에 따라 도로를 총 18개의 셀로 구분하 였고, 셀의 길이는 약 0.85km이다 (Daganzo, 1994). 그 외 시뮬레이션에 필요한 교통 변수는 분석 대상 지역 의 과거 이력 데이터를 분석하여 결정하였으며, <Table 1>에 값을 기재하였다. 정산 교통 변수를 이용하여 대상 지역의 시뮬레이션을 구현한 결과는 <Fig. 6>에서 확인할 수 있다. 두 그래프는 2019년 8월 1일의 교통 량에 관한 시공도로 정산 교통 변수가 해당 지역의 교통 특성을 대표할 수 있음을 보여준다.

    <Table 1>

    CTM parameter values

    KITS-20-5-100_T1.gif
    <Fig. 6>

    Comparison of the (a) PeMS data and (b) CTM simulation result using calibrated parameter

    KITS-20-5-100_F6.gif

    교통 수요는 요일별 패턴을 고려하여 월요일, 화/수/목요일, 금요일, 토요일, 일요일을 구분하였으며, 각 요 일에 해당하는 2018년 PeMS 교통량 데이터의 평균값을 취하여 5분 단위의 수요를 생성하였다. 요일에 따라 수요 수준을 동일하게 유지한 채로 돌발 상황 발생 대상 도로 구간의 도로 용량을 저하시켜 정체나 통행 속 도 저하 등을 모사하고자 하였다. 18개의 셀 각각에 각기 다른 돌발 상황 시작 시각, 지속 시간, 도로 용량 저하 수준의 조합을 적용하여 시뮬레이션을 수행하였다. 돌발 상황 시작 시각은 오후 1시~8시까지 10분 간 격으로 지정하였고, 돌발 상황 지속 시간은 5~30분까지 5분 단위로 설정하였다. 도로 용량 저하량은 셀별 차 로 수에 따라 다양하게 조절하였다. 도로 용량 저하의 영향이 충분히 드러나지 않은 데이터를 제외하여 총 45,714개의 교통 상태가 모듈 3을 위한 시뮬레이션 교통 데이터로 구축되었다.

    3. 교통 예측 세부사항 설정

    교통 예측 대상 기간은 2019년 8월 1일~2019년 9월 30일 13:00~20:00로 PeMS에서 제공받은 해당 날짜의 데이터를 실시간 데이터로 사용하였으며, 예측 시간 간격(Δt)은 15분으로 설정하였다. 모듈 1의 Mk-NN에 사 용한 근접이웃 개수 k는 광역구역과 지역구역 매칭에서 각각 20개, 3개로 설정하였으며, 모듈 3의 k-NN에 사 용한 근접이웃 개수는 3개로 선정하였다. 모듈 2는 매 예측 시간 간격마다 최근 5분 데이터를 비교하여 속도 차가 –4km/h (Mk-NN 예측 결과의 속도 차 10분위 값) 이하 또는 6.1km/h (Mk-NN 예측 결과의 속도 차 90 분위 값) 이상일 경우 돌발 상황으로 판단하였다. 교통 예측 모델의 세부사항은 <Table 2>에 명시하였다.

    <Table 2>

    Prediction setting

    KITS-20-5-100_T2.gif

    Ⅴ. 사례 연구 결과

    1. 평가 방법

    교통 상황 예측 결과는 루프검지기별 속도로 표출하였으며, 정량적 평가를 위하여 예측대상 지역의 통행 시간을 계산하여 평균절대백분율오차(Mean Absolute Percentage Error, MAPE)를 산출하였다. 산출 식은 다음 과 같다.

    M A P E = | a ( t ) d l d / υ p r e d , d ( t ) a ( t ) | · 100 a ( t ) = d l d / υ d ( t )
    (3)

    여기서,

    • a(t): 시간 t에 상류부에서 출발한 차량의 대상지 실제 통행 시간

    • ld: 루프검지기 d에 해당하는 도로 구간 길이

    • υd(t): 시간 t에 관측한 루프검지기 d의 통행 속도

    • υpred,d(t): 시간 t에 예측한 루프검지기 d의 통행 속도

    2. 사례 연구 결과 및 개발 알고리즘 성능 평가

    개발 기법 성능 평가를 위하여 Mk-NN과 개발 기법을 사용하여 2019년 8월 1일~2019년 9월 30일까지 61 일에 대한 교통 예측을 수행하였다. <Fig. 7>에서 2019년 9월 30일의 관측 데이터와 예측 결과를 확인할 수 있다. 세 개의 그래프는 속도에 관한 시공도로 색이 밝을수록 속도가 낮음을 의미하며, 이는 해당 시공간에 정체가 발생하였음을 의미한다. (a)는 관측 데이터의 속도 시공도이며, 차로가 일시적으로 증가하였다 감소 하는 PM 10 부근에서 속도의 급격한 증감이 발생하는 것을 확인할 수 있다. 한편 PM 13 부근에서 16시부터 19시 사이의 오후 첨두 시간에 상대적으로 넓은 지역에 정체가 발생한다. 이 정체는 상류부로 전파되어 PM 8 부근에서 일시적으로 해소되었다가 또 다른 강한 정체가 발생과 함께 PM 6 부근까지 뚜렷한 역삼각형 형 태의 정체를 형성한다.

    <Fig. 7>

    Speed contour plot of (a) Observed data, (b) Mk-NN, and (c) Proposed Method (30th Sep. 2019)

    KITS-20-5-100_F7.gif

    <Fig. 7> (b)(c)는 각 Mk-NN과 개발 방법으로 예측한 교통상황을 보여준다. 두 방법 모두 전반적인 교 통 상황과 도로 형태에 의해 발생하는 교통 상태 변화 예측에서 관측 데이터와 유사함을 보였으나 정체 예 측에 있어 차이를 보인다. 특히 Mk-NN은 정체의 전파 예측에 거의 실패하였다고 볼 수 있는데, 오후 첨두 시간대(16~19시)에 PM 10 상류부의 정체는 거의 예측하지 못하였다. 반면 개발 방법으로 예측한 결과에서는 전체적인 정체 패턴이 뚜렷하게 나타난다. 다만, 개발 기법으로 예측한 결과에서는 속도에 다른 모자이크 형 태의 불연속적인 속도 변화가 두드러지는데, <Fig. 8>의 예시를 통해 면밀한 설명을 하고자 한다.

    <Fig. 8>

    The example of the suggested prediction model mechanism in case of unexpected speed drop

    KITS-20-5-100_F8.gif

    <Fig. 8>은 갑작스러운 속도 저하가 발생한 상황에서 제안 모델의 작동 메커니즘 예시를 보여준다. 검은 실선은 실시간 데이터를 의미하며, 빨간색, 초록색은 모듈 1, 모듈 3의 과거 이력 데이터, 파란색은 예측 결 과를 의미한다. 노란 박스를 통해 예측값과 관측값의 차이를 표시하였다. 가장 좌측의 노란 박스는 관측값에 서 갑작스러운 속도 저하가 시작되었을 때 예측값의 오차로 돌발 상황 기준을 넘는 값으로 인해 모듈 2에서 돌발 상황으로 판단된다. 다음 예측 주기에서 모듈 3을 통한 예측이 이루어지며 관측값과의 오차가 줄어들 게 되는데, 이 상황을 모듈 2에서는 일반 상황으로 판단한다. 이는 모듈 2에서 현재 사용하고 있는 모듈의 정보를 고려하지 않기 때문이며, 돌발 상황 판단 결과에 따라 모듈 1로 예측된 결과는 또다시 높은 오차를 보인다. 이러한 상황의 반복은 시간에 따른 예측 속도 편차를 크게 만들고, <Fig. 7> (c)에서 확인할 수 있는 불연속적인 속도 변화가 나타나게 된다.

    <Fig. 7>의 A(PM 6.447), B(PM 7.227) 지점은 특히 이러한 특징이 잘 드러난 지점으로 각 지점에 해당하는 루프검지기에서 얻은 시간에 따른 도로 평균 속도를 <Fig. 9>에 표시하였다. 검은 실선은 관측값, 파란 실선 과 붉은 실선이 각각 Mk-NN, 개발 기법으로 예측한 결과다. 그래프에 표시된 원은 모듈 2를 통해 돌발 상황 으로 판별된 지점이다. <Fig. 7>에 따르면 루프검지기 A 구간은 시간에 따른 속도 변화가 크지 않으며, 18시 직전 미약한 속도 저하가 발생한다. Mk-NN으로 예측한 결과에서는 이 속도 저하를 예측하였으나 정체 발생 시간 예측에 시차(time lag)가 있고, 속도 저하 폭도 관측 데이터와 비교하여 10km/h 이상 차이가 발생한다. 개발 기법으로 예측한 결과는 동일한 시차가 존재하지만 속도 저하 정도는 더 근사하게 예측하였다.

    <Fig. 9>

    Speed profile of detector (a) detector A (PM 6.447) and (b) detector B (PM 7.227)

    KITS-20-5-100_F9.gif

    루프검지기 B 구간은 17시부터 두 시간가량 강한 정체가 발생한다. 정체 발생 전까지는 Mk-NN과 개발 기 법 모두 관측값과 비슷한 패턴을 유지하였으나 정체 구간에서 양상이 크게 달라진다. Mk-NN은 정체 시작 지점의 속도 저하를 예측하지 못하여 오차가 크게 발생한다. 개발 방법은 이 지점을 돌발 상황으로 판별하였 고, 시뮬레이션 교통 데이터를 기반으로 예측을 수행하여 속도 변화를 따라간다. 그러나 오차가 줄어들자 다 음 상황이 일반 상황으로 판단되어 일시적으로 Mk-NN과 같은 예측값을 보이고, 이후 두 번째 속도 저하가 발생한다. <Fig. 8>에서 설명한 상황이 명확히 드러나는 부분이다. 이 현상은 정체 발생과 더불어 빈번하게 발생하는 오차로 추후 모듈 2의 개선이 필요할 것으로 보인다. 한편, 두 번의 속도 저하 모두 실제 상황보다 과하게 예측되었는데, 역시 추후 세부 모듈 개선을 통해 해결해야 할 문제로 남아있다.

    다음으로 예측 기간 61일에 대하여 예측 주기마다 식 (3)을 통해 통행 시간 MAPE를 산출하여 분석하였 다. <Table 3>에 따르면 Mk-NN을 이용하였을 때 평균 MAPE는 4.17%, 개발 방법 이용하였을 때는 3.85%로 약 7.67%의 성능 향상을 관찰하였으며, 표준 편차는 0.5%P 가량 감소하였다. 추가적으로 개발 기법에서 주 안점을 두고 있는 돌발 상황 발생 시 교통 상태 예측 성능을 확인하기 위하여 PeMS에서 제공하는 교통 돌 발 상황 데이터를 함께 사용하였다. 이 데이터는 캘리포니아 고속도로 순찰대(California Highway Patrol, CHP)에서 수집된 정보로 각종 교통 돌발 상황의 세부사항이 기록되어 있다. 예측 대상 기간 중 돌발 상황이 발생한 기간의 데이터를 따로 분석하였으며, 돌발 상황이 발생하였을 때 예측 오차는 종래 6.44%에서 5.67% 로 11.96% 감소하였다. 해당 분석 결과는 본 연구에서 제안한 교통 예측 기법이 돌발 상황의 교통 예측 성능 향상에 기여할 수 있음을 보여준다.

    <Table 3>

    Average MAPE obtained from Mk-NN and proposed method

    KITS-20-5-100_T3.gif

    Ⅵ. 결 론

    본 연구에서는 돌발 상황에 대응할 수 있는 교통 예측 기법을 개발하고자 하였으며, 이를 위하여 기계학 습과 시뮬레이션 기법을 융합한 교통 예측 기법을 제시하였다. 종래 장·단거리 교통 예측에서 높은 성능을 보인 Mk-NN을 기저 예측 모델로 두고, 교통 시뮬레이션으로 다양한 속도 프로파일 데이터를 구축하여 데이 터 기반 기법의 약점을 보완하였다. 제안한 교통 예측 기법은 크게 3개의 모듈로 구성되며, 일반적인 상황에 서는 Mk-NN을 이용한 교통 예측을 수행한다(모듈 1). 모듈 2에서는 매 예측 주기마다 예측값과 실시간 관측 값 비교를 통해 돌발 상황 발생 유무를 판단한다. 돌발 상황이 탐지되었을 경우 사전에 구축해 둔 시뮬레이 션 교통 데이터를 데이터 원으로 사용하여 예측을 수행한다(모듈 3). 본 연구에서는 시뮬레이션 교통 데이터 구축을 위해 수행 속도가 빠르고 교통 상황 모사에서 성능이 입증된 CTM을 사용하였다.

    개발 기법의 사례 연구 및 성능 검증을 위하여 미국 캘리포니아주의 SR22-E 고속도로를 예측 대상지로 선정하여 교통 예측을 수행하였다. 2년간의 과거 이력 데이터와 시뮬레이션 데이터를 사용하여 예측을 수행 하였고, 관측지의 돌발 상황 발생 데이터를 활용하여 돌발 상황에서의 예측 정확도를 분석하였다. 전체적인 교통 예측에서 7.67%의 성능 향상이 있었으며, 돌발 상황에서는 11.96%의 성능 향상을 이룩하였다. 이는 괄 목할만한 수치로 본 연구에서 제안한 기계학습과 시뮬레이션 융합 예측 기법이 갑작스러운 속도 변화 등의 돌발 상황에 의한 교통 상태 예측에 효과가 있음을 방증한다.

    본 논문은 돌발 상황에 대응할 수 있는 교통 예측 기법을 제안했다는 점에서 의미가 있다. 모듈 2는 돌발 상황 정보를 입력값으로 사용하지 않음으로서 종래 모델들이 봉착했던 한계점을 극복하고, 제안 모델이 실 시간 교통 예측에 사용될 가능성을 제시한다. 모듈 3은 데이터 기반 예측 방법과 시뮬레이션 기반 예측 방법 을 상호 보완적으로 활용하기 위한 시도로 돌발 상황으로 인한 교통 상태 패턴 변화에 대응하기 위한 훌륭 햔 시도로 여겨진다. 한편 현재 알고리즘은 돌발 상황 탐지 및 예측에 있어 단순한 형태를 취하고 있으며, 이로 인해 급격한 속도 변화가 반복되는 상황이나 실제보다 과도한 속도 저하 예측이 나타난다. 교통 예측 정확도를 높이고 예측 결과의 안정성을 확보하기 위하여 개발 기법의 프레임워크를 기반으로 세부 모듈의 고도화를 위한 후속 연구가 필요할 것으로 보인다.

    ACKNOWLEDGEMENTS

    본 연구는 국토교통부 교통물류연구사업의 연구비지원(21TLRP-B146733-04)에 의해 수행되었습니다.

    Figure

    KITS-20-5-100_F1.gif

    Data-driven framework for predicting speed and travel time in real-time (Tak et al., 2016)

    KITS-20-5-100_F2.gif

    Framework of the hybrid simulation and machine learning methods for traffic prediction

    KITS-20-5-100_F3.gif

    Hybrid traffic prediction procedure in case of event situation

    KITS-20-5-100_F4.gif

    Framework of the Module 3

    KITS-20-5-100_F5.gif

    Case study cite: SR22-E

    KITS-20-5-100_F6.gif

    Comparison of the (a) PeMS data and (b) CTM simulation result using calibrated parameter

    KITS-20-5-100_F7.gif

    Speed contour plot of (a) Observed data, (b) Mk-NN, and (c) Proposed Method (30th Sep. 2019)

    KITS-20-5-100_F8.gif

    The example of the suggested prediction model mechanism in case of unexpected speed drop

    KITS-20-5-100_F9.gif

    Speed profile of detector (a) detector A (PM 6.447) and (b) detector B (PM 7.227)

    Table

    CTM parameter values

    Prediction setting

    Average MAPE obtained from Mk-NN and proposed method

    Reference

    1. Daganzo C. F. (1994), “The cell transmission model: A dynamic representation of highway traffic consistent with the hydrodynamic theory,” Transportation Research Part B: Methodological, vol. 28, no. 4, pp.269-287.
    2. Kotsialos A. et al. (2002), “Traffic flow modeling of large-scale motorway networks using the macroscopic modeling tool METANET,” IEEE Transactions on Intelligent Transportation Systems, vol. 3, no. 4, pp.282-292.
    3. Kuchipudi C. M. and Chien S. I. (2003), “Development of a hybrid model for dynamic travel-time prediction,” Transportation Research Record, vol. 1855, no. 1, pp.22-31.
    4. Oh S. et al. (2015), “Short-term travel-time prediction on highway: A review of the data-driven approach,” Transport Reviews, vol. 35, no. 1, pp.4-32.
    5. Pan B. , Demiryurek U. and Shahabi C. (2021), “Utilizing real-world transportation data for accurate traffic prediction,” 2012 IEEE 12th International Conference on Data Mining.
    6. Smith B. , Billy L. , Williams M. and Keith Oswald R. (2002), “Comparison of parametric and nonparametric models for traffic flow forecasting,” Transportation Research Part C: Emerging Technologies, vol. 10, no. 4, pp.303-321.
    7. Tak S. and Yeo H. (2016), “Development of Traffic Prediction and Optimal Traffic Control System for Highway based on Cell Transmission Model in Cloud Environment,” Journal of Korea Institute of Intelligent Transport Systems, vol. 15, no. 4, pp.68-80.
    8. Tak S. et al. (2014), “Real-time travel time prediction using multi-level k-nearest neighbor algorithm and data fusion method,” Computing in Civil and Building Engineering, pp.1861-1868.
    9. Tak S. et al. (2016), “Development of a Data‐Driven Framework for Real‐Time Travel Time Prediction,” ComputerAided Civil and Infrastructure Engineering, vol. 31, no. 10, pp.777-793.
    10. The Caltrans Performance Measurement System(PeMS),http://pems.dot.ca.gov, 2021.03.04.

    저자소개

    Footnote