Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.17 No.4 pp.86-98
DOI : https://doi.org/10.12815/kits.2018.17.4.86

Evaluation of Travel Time Prediction Reliability on Highway Using DSRC Data

Daechul Han*, Joohyon Kim**, Seoungbum Kim***
*ITS Division, Korea Expressway Corporation
**Traffic management center, Korea Expressway Corporation
***Division of Architectural, Urban, and Civil Engineering / Engineering Research Institute, Gyeongsang National University

Corresponding author : Seoungbum Kim, kimsb@gnu.ac.kr
20180704 │ 20180724 │ 20180814

Abstract


Since 2015, the Korea Expressway Corporation has provided predicted travel time information ,which is reproduced from DSRC systems over the extended expressway network in Korea. When it is open for public information, it helps travelers decide optimal routes while minimizing traffic congestions and travel cost. Although, sutiable evaluations to investigate the reliability of travel time forecast information have not been conducted so far. First of all, this study seeks to find out a measure of effectiveness to evaluate the reliability of travel time forecast via various literatures. Secondly, using the performance measurement, this study evaluates concurrent travel time forecast information in highway quantitatively and examines the forecast error by exploratory data analysis. It appears that most of highway lines provided reliable forecast information. However, we found significant over/under-forecast on a few links within several long lines and it turns out that such minor errors reduce overall reliability in travel time forecast of the corresponding highway lines. This study would help to build a priority for quality control of the travel time forecast information system, and highlight the importance of performing periodic and sustainable management for travel time forecast information.



DSRC 기반 고속도로 통행 소요시간 예측정보 신뢰성 평가

한 대 철*, 김 준 현**, 김 승 범***
*주저자 : 한국도로공사 ITS처 차장
**공저자 : 한국도로공사 교통센터 교통운영팀 과장
***교신저자 : 경상대학교 건축도시토목공학부/공학연구원(ERI) 교수

초록


한국도로공사는 2015년부터 전국 톨게이트 간 DSRC기반 통행 소요시간 예측정보를 제공 하고 있다. 통행 소요시간 예측정보는 고속도로 이용자들의 합리적인 노선 결정을 지원하여 정체상황을 최소화 시킬 수 있다는 측면에서 공공데이터로서 신뢰도가 보장되어야 하며 지 속적인 품질관리가 필요하다. 따라서 본 연구에서는 국내외 선행연구를 통해 통행 소요시간 예측정보 평가를 위한 측정지표 기준을 고찰해보았으며, 한국도로공사에서 운영하고 있는 전 노선을 대상으로 소요시간 예측정보를 정량적으로 평가해 보았다. 더불어, 예측오차에 원 인을 파악하기 위해 EDA 분석을 수행하였다. 대부분의 노선에서 제공되는 예측정보의 신뢰 성은 해당 기준을 충족시키는 것을 알 수 있었다. 다만 다수의 구간으로 구성된 장대 노선의 경우 일부 소수의 구간에서 과대 또는 과소 추정오차 발생이 노선 전체의 예측 정보 신뢰도 에 영향을 줄 수 있음을 확인하였으며, 이러한 문제 노선은 상당히 오랜 기간 존치되고 있었 음을 알 수 있었다. 본 연구는 국내에서 운영 중인 거의 모든 고속도로 통행시간 예측정보를 정량적으로 평가한 첫 사례라는 점에서 의의가 있다.



    Korea Expressway Corporation

    Ⅰ. 서 론

    1. 연구 배경 및 목적

    국토교통부 통계에 따르면 우리나라 누적 자동차 등록대수는 2017년 말 기준 2,252만 8,295대로 전년대비 3.3% 증가한 수치이며, 매년 자동차 등록 추이는 오름세를 보이고 있다. 매년 증가하는 교통량으로 인한 교 통정체를 해결하기 위해 도로 신설이나 차로 확장과 같은 교통설비 용량증대는 공사기간과 용지 매입비용 등의 한계로 근원적인 문제해결 방법으로 보기는 어렵다. 그 대안으로 국내에서는 1990년대부터 기존 도로 시설의 운영효율을 극대화하여 교통 혼잡을 완화하기 위해 지능형 교통체계(ITS, Intelligent Transportation System)를 도입하여 실시간 교통정보를 제공하고 있다. 한국도로공사 역시 1993년 고속도로 교통관리시스템 구축 이후 실시간 고속도로 교통정보를 제공하기 시작하였고, 실시간 교통정보의 신뢰성을 향상시키기 위해 2012년 단거리전용통신(DSRC, Dedicated Short Range Communication)을 활용한 하이패스 교통정보시스템을 구축하였다(Shin et al., 2014).

    특히, 실시간 소통정보 중 통행 소요시간은 교통정보 중에서 가장 대표적이고 이용자 선호도가 높은 정보 이다. 하지만 정보 수요자 측면에서 제공된 통행시간 정보는 과거정보이기 때문에 ‘시간 처짐’ 기간 동안에 발생하는 교통상황 변화로 인한 통행시간 오차가 발생하게 된다. 이러한 통행 소요시간의 차이는 제공된 소 요시간과 실제 소요시간간의 차이로 이어질 수 있으며, 종국에는 고속도로 교통정보에 대한 이용자들의 만 족도 및 신뢰도를 저하시킬 수 있다.

    최근 IT 기술의 발달로 인하여 교통정보를 차내에서 수신할 수 있는 개인 단말기 및 스마트폰의 확대로 인해 보다 신속한 교통정보의 제공이 가능해 짐에 따라 도로 이용자들은 출발 시점에 실제 목적지까지 걸리 는 시간 즉, 미래의 시공간적 교통상태 변화가 반영된 통행 소요시간을 원하고 있다(Lim et al., 2013). 교통정 보 수요자의 기대와 요구에 부합하기 위하여 한국도로공사는 2008년부터 서울중심 5대 주요도시 소요시간 예측을 시작으로 2015년 전국 톨게이트 간 예측정보를 제공하고 있다.

    고속도로 통행시간 예측을 위해 통행료수납시스템(TCS, Toll Collection System), 차량감지시스템(VDS, Vehicle Detection System), 단거리전용통신(DSRC, Dedicated Short Range Communication)과 같은 교통 인프라 로부터 수집된 교통량, 통행시간, 속도 정보 등 과거 이력정보와 실시간 교통정보를 활용한다. 먼저 과거의 교통량 및 소요시간 등 이력데이터 DB를 활용하여 회귀모형분석을 실시하여 특정 시간에 발생 교통량을 예 측한 후 해당 시간에 관한 정보(요일, 시간대, 날씨 등)와 예측된 교통량을 근거로 KNN(K-Nearest Neighbos) 알고리즘을 활용하여 유사 패턴을 추출한 후 최종적으로 통행시간을 예측하게 된다.

    도로 교통망에서 통행 소요시간 예측은 이용자들의 합리적인 노선 결정을 돕고 더 나아가 효율적인 교통 분산을 통해 정체상황을 최소화하고 최적의 교통상황을 유지하기 위해 필요하다. 통행 소요시간 예측정보를 운전자에게 제공하고 공공데이터로서 정보를 공개하기 위해서는 예측정보의 신뢰도에 대한 기준이 우선적 으로 마련되어야하며 정해진 기준을 근거로 지속적인 예측정보의 평가 및 품질관리가 필요하다. 하지만 한 국도로공사 뿐 아니라 통행시간 예측정보를 제공하는 타기관의 경우 통행 소요시간에 대한 예측정보 신뢰도 및 품질관리에 대한 연구는 부족한 실정이다. 따라서 본 연구의 첫 번째 목표는 국내외 통행 소요시간 예측 정보를 제공하는 교통정보 제공 시스템을 검토하여 예측정보로서 확보해야하는 신뢰도의 기준을 고찰해보 고, 현재 한국도로공사에서 운영하고 있는 노선을 대상으로 고속도로 통행 소요시간 예측정보에 대한 신뢰 성을 평가하는 것이다. 두 번째 목표는 평가 결과의 적정성여부를 EDA 분석을 통해서 확인해보고자 한다. 즉 신뢰성 평가 기준이 실제 통행시간 정보의 예측력을 반영할 수 없다면, 어떠한 사례 또는 어떠한 이유 때 문인지를 제시해보고자 한다. 예측 통행시간에 대한 이러한 평가 및 분석결과는 운영 노선에 대한 지속적이 고 미시적인 예측정보 품질관리 체계를 구상하기 위한 기초자료로 활용 될 수 있을 것으로 기대된다.

    2. 연구 방법

    본 연구는 국내 고속도로 통행 소요시간 예측정보로서 확보해야하는 신뢰도의 기준을 고찰하고 한국도로 공사에서 운영하고 있는 노선을 대상으로 예측정보에 대한 신뢰성을 정량적으로 평가하는데 초점을 두고 있 다. 먼저 예측정보 신뢰도 평가 지표 및 평가 기준을 확보하기 위하여 국내외 통행 소요시간 예측정보 제공 서비스 관련 연구를 조사한다. 또한 통행 소요시간의 오차에 대하여 통계적 신뢰구간 분석과 탐색적 자료 분 석(EDA, Exploratory Data Analysis) 방법 중 상자 그림 분석을 활용하여 기존에 사용되고 있는 평가 지표만으 로는 확인할 수 없었던 문제점들을 탐구해보고자 한다.

    Ⅱ. 기존 문헌 고찰

    국내의 경우 소요시간 예측정보 제공자는 민간 통신사와 광역지자체와 같은 공공기관으로 분류된다. 먼저 대표적인 예측정보 민간 제공자로 SK사의 교통정보 제공 서비스를 예로 들 수 있다. SK사의 교통정보 제공 서비스는 모바일 기반의 서비스로 예측정보는 2012년 출시된 4.0버전 이후부터 ‘언제갈까?’라는 기능을 통해 앱이용자가 설정한 기종점의 예측 소요시간과 최적 경로를 제공하기 시작했다. 매 10분 간격으로 예측 교통 정보를 제공한다. 국가기관으로는 서울지방국토관리청이 서울과 경기, 인천 지역의 고속도로, 도시고속도로, 일반국도 등의 교통정보와 돌발정보를 실시간으로 제공하고 있으며 동시에 이력정보를 활용하여 금일 기준 일주일 예측정보를 제공하고 있다(National Transport Information Center, 2017).

    국외의 경우 북미 및 유럽에서 실시간 교통정보 및 유고정보를 제공하는 INRIX사가 대표적이다. GPS 데 이터, 이력 교통 데이터, 공공서비스 차량 주행기록, 주차정보, 모바일정보, 사고정보와 도로정보, 날씨정보 등을 수집하여 실시간 교통정보와 더불어 교통예측 정보를 서비스하고 있다. 누적된 실시간 정보를 기반으 로 길게는 1년 짧게는 15분 단위로 교통 패턴을 분석하여 모바일 앱을 통해 예측정보를 제공하고 있다 (INRIX, 2017). 국내와 유사하게 일본의 경우 자치단체 기관이 예측정보의 제공자의 역할을 한다. 경찰청 도 로부현(우리나라 시·도 경찰)은 교통정보를 수집·제공하는 인프라인 광비콘을 설치하여 전국 도로의 교통정 보를 수집하고, 도로 이용자에게 전화, 라디오·텔레비전 방송, 인터넷, 내비게이션 등의 매체로 교통정보를 5 분 단위로 제공한다. 예측정보 제공주기는 1시간이며 약 한달간의 예측정보를 제공하며 혼잡도는 수시로 업 데이트를 실시한다(Japan Road Traffic Information Center, 2017).

    국내외 통행시간 예측정보 제공 서비스에 대한 선행연구 검토 결과 해당 서비스는 민간기관뿐 아니라 공 공기관에서도 제공되고 있었다. 하지만 제공 서비스에 대한 공식적인 평가 및 예측정보에 대한 신뢰도에 관 한 실증연구는 찾기 어려웠다. 소요시간 예측정보 품질 평가를 위해서는 먼저 효과척도 선정이 선행되어야 한다. 따라서 본 연구에서는 추가적인 선행연구를 통해 통행 소요시간 예측정보 제공시 정보의 신뢰성 및 정 확성에 대한 평가지표 및 기준을 제시해보고자 한다.

    먼저 미국 NTOC(National Transportation Operations Coalition)에서 제시하고 있는 ‘교통수집자료 정확도 요 구수준’을 소요시간 예측정보의 정확성 평가를 위한 지표로 활용할 수 있을 것으로 사료된다. 미국 NTOC는 FHWA 산하 교통운영 연합체로서 교통 시스템 운영자, 관련분야 전문가, 정책결정자들로 구성되어 있으며, 교통 운영과 관련된 정보교류 및 연구개발을 협의하는 연합체이다. 특히 NTOC에서는 교통자료수집 및 제공 과 관련해 적용분야별로 요구되는 정확도 기준을 <Fig. 1>과 같이 정리하였다. 정확도 요구수준은 주교통국, MPO, 산업계, 학계, 지자체 전문가들의 협동연구를 통하여 도출된 결과로, 교통관리 및 교통정보제공 분야 의 경우 교통량 및 통행시간 제공을 위한 적절한 정확도는 평균절대오차백분율(이하 MAPE) 기준 각각 5~10%, 5~20%로 제시하고 있다. 특히 교통정보 제공 분야의 경우 예측정보의 기준이 아니며 실시간 정보에 대한 정확도 기준이기 때문에 <Fig. 1>에서 제시된 기준은 예측정보 제공 시 기대할 수 있는 가장 이상적인 값이다.

    일반적인 예측값에 대한 신뢰성 기준을 보다 명확하게 제시한 또 다른 문헌으로 Meade(1982)를 들 수 있 다. 해당 연구에서는 MAPE 기준으로 <Table 1>과 같이 예측값에 대한 신뢰도를 분류하였다(Ahn and Hyun, 2014).

    MAPE의 경우 예측정보의 정확도 및 제공 알고리즘을 평가하는 평가지표로 바람직하지만, 이용자들이 느 끼는 통행시간 예측 정확도의 정도를 나타내지는 지표로 보기 어려울 수 있다. 일본의 또 다른 연구(Chung et al., 2003)에서는 도쿄 고속도로 이용자를 대상으로 통행시간 예측 시 정확도를 판단할 수 있는 범위를 조 사하여, 이용자의 관점에서 어느 수준의 예측 정확도를 기대하고 있는가를 분석하였다. 설문조사 결과 운전 자들은 통행시간 정보에 있어서 총 통행시간 대비 예측정보가 얼마나 정확했는지를 판단하지 않았으며, 오히 려 총통행시간의 길고 짧음에 상관없이 예측 통행시간보다 얼마나 빨리 또는 늦게 도착했는지 시간차이를 인 지하고 있는 것으로 나타났다. <Fig. 2>는 Chung et al.(2003) 연구결과를 인용한 것으로 응답자의 약 50%는 총 통행시간에 관계없이 ±10분의 차이에 대해서는 통행시간 예측이 정확하다고 응답하였음을 알 수 있었다.

    통행시간 예측 정보에 대한 많은 서비스 제공자가 존재함에도 불구하고 예측 정확도에 대한 기준 및 실증 적 평가는 미비한 것으로 확인되었다. NTOC 연구에 따르면 교통 정보 제공시 MAPE 기준 5%~20% 범위가 적절하며 이는 Meade(1982)에 따르면 최소한 ‘비교적 정확한 예측’에 해당함을 알 수 있었다. 반면 일본 도 쿄에서 실험한 연구 결과는 총 통행시간에 관계없이 일관된 기준을 적용하는 것이 불합리할 수 있음을 확인 시켜 주었다. 즉, 총 통행시간에 관계없이 운전자들이 기대하는 일정 수준 이상의 예측정보 신뢰도가 존재하 는데, 실험 결과 과반수에 해당하는 운전자들이 ±10분의 오차를 허용할 수 있는 것으로 분석되었다.

    본 연구와 기존연구와의 차별점은 다음과 같다. 첫째, 본 연구는 국내에서 운영 중인 거의 모든 고속도로 통행시간 예측정보를 정량적으로 평가한 첫 사례라는 점에서 의의가 있다. 둘째, 본 연구에서는 통행시간 예 측정보의 평가 기준으로 운영자의 관점에서 활용되어 왔던 MAPE를 사용함과 동시에 이용자가 인지하는 예 측 소요시간에 대한 정확도의 기준을 만족시키는지 여부를 확인하기 위해 통계적 구간추정을 기반으로 한 신뢰구간 분석을 실시하였다. 셋째 예측정보 품질 관리체계를 구성하는데 중요한 요소인 예측 오차에 대한 원인규명을 위해 방법론과 사례를 제시하였다는데 기존연구와 큰 차별점이 있다.

    Ⅲ. 분석기법

    MAPE는 시계열 예측 결과의 검토 방법 중 일반적으로 가장 많이 사용되는 지표로서 [식 1]에 의해서 계 산된다.

    M A P E ( % ) = ( 1 n × i = 1 n | X i Y i Y i | ) × 100
    [식 1]

    여기서,

    • Xi : 예측통행시간

    • Yi : 실제통행시간

    • n : 표본수

    하지만 통행 소요시간의 경우 날씨, 사고, 유고상황 등의 발생에 따라 급변하는 특징을 갖는데 일상적인 교통상황에서 이러한 이벤트는 상대적으로 적은 빈도수로 일어난다. 따라서 MAPE 만으로 통행 소요시간 예 측 정확도를 객관적으로 평가하기는 어려울 것으로 판단된다. 또한 선행연구를 통해서 언급되었듯이 MAPE 는 이용자가 인지하는 예측 소요시간에 대한 정확도의 기준으로 적합하지 않기 때문에 본 연구에서는 통행 시간의 오차에 대한 신뢰구간 분석을 위하여 구간 추정과 더불어 EDA 분석기법 중 하나인 상자 그림(Box Plot)을 활용하여 통행 소요시간의 신뢰도를 추가적으로 평가하고자 한다.

    신뢰구간은 통계학에서 추정기법 중 구간추정의 결과물로, 모집단에 대한 정보가 전혀 없는 상태에서 표 본의 통계량으로 모집단의 모수를 예측하는 방법을 말한다. 신뢰구간은 유의수준 설정에 따라 달라질 수 있 는데 본 연구에서는 가장 일반적인 유의수준인 95%를 사용하였다. 반면, 상자 그림 분석은 통계모집단의 표 본을 시각화하기 위하여 최댓값, 최솟값, 중앙값, 사분편차를 사용하며 이들의 배치를 통해 표본분포(예: 대 칭/비대칭 여부)를 개략적으로 확인할 수 있다. 또한 1사분위와 3사분위 범위를 IQR로 지칭하며, 1사분위에 서 아래로 1.5IQR 사이의 표본 또는 3사분위에서 위로 1.5IQR 사이의 표본을 이상치로 추정되는 표본 (Suspected outlier)으로 간주하며 1사분위에서 아래로 3IQR 사이의 표본 또는 3사분위에서 위로 3IQR 사이의 표본을 보다 분명한 이상치 표본(Outlier)으로 간주한다.

    Ⅳ. 데이터 구축 및 분석

    1. 데이터 구축

    본 연구에서는 통행 소요시간 정보의 신뢰도 평가를 위하여 2015년 1월부터 2017년 10월까지(총1,034일) 한국도로공사에서 운영 중인 45개 노선으로부터 제공된 통행 소요시간 예측정보와 해당 노선별 DSRC 이력 정보를 제공받아 분석하였다. 하나의 노선은 복수의 소구간(Link)으로 구성되어 있는데 45개 노선을 구성하 고 있는 구간은 총 1,167개이다. 통행 소요시간 예측정보의 경우 한국도로공사에서 개발한 교통예보시스템의 KNN 예측 알고리즘에 의해서 생성되며, 해당 예측 알고리즘은 DSRC 기반의 통행 소요시간 이력정보와 날 씨 및 명절, 하계휴가철과 같은 특별소통 기간의 변수를 고려하여 통행 소요시간을 예측하게 된다.

    통행 소요시간 예측 오차와 MAPE를 계산하는 자세한 데이터 처리 과정은 <Fig. 3>과 같다. 먼저, 1,034일 동안 전체 45개 노선으로부터 수집된 데이터를 노선별/일별 이력데이터와 예측데이터로 분류한다. 이후 이력 데이터와 예측데이터별로 해당 노선에 포함되는 모든 구간의 통행시간을 합산한 후 그 차이를 계산하여 해 당 노선의 일별 예측통행시간 오차를 계산하게 되고, 동일한 과정을 노선별/일별로 반복하여 1034일에 동안 에 모든 노선의 일평 예측통행시간 오차를 추출하게 된다. MAPE는 추출된 노선별/일별 오차와 해당 실측데 이터를 이용하여 [식 1]로부터 계산한다.

    2. 노선별 MAPE 분석

    2015년~2017년 동안 일별 통행 소요시간 오차에 대한 MAPE를 계산 후 <Fig. 4>와 <Fig. 5>와 같이 방향 별/노선별로 비교해보았다. 참고로 그림의 X축은 각 노선별 ID 번호로 표현되어 있으며(따라서 총 45개의 ID 로 구성되어 있음), 수평선은 NTOC 기준인 10% MAPE를 나타낸다.

    2015년 상행선(Northbound)의 경우 중앙선(5510) 그리고 하행선(Southbound)의 경우 제2남해선(1040)을 제 외한 모든 노선에서 소요시간 예측정보의 MAPE는 NTOC 기준 미만인 것을 알 수 있다. 방향에 관계없이 3 년에 걸쳐 NTOC 기준치를 상시 상회하는 노선은 없지만, 제2남해선(1040) 하행선과 제2경인선(1100) 하행선 의 경우 2년에 걸쳐 기준치를 초과한 것을 확인할 수 있었다. 다만, 서울외곽선(1000) 상행선의 경우 3년에 걸쳐 MAPE 기준에 가깝거나 상회하는 것을 알 수 있었다. 더불어, 방향별/노선별 소요시간 예측정보의 MAPE의 추이는 시간에 따라 큰 차이를 보이고 있지 않음을 확인할 수 있었다. 예를 들어 MAPE 기준 상위6 개 노선을 연도별/방향별 로 정리하면 <Table 2>와 같다.

    <Table 2>에서 상행선과 하행선 각각에 대해서 3년에 걸쳐 4개의 노선(160,1000,1040,1200)이 중복됨을 알 수 있으며, 반대로 3년 동안 상위 6개 노선에 유일하게 포함된 노선은 상행선과 하행선 각각 2개에 불과하 다. 이러한 결과는 현재 한국도로공사에서 운영중인 노선을 대상으로 MAPE 기준을 보다 엄격하게 적용하여 노선의 예측정보의 정확도를 평가한다면(예: MAPE 5%) 지속적으로 품질 모니터링이 필요한 노선이 다수 존 재할 수 있음을 보여준다.

    3. 노선별 EDA 및 신뢰구간 분석

    MAPE의 경우 직관적이며 상대평가에 유리한 지표인 반면 과대/과소 추정에 대한 설명력은 낮은 편이다. 통행 소요시간 예측 정보의 경우 과대/과소 추정여부가 운영자에게 중요한 만큼 본 연구에서는 오차 분포 특성을 확인할 수 있는 EDA 분석 중 상자 그림 분석과 신뢰구간 분석을 추가적으로 실시하였다.

    <Fig. 6>과 <Fig. 7>은 소요시간 예측치와 실측치의 오차에 대한 방향별/노선별 상자 그림과 신뢰구간을 동시에 보여주고 있다. 유의수준 95% 신뢰구간은 상자 그림 뒤 음영으로 확인할 수 있다. 오차는 실측치와 예측치의 차이로 음의 오차값은 과대추정을 의미한다.

    2015년 중앙선(5510) 상행선과 제2남해선(1040) 하행선에 대한 상자 그림을 살펴보면, 중간값(상자 내부의 수평선)이 음(-)의 영역에 위치한 것으로 보아 해당 노선의 예측 소요시간 정보가 대체로 과대 추정되었음을 알 수 있다. 따라서 <Fig. 4a>와 <Fig. 5a>에서 중앙선과 제2남해선의 높은 MAPE는 과대 추정으로 인한 결과 임을 알 수 있다. 흥미로운 사실은 <Fig. 4>와 <Fig. 5>에서 낮은 MAPE를 보인 노선들 중 <Fig. 6>과 <Fig. 7>에서 과대/과소 추정이 분명한 노선들이 존재한다는 것이다. 예를 들어, 2015년 걸쳐 서해안선(150)과 경부 선(10)의 경우 양방향 과대추정이 두드러지며, 2015년 서울외곽(1000) 상행선의 경우 과소 추정을 확인할 수 있다. 이러한 사실은 MAPE 값만으로 예측 정보의 정확성을 평가하는 것에 한계가 있으며 오차에 대한 추가 적인 면밀한 분석이 수반되어야 함을 보여준다. 이러한 예는 2016년도와 2017년도에 수집된 데이터를 통해 서도 확인할 수 있다. <Table 3>은 2016년과 2017년에 수집된 데이터를 기반으로 MAPE 값이 10% 미만(참 고: <Fig. 4>와 <Fig. 5>)임에도 불구하고 과대 또는 과소 추정이 뚜렷한 노선(참고 <Fig. 6>와 <Fig. 7>)을 정 리하여 보여주고 있다. 즉, <Table 3>에서 언급된 노선들은 MAPE를 기준으로 높은 신뢰도를 보이는 것 같지 만, 실제 예측오차의 분포를 살펴보면 과대/과소 추정을 확인할 수 있는 사례로 예측정보의 품질 관리를 위 해 지속적인 모니터링이 필요한 대상 노선으로 볼 수 있다.

    신뢰구간의 길이는 소요시간 예측정보의 오차 분포와 상자 그림에서 계산된 이상치의 빈도수에 따라 상 이함을 알 수 있다. <Fig. 6>과 <Fig. 7>에서 2015년부터 2017년까지 모든 노선의 신뢰구간을 살펴보면 앞서 언급한 과대/과소 추정 노선을 제외하면 대부분 신뢰구간은 ±10분 이내인 것을 확인할 수 있다. 이는 앞서 선행연구에서 언급했듯이 통행길이와 관계없이 과반 이상의 통행자들이 기대하는 예측정보의 신뢰수준 범 위와 일치한다. 몇몇 노선의 경우 소수의 극단적 이상치(±20분 이상)의 존재로 인해 신뢰구간이 길어지는 것 을 확인할 수 있었다(예: 2017년 청주영덕선(300)).

    특정 노선에서 예측정보가 과대 추정 될 때 사용자로부터 지속적인 민원이 발생할 수 있다는 측면에서 운 영자는 해당 노선의 소요시간 예측정보에 대한 품질 관리에 더욱 신경 써야 할 것이다. 무엇보다도 과대/과소 추정의 원인을 밝히고 해당 문제점의 지속성을 확인할 필요가 있다. 따라서 본 연구에서는 앞서 언급한 문제 노선들의 개별 구간을 대상으로 소요시간 예측치와 실측치간의 오차에 대해 EDA 분석을 추가로 시행하였다.

    4. 구간별 EDA 분석

    하나의 노선은 복수의 소구간으로 구성되어 있다. 예를 들어, 서해안선과 서울외곽선은 각각 35개와 32개 의 소구간으로 구성되어 있다. 지금까지의 분석이 노선별 총 통행 소요시간에 대한 오차를 기반으로 수행되 었다면, 본 절에서는 특정 노선을 구성하고 있는 구간별 EDA 분석을 수행한다. <Fig. 8>은 2015년부터 2017 년까지 서해안선 상행선(Fig. 8a,8c,8e) 과 서울외곽 상행선(Fig. 8b,8d,8f)을 구성하고 있는 각 구간별 소요시간 예측정보 오차에 대한 상자 그림을 보여주고 있다.

    <Fig. 8a>에서 2015년 서해안선(150)을 구성하고 있는 구간별 상자 그림을 살펴보면, 거의 모든 구간에서 예측정보의 오차는 ±10분 이내인 것을 확인할 수 있다. 다만 25번 구간에서 10분~15분 정도의 과대 추정이 확인되었으며, 인접한 링크인 26번 링크에서도 5분 내외의 과대 추정 오차를 볼 수 있다. 따라서, <Fig. 6a> 에서 서해안선의 과대 추정은 서해안선을 구성하고 있는 소수 구간으로부터의 통행 소요시간 예측정보 과대 추정이 그 원인임을 알 수 있다. 그럼에도 불구하고 <Fig. 4a>에서 낮은 MAPE 값을 보이는 이유는, 서해안 선은 35개의 구간 중 특정 소수 구간에서 과대/과소 추정과 같은 문제 발생 시 해당 구간에서 추정 오차가 다수의 다른 구간의 오차에 희석되면서 결과적으로 MAPE 값은 낮아지기 때문이다.

    2015년 서울외곽선(1000) 상행선의 경우 역시 MAPE는 10% 미만이었지만 노선별 EDA 분석에서 소요시간 예측정보의 과소 추정이 의심되었다. <Fig. 8b>에서 서울외곽선의 경우도 대부분의 구간에서 과대/과소 추정 의 징후는 볼 수 없었다. 하지만 38번 구간의 경우 타구간에 비해 상대적으로 많은 이상치가 발견되었다. 해 당 구간의 예측치와 실측치에 상응하는 이력데이터를 면밀히 검토해본 결과 2015년 38번의 구간에서 실제 속도(이력데이터 기준)에 비해 높은 통행속도가 지속적으로 예측되었으며, 그 결과 38번 구간에서 실제 통행 시간에 비해 짧은 통행시간이 기록된 것을 확인할 수 있었다. 2016년에는 38번 구간에서 과소 추정이 더욱 두드러져 노선전체에서도(<Fig. 6d> 참고) 과소 추정이 나타났으며, 일평균 MAPE 역시 NTOC 기준을 초과하 였다(<Fig. 4b> 참고). 2017년에는 38번 구간의 문제는 지속되었지만 오히려 통행 소요시간 예측정보가 과대 추정되었음을 확인할 수 있었다. 이 경우 38번 구간에서 실제 통행속도에 비해 낮은 통행속도가 예측되어 통 행시간이 과대 추정된 결과 때문이다. 서울외곽선의 경우 서해안선처럼 다수의 구간으로 구성되어 있으며, 전체 구간 중 극히 일부 구간에서 과대/과소 추정치를 관찰할 수 있었다. 하지만 서해안선과 달리 과대/과소 추정의 정도가 심각해 노선별 MAPE의 기준을 상회하는 경우를 볼 수 있었다(<Fig. 4b, 4c> 참고).

    Ⅴ. 결 론

    한국도로공사에서 운영 중인 45개 노선을 대상으로 2015년부터 2017년까지 NTOC에서 제시하고 있는 MAPE 값을 기준으로 통행 소요시간 예측정보에 대한 신뢰성 분석 및 평가를 실시하였다. 그 결과 NTOC 기 준을 충족하지 못하는 노선은 총 상행 5개(서울외곽선, 중앙선, 제2남해선, 제2경인선, 경인선), 하행 3개 노 선(제2남해선, 제2경인선, 경인선)이었다. MAPE는 예측정보의 신뢰성을 평가하기 위해 사용되는 대표적인 척도이지만 MAPE의 값만으로 예측정보 시스템의 문제점까지 확인하는데 한계점을 갖고 있었다. 몇몇 노선 에서 NTOC 기준을 상회하는 원인을 보다 면밀히 확인하기 위해 소요시간 예측치와 실측치간의 오차에 대 한 EDA 분석을 실시하였다. 먼저 그림 상자 분석을 통해 해당 노선의 경우 과대 또는 과소 추정이 발생함을 확인하였다. 추가로 MAPE 기준을 충족하면서도 과대 또는 과소 추정이 존재할 수 있으며, 특히 몇몇 노선의 경우 2015년부터 2017년에 걸쳐 지속적으로 예측정보의 과대 추정이 확인되었다. 신뢰구간 분석을 통해서도 유사한 결론을 도출할 수 있었으며 앞서 지적한 일부 문제 노선을 제외한 대부분 노선에서 신뢰구간은 ±10 분 이내에 형성되어 있었다.

    특히, 노선에서 과대추정된 예측정보는 사용자로부터 지속적인 민원을 야기시킬 수 있다는 측면에서 운영 자는 해당 노선의 예측정보 품질 관리에 더욱 신경 써야 할 것이다. 무엇보다도 과대 또는 과소 추정의 원인 을 밝히고 해당 문제점이 지속해서 발생하는지를 확인할 필요가 있다. 따라서 본 연구에서는 앞서 언급한 문 제 노선들의 개별 구간을 대상으로 소요시간 예측치와 실측치간의 오차에 대해 EDA 분석을 추가로 수행하 였다. 그 결과 다수의 구간으로 구성된 장대 노선의 경우 소수의 구간에서 과대 또는 과소 예측오류가 노선 전체의 예측 정보 신뢰도에 영향을 줄 수 있음을 확인하였다. 또한 3년에 걸쳐 수집된 데이터를 분석한 결과 일부 노선 내 특정 구간에서 발생한 과대 또는 과소 추정 문제는 3년 내내 관리되지 못하고 잔존해 있었다. 따라서 신뢰성 있는 예측 정보제공을 위해서는 운영 노선에 대한 지속적이고 미시적인 예측정보 품질관리 체계를 갖추어야 할 것으로 사료된다.

    본 연구는 국내에서 운영 중인 거의 모든 고속도로 통행시간 예측정보를 정량적으로 평가한 첫 사례라는 점에서 의의가 있다. 하지만 여전히 추가적으로 보완되어야 할 미비점들이 남아있다. 첫째, 예측정보 품질관 리 체계를 수립하기 위해서는 예측력 저하가 의심되는 구간 선정의 자동화가 필요하다. 추가적인 데이터의 분석을 통해 예측력 저하에 기인하는 영향요인을 분석하고 이를 품질관리 체계 수립에 적용한다면 궁극적으 로 예측 정보의 신뢰성을 제고할 수 있을 것으로 판단된다. 둘째, 평가 지표에 대한 적정성에 대한 검증이 필요하다. 특히 현재 신뢰구간의 경우 ±10분의 오차를 기준으로 적용하였으나 이는 일본의 기준으로 국내에 적용가능한 기준을 확보하기 위한 추가적인 연구수행이 필요하다. 셋째, 통행시간 예측을 위한 알고리즘은 시간이 지남에 따라 개선 및 보완되고 있으며, 최근 한국도로공사는 예측 알고리즘 개선을 위한 연구용역을 수행하였다. 따라서 새로운 알고리즘을 적용 후 예측정보의 신뢰성 평가가 필요할 것으로 사료된다. 넷쩨, 예측정보 DSRC, VDS, TCS 등 기초 이력데이터를 기반으로 생성되며 본 연구에서는 이들로부터 제공되는 정보의 정확성에 대한 평가는 실시하지 않았다. 즉 이력데이터 정보가 신뢰할 만하다는 가정하에 예측정보 의 신뢰성을 평가하였다. 예측 알고리즘에 대한 보완 및 발전방향 뿐만 아니라 기초 데이터에 대한 관리방안 동시에 고민되어질 때 더 정확한 예측 시스템을 구성할 수 있다고 보여진다.

    ACKNOWLEDGMENTS

    본 연구는 2017년 한국도로공사의 재원으로 연구개발사업의 지원으로 수행하였습니다. 본 논문의 주요 결 과 및 본문에서 언급된 추가적인 연구 결과에 대한 자세한 내용은 한대철(2018) 연세대학교 석사학위 논문을 참고하기 바랍니다.

    Figure

    KITS-17-86_F1.gif

    NTOC Performance Measurements and Reliability (source: CATT, 2010)

    KITS-17-86_F2.gif

    Acceptable Level of Accuracy of On-Route Travel Time Information (source: Chung et al., 2003)

    KITS-17-86_F3.gif

    Prediction Error Calculation Procedure by Link and Line

    KITS-17-86_F4.gif

    MAPE by Northbound Line in 2015

    KITS-17-86_F5.gif

    MAPE by Southbound Line in 2015

    KITS-17-86_F6.gif

    Boxplot and Confidence Analysis for Prediction Error in Northbound (the scale of original Y-axis is re-adjusted such that readers conveniently understand the features the manuscript describes)

    KITS-17-86_F7.gif

    Boxplot and Confidence Analysis for Prediction Error in Southbound (the scale of original Y-axis is re-adjusted such that readers conveniently understand the features the manuscript describes)

    KITS-17-86_F8.gif

    Boxplot of Prediction Error by Link for Line 150 and 1000 Northbound in 2015~2017 (the scale of original Y-axis is re-adjusted such that readers conveniently understand the features the manuscript describes)

    Table

    Prediction Reliability based on MAPE

    Top 6 MAPE Line ID by year and direction

    Lines with Over-Predictied Travel Time and Corresponding MAPEs

    Reference

    1. AhnG. H. and HyunC. S. (2014), UTIS based Traffic Congestion Alleviation Time Forecast, The Road Traffic Authority, p.66.
    2. Center for Advanced Trasportation Technology(2010), Traffic Flow Measures Implementation Guide, White Paper.
    3. ChungE. , HiroshiW. , ShamasI. B. and MasaoK. (2003), “ Travel time prediction: issues and benefits ,” In Proceedings of the 10th world conference on transport research.
    4. INRIX, http://inrix.com, 2017.11.12.
    5. Japan Road Traffic Information Center, http://www.jartic.or.jp, 2017.11.12.
    6. LimS. H. , LeeH. M. , ParkS. L. and HeoT. Y. (2013), “ A Study of Travel Time Prediction using K-Nearest Neighborhood Method ,” The Korea Journal of Applied Statistics, vol. 26no. 5, pp.835-845.
    7. MeadeN. (1982), “ Industrial and Business Forecasting Methods ,” Journal of Forecast, vol. 2, no. 2, pp.194-196.
    8. National Transport Information Center, http://www.its.go.kr/, 2017.12.01.
    9. ShinK. W. , ShimS. W. , ChoiK. C. and KimS. H. (2014), “ Expressway Travel Time Prediction Using K-Nearest Neighborhood ,” Journal of the Korean Society of Civil Engineering, vol. 34no. 6, pp.1873-1879.

    저자소개

    Footnote