Ⅰ. 서 론
1. 연구 배경 및 목적
최근에는 스마트폰에 교통정보 제공기능이 기본 으로 구현되어 있어서, 차량을 운전할 때 네비게이 션 대신으로 사용이 가능할 정도이다. 이처럼 언제 어디서나 필요한 교통정보를 사용할 수 있도록 해 주는 유비쿼터스 교통환경의 구축 필요성이 꾸준히 제기되어 왔다. 경찰청과 도로교통공단은 유비쿼 터스 교통환경에서 교통정보를 실시간으로 운전자 에게 제공할 수 있는 도시교통정보시스템(UTIS: Urban Traffic Information System)을 개발하였으며, 전국단위의 교통정보를 생산하여 운전자에게 제공 하는 중앙교통정보센터를 2005년도에 설립하여 운 영하고 있다.
중앙교통정보센터에서 수집되어 처리된 과거 통 행속도 이력자료는 교통정보 운영 및 관리 측면에 서 그 중요성이 부각되고 있다. 예를 들면, 과거 통 행속도 이력자료는 현재 제공되고 있는 통행속도 정보와 비교/평가의 대상이 되어 도로교통 운영에 대한 새로운 전략을 제공해 줄 수 있다[1]. 또한 오 류 데이터의 결손처리와 실시간 데이터의 보정에도 중요한 자료가 된다[2, 3]
특히 과거 통행속도 이력자료는 도로에서의 장 기 통행속도 예측에 그 활용도가 매우 높다. 그러나 선행 연구들은 대부분 실시간 데이터를 이용한 단 기 통행속도 예측에 관한 것이었다[4, 5]. 통행속도 예측시 실시간 데이터를 이용할 경우 예측대상 시 간대가 현재 시각에서 멀어질수록 통행속도 예측오 차는 증가하는 경향이 있다. 반면 과거 통행속도 이 력자료를 이용할 경우 통행속도 예측오차는 예측 기간에 상관없이 일정하게 나타나는 경향이 있다 [6]. 따라서 도시부 도로에서의 장기 통행속도 예측 은 일반적으로 과거 통행속도 이력자료를 이용하는 것이 유리하다.
과거 통행속도 이력자료를 이용하여 통행속도를 예측할 때 사용되는 대푯값과 과거 데이터량에 따 라 정확성의 차이가 다르게 나타난다. 기존 통행속 도 예측연구에서는 과거 통행속도 이력자료를 이용 하여 통행속도 예측시, 이에 대한 적정 기준을 제 시하지 못하였다. 이에 본 연구에서는 도시부 도로 에서 장기 통행속도 예측이 필요한 경우 정확성을 높이기 위해 과거 통행속도 이력자료의 적정 대푯 값과 과거 데이터량을 결정하기 위한 방법론을 제 안하고, 실제 실험을 통해 제안된 방법의 성능을 평가하였다.
Ⅱ. 관련 연구 및 쟁점사항
1. 관련 연구 및 사례
기존 연구에서 과거 통행속도 이력자료는 크게 통행속도 예측, 결측치 보정, 교통운영 평가, 교통 계획 등에 사용되어 왔으며, 특히 과거 통행속도 이 력자료를 이용하여 통행속도 예측시 과거 통행속도 이력자료를 정규분포로 가정하고 <표 1>과 같이 평 균값을 많이 사용하였다.
이의은 등[7]은 통행속도 예측을 위한 과거 통행 속도 이력자료의 대푯값으로 최빈값 사용을 제안하 였으며, 김동호 등[8]은 신뢰성 있는 통행속도 예측 을 위해 통행속도 이력자료의 적정 대푯값으로 중 앙값의 사용을 제안하였다.
통행속도 예측을 위해 적정한 과거 데이터량은 일반적으로 주 단위, 월 단위, 년 단위로 구분하여 <표 1>과 같이 연구마다 다르게 적용하였으며, 김 동호 등[8], 조준한 등[9]은 2개월을 통행속도 예측 을 위한 적정 과거 데이터량으로 제안하였다.
2. 주요 쟁점사항
기존 연구결과들을 분석한 결과, 통행속도 예측 의 정확도를 높이기 위해서 다음의 사항들이 먼저 결정되어야 하는 것으로 나타났다.
첫째, 과거 통행속도 이력자료를 이용하여 통행 속도를 예측할 때 과거 통행속도 대푯값으로 어떤 것을 사용하는 것이 오차를 가장 최소화할 수 있는 지 고려되어야 한다. 통행속도 이력자료의 분포는 일반적으로 오른쪽 꼬리분포를 나타내는 경우가 많 으며, 이 경우 통행속도 예측을 위해 과거 통행속도 이력자료의 대푯값으로 평균값, 가중평균값, 중앙값 중에 어떤 것을 사용하느냐에 따라서, 예측오차가 서로 다르게 나타난다[8]. 그러므로 통행속도 예측 을 위해 어떤 대푯값을 사용하느냐 하는 것이 통행 속도 예측의 정확도를 결정하는 주요한 항목이다.
둘째, 과거 몇 일의 데이터를 이용하여 이력자료 를 구축하는 것이 통행속도 예측 오차를 최소화할 수 있을지 고려되어야 한다. 과거 통행속도의 데이 터량이 많을 경우에는 안정된 통행속도 패턴을 확 보할 가능성이 크지만, 장래 통행속도 예측시에 적 합하지 않은 통행속도 패턴이 포함될 수 있다. 반면 에 과거 통행속도 데이터 량이 적을 경우에는 안정 된 통행속도 패턴을 포함하지 못하기 때문에 부정 확한 통행속도 예측정보를 제공할 가능성이 크다.
따라서 과거 통행속도 이력자료를 활용한 통행속 도 예측시 정확도를 높이기 위해서는 적정 대푯값과 과거 데이터량 선정을 위한 적정 기준이 필요하다.
Ⅲ. 이력자료를 이용한 통행속도 예측방법
1. 적정 대푯값 결정 방법
과거 통행속도 이력자료를 이용하여 현재의 통 행속도를 예측할 때 어떠한 대푯값 결정방법을 사 용하는 것이 오차를 가장 최소화 할 수 있는지를 고려하여야 하며, 기존 연구에서는 일반적으로 과 거 통행속도 이력자료의 분포를 정규분포로 가정하 고 평균값을 사용하였다.
과거 통행속도 이력자료의 분포가 정규분포이면 대푯값으로 평균값, 가중평균값, 중앙값 중 어떠한 것을 사용하더라도 통행속도 예측시 오차가 동일하 게 나타나나, 과거 통행속도 분포는 오른쪽 꼬리분 포를 나타내는 경우가 많다[8]. 즉 각각의 대푯값으 로 평균값, 가중평균값, 중앙값을 제공하였을 경우 예측오차가 다르게 나타난다.
본 연구에서는 통행속도 예측을 위한 과거 통행 속도 이력자료의 적정 대푯값으로 평균값, 가중평 균값, 중앙값을 고려하였으며, 평균값 및 가중평균 값은 모든 과거 통행속도 이력자료 값이 사용되므 로 매우 크거나 작은 값에 영향을 받는다. 그중 가 중평균값은 식 (1)과 같이 최근 데이터에 가중치를 주어 최근의 교통상황을 반영하는 것이 특징이다.
여기서,
중앙값은 자료를 크기순으로 나열할때 가운데에 위치하는 값으로, 매우 크거나 작은 값에 영향을 받 지 않는다. 과거 통행속도 이력자료의 적정 대푯값 은 <그림 2>와 같이 예측오차를 근거로 결정될 수 있으며, 적정 대푯값은 대푯값을 이용한 예측 통행 속도와 실제 관측된 통행속도와의 예측오차를 최소 화하는 것을 선정하였다.
2 적정 과거 데이터량
과거 통행속도 이력자료를 활용한 통행속도 예 측시 정확도를 높이기 위해서는 적정 과거 데이터 량 선정을 위한 기준이 필요하다. 도시부 도로의 통 행속도 예측시 과거 통행속도의 데이터량이 많을 경우에는 안정된 통행속도 패턴을 확보할 수 있지 만, 장래 통행속도 예측시 적합하지 않은 통행속도 패턴이 포함될 수 있다. 반면에 과거 통행속도의 데 이터 량이 적을 경우에는 안정된 통행속도 패턴을 포함하지 못하기 때문에 부정확한 통행속도 예측정 보를 생성할 수 있다.
본 연구에서 중앙교통정보센터에 보관된 최근 1 년간의 교통정보 이력자료(돌발상황 발생시 데이 터 포함)를 이용하여 통행속도 예측을 실시하여, 도시부 도로에서 최근 얼마간의 정보를 사용하는 것이 정확히 통행속도를 예측할 수 있는 지를 실 험하였다.
Ⅳ. 현장실험 방법 및 내용
1. 현장실험 및 결과분석 방법
이력자료를 이용한 통행속도 예측방법에 대한 현장실험은 구간통행속도 자료의 신뢰성이 확인된 실험대상 4개 링크의 최근 1년간 화요일(평일) 및 일요일(공휴일) 통행속도 이력자료를 경찰청 중앙 교통정보센터 데이터베이스에서 수집하여, 통행속 도 예측 및 정확도 평가를 실시하였다.
과거 통행속도 이력자료의 적정 대푯값(예측 통 행속도)은 과거 일정기간 동안 각 링크의 시간대별 (예, 5분 간격)로 관측된 통행속도에 대해 평균값, 가중평균값, 중앙값을 산출한 것이다.
적정 대표값을 산출하기 위해 일정기간 동안 각 시간대별로 산출되는 예측오차(대표값과 실측값 차 이)를 평균하여 평균오차가 최소화되는 대표값을 적정 대푯값으로 결정하는 방식으로 <표 2>와 같이 성능을 평가하였다.
기준속도와 예측 통행속도의 차이에 대한 정확 도 평가는 국토해양부 「ITS 성능평가 시행지침(안) : 차량검지기」에서 제시된 ‘평균절대오차백분율 (MAPE: Mean Absolute Percentage Error)' 방법을 적 용하였다[12].
2. 현장실험 내용
UTIS가 설치되어 운영중인 서울시의 주요 도로 중에서 교통정보 이력자료의 수집 및 보관상태가 양호하고, UTIS의 차량내부 장치인 OBE(Onboard Equipment)의 접속률이 비교적 높으며, 링크 중간에 신호기가 있는 구간 2개소를 포함한 4개 도로구간 을 <표 3>과같이 실험장소로 선정하였다.
통행속도 예측실험은 중앙교통정보센터에 보관 중인 6월 5일 화요일 및 6월 3일 일요일의 통행속 도 자료를 기준속도로 하였으며, 2011년 6월부터 2012년 5월까지의 화요일(평일) 및 일요일(공휴일) 통행속도 데이터를 중앙교통정보센터 데이터베이 스에서 추출하여, 통행속도 예측 및 정확도 평가에 활용하였다. 실험에 사용된 통행속도 자료는 도로 등급별 최대속도를 초과하는 이상치는 제거하는 등 의 이상치 제거기법이 적용되어 있다.
Ⅴ. 현장실험 결과
1. 화요일(평일) 실험결과
중앙교통정보센터에 저장된 이력자료 중 최근 1 년간의 이력자료가 잘 구축되어 있는 4개 도로구간 을 현장실험 장소로 선정하여 중앙교통정보센터 운 영소프트웨어를 이용하여 2012년 6월5일 화요일 하 루 24시간 동안의 통행속도 자료를 수집하여 이를 기준속도로 사용하였으며, 실험일 이전 1년간의 화 요일(평일) 구간통행속도 이력자료를 5분 단위 (UTIS 교통정보 제공주기)로 데이터베이스에서 추 출하였다.
중앙교통정보센터 데이터베이스에서 추출된 실 험일 이전 1개월(2012년 5월), 2개월(2012년 4, 5월), 3개월(2012년 3~5월), 6개월(2011년 12월~2012년 5 월), 1년(2011년 6월~2012년 5월) 동안의 시간대별(5 분 간격) 통행속도 이력자료를 마이크로소프트웨어 (주) 엑셀 소프트웨어를 가지고 평균값, 가중평균값, 중앙값을 각각 구하여 이를 대푯값으로 하는 각 방 식의 정확도를 비교분석하였다.
평일인 화요일의 최근 1개월, 2개월, 3개월, 6개 월, 1년간의 통행속도 이력자료를 이용하여 실험 을 실시한 결과 <표 4>, <그림 3>과 같이 전체적으 로 대푯값 결정을 위해 평균값(MAPE: 13.9) 및 가 중평균값(MAPE: 14.0)을 사용한 경우 중앙값 (MAPE: 14.3) 보다 통행속도 예측 정확도가 높은 것으로 분석되었다.
통행속도 예측에 적합한 과거 데이터량 결정을 위해 최근 1개월, 2개월, 3개월, 6개월, 1년의 화요 일 통행속도 이력자료를 이용하여, 화요일 시간대 별 통행속도 대푯값을 추정하고, MAPE 값을 비교 /분석한 결과 <표 4>, <그림 3>과 같이 최근 1개 월 자료 이용시 데이터량 부족으로 큰 오차가 발 생하였으며, 최근 2개월 자료를 이용할 경우 통행 속도 추정 정확도가 가장 높았다. 이후 6개월, 1년 으로 적용범위를 넓힐 경우 오차가 오히려 증가하 는 것으로 나타났으며, 이는 최근의 교통환경 변 화를 제대로 반영하지 못하였기 때문인 것으로 추 정된다.
2. 일요일(공휴일) 실험결과
중앙교통정보센터에 저장된 이력자료 중 최근 1 년간의 이력자료가 잘 구축되어 있는 4개 도로구간 을 현장실험 장소로 선정하여 중앙교통정보센터 운 영소프트웨어를 이용하여 2012년 6월3일 일요일 하 루 24시간 동안의 통행속도 자료를 수집하여 이를 기준속도로 사용하였으며, 시험일 이전 1년간의 일 요일(공휴일) 구간통행속도 이력자료를 5분 단위로 데이터베이스에서 추출하였다.
중앙교통정보센터 데이터베이스에서 추출된 실 험일 이전 1개월, 2개월, 3개월, 6개월, 1년 동안의 시간대별 통행속도 이력자료를 마이크로소프트웨 어(주) 엑셀을 가지고 평균값, 가중평균값, 중앙값 을 각각 구하여 이를 대푯값으로 하는 각 방식의 정확도를 비교분석하였다.
공휴일인 일요일의 최근 1개월, 2개월, 3개월, 6 개월, 1년간의 통행속도 이력자료를 이용하여 실 험을 실시한 결과 <표 5>, <그림 4>와 같이 전체적 으로 대푯값 결정을 위해 가중평균값(MAPE: 12.7) 이 평균값(MAPE: 12.9) 및 중앙값(MAPE: 13.1)보다 통행속도 예측 정확도가 높은 것으로 분석되었다.
통행속도 예측에 적합한 과거 데이터량 결정을 위해 실험일 이전 최근 1개월, 2개월, 3개월, 6개월, 1년의 일요일 자료를 이용하여, 일요일의 시간대별 통행속도 대푯값을 추정하고, MAPE 값을 비교/분 석한 결과 <표 5>, <그림 4>와 같이 전체적으로 모 두 비슷한 수준의 정확도를 나타내었다. 이는 일요 일의 경우 평일과는 달리 교통흐름이 비교적 안정 적이고 변화가 적기 때문인 것으로 판단된다.
Ⅵ. 결 론
교통정보센터에 수집되어 저장되는 과거 통행속 도 이력자료를 이용하여 통행속도를 예측할때 사용 되는 대푯값과 과거 데이터량에 따라 통행속도 예 측 정확성의 차이가 다르게 나타난다. 기존 통행속 도 예측 연구에서는 적정 대푯값과 과거 데이터량 에 대한 적정 기준을 제시하지 못하였으며, 교통정 보센터는 합리적인 기준없이 교통정보 이력자료를 구축하고 있다. 따라서 본 연구에서는 통행속도 예 측의 정확성을 높이기 위해 과거 통행속도 이력자 료의 적정 대푯값과 과거 데이터량을 결정하는 방 법을 제안하여 현장실험을 실시하였다.
현장실험은 중앙교통정보센터에 저장된 이력자 료 중 최근 1년간 이력자료가 잘 구축되어 있으며, 현장실험이 용이한 서울시 4개 도로구간을 실험장 소로 선정하여, 중앙교통정보센터 운영소프트웨어 를 이용하여 최근 1년간의 화요일(평일), 일요일(공 휴일) 구간통행속도 이력자료를 5분 단위로 데이터 베이스에서 추출하였다.
중앙교통정보센터 데이터베이스에서 추출된 최 근 1개월, 2개월, 3개월, 6개월, 1년 동안의 시간대 별 통행속도 이력자료를 마이크로소프트웨어(주) 엑셀을 가지고 평균값, 가중평균값, 중앙값을 각각 구하여 이를 대푯값으로 하는 각 방식의 정확도를 비교분석하였다.
분석결과 교통정보 이력자료를 이용하여 적정 대 푯값을 결정하기 위해서는 평균 및 가중평균을 이용 하는 것이 중앙값을 이용하는 것보다 정확도가 높은 것으로 분석되었으나, 각 방식별 성능차이가 통계학 적으로 명확히 증명될 정도의 수준은 아니었다.
통행속도 예측에 적정한 과거 데이터량 결정을 위해 최근 1개월, 2개월, 3개월, 6개월, 1년의 이력 자료를 이용하여 실험한 결과, 평일(화요일)의 경우 최근 2개월의 자료를 이용하는 것이 적절한 것으로 분석되었으며, 일요일(공휴일)의 경우 모든 경우에 서 비슷한 정확도를 나타내었다.
본 논문은 서울시 4개 지점에서 최근 1년간의 교 통정보 이력자료를 이용하여 구간통행속도를 추정 하는 방법을 실험하였으며, 실험결과 과거 데이터 의 사용범위에 따라 예측력이 달라 질 수 있으므로 적정 과거데이터 사용범위를 잘 정하는 것이 중요 하다는 것을 확인할 수 있었다. 향후 연구에서는 다 양한 조건 및 장소에서 보다 많은 실험을 실시할 필요가 있다.