Ⅰ서 론
교통량자료는 도로분야, 교통분야, 환경분야 등 매우 다양한 분양에서 활용되는 자료로써, 기초자 료라고 할 수 있다. 교통량자료를 수집하기 위하여 우리나라에서 수행하는 조사는 도로교통량자료사 이다. 이 도로교통량조사 중 상시교통량조사의 경 우 365일 24시간 조사를 하여야하는 특성 때문에 기계식 장비인 AVC(Auto vehicle classification)를 설 치하여 교통량자료를 수집하고 있다.
상시교통량자료의 경우 사람이 수집하는 것이 아닌 기계를 통하여 자료를 수집하기 때문에, 장비 의 오작동 및 고장 등의 원인으로 일부 교통량자료 누락이 발생한다. 이런 누락 교통량자료들을 보정 하기 위하여 과거부터 현재까지 다양한 보정방법론 들의 검토 및 적용이 이루어지고 있다. 그러나 지금 까지의 교통량자료 보정방법론들은 기후가 교통량 에 주는 영향을 전혀 고려하지 않고 보정을 수행하 여 왔다.
경험적으로 얼마만큼 그 차이가 존재하는지는 모르지만 맑은 날의 교통량과 비 내리는 날의 교통 량과 눈 내리는 날의 교통량이 서로 다르다는 것을 알고 있다. 따라서 누락된 교통량을 보다 정확하게 보정하기 위해서는 기후의 영향을 고려한 보정이 이루어져야 한다.
특히 강우의 경우 기상청의 자료에 따르면, 기후 현상 중 강우현상은 100일 정도가 1년에 평균적으 로 관측되고 있고 발표하였다. 또한, 최근 몇 년간 이상기후의 영향으로 인하여 국지적으로 열대성 폭 우현상도 과거에 비해 그 관측빈도가 높아지고 있 다. 즉 우리나라는 연간 강우현상이 매우 빈번히 발 생하고 있으며, 또 그 강도가 점점 강해지고 있는 실정이다. 이런 상황에서 더 정확한 교통량자료의 보정을 위해서는 강우의 영향을 반영의 필요성이 점점 높아지고 있다고 하겠다.
따라서 본 연구에서는 일반국도에서 수집된 교 통량자료들을 대상으로 누락 교통량자료 보정에 있 어 기후, 특히 강우의 영향을 고려한 보정방법에 관 한 연구를 수행하였다.
II기존문헌 고찰
1.기후와 교통과의 관계 연구사례
Hanbail(1993)의 연구에서는 강설 및 빙판 도로의 상황에서 교통량감소 정도를 살펴보았다. Illinois, Minnesota, New York, Wisconsin 등지에서 교통량자 료를 수집하였으며, 지역에 따라 눈보라가 치는 동 안에 교통량은 7%에서 56%까지 감소한다는 결과 를 도출하였다. [1]
Ibrahim(1994)는 기후상황에 따라 교통류율과 속 도가 어떻게 변화하는지에 관한 연구를 진행하였 다. 해당 연구에서는 강우시 교통류율과 속도의 변 화를 강우량에 따라 구분하여 분석을 진행하였다. 분석결과 적은 강우의 경우 교통류율과 속도의 감 소는 매우 미미하지만, 많은 강우에서는 상당한 수 준의 교통류율과 속도의 감소가 있다고 제시하였 다. [2]
Hassna(1999)은 스코틀랜드 Lothian 지역에서 수 집된 교통량과 기후자료를 분석하였다. 주중과 주 말의 경우를 분리하여 강우와 강설인 기상상황에 대하여 분석을 진행하였다. 이중 강우상황일 때 주 중의 경우 3%의 교통량의 감소가 관측되었으며, 주 말의 경우 4%의 교통량의 감소가 관측되었다고 분 석하였다. [3]
Manish(2005)는 강우시 도로의 용량이 감소하여, 많은 비(0.25 inches/hour이상)가 내리는 경우 4∼7% 정도의 용량 감소가 있다고 주장하였다.[4] Kevin(2005)은 호주 Melbourne의 기후에 따른 교통 류율의 변화를 살펴보았다. 기후가 나뻐지면 교통 류율이 감소한다고 분석하였다. 시간당 2mm에서 10mm정도 비가 내린 경우 교통량은 2∼3% 정도 감소하며, 이중 2mm∼5mm구간이 가장 큰 3.43%의 감소율을 보인 다고 주장하였다.[5]
Manjunathan(2006)은 고속도로에서 수집한 자료 를 대상으로 연구를 진행하였으며, 기상과 교통량 의 상관관계가 있음을 증명은 하였지만, 기상이 교 통량 변화율을 얼마만큼 변화시키는지는 명확하게 밝혀내지 못하였다. 단, 교통량이 악천후 시에는 대 략 2%∼7%는 감소한다고 관측하였다.[6]
미국의 도로용량편람인 Highway Capacity Manual (2010)(HCM(2010))에서는 고속도로 구간에서 강우 와 강설시 속도와 도로의 용량이 감소한다고 제시 하고 있다. 이중 강우에 대한 내용을 살펴보면, 가 벼운 강우의 경우 속도는 2∼14% 감소하나 도로의 용량은 감소가 없으며, 많은 강우의 경우속도는 5 ∼17%, 용량은 15%정도 감소한다고 제시하였다.[7]
최정순(1999)은 도속고속도의 기본구간에서 기후 에 따른 교통류 특성을 분석하였다. 주요 결과로는 강우상황인 경우 전차로의 소통능력이 감소하며, 서비스 교통류율은 약 200대/h/lane 정도 감소한다 는 결과를 도출하였다.[8]
김성환(2008)의 연구는 시간당 강우량에 따른 최 대 교통류율과 속도의 변화를 살펴보았다. 강우량 에 따라서 최대 교통류율의 변화를 살펴보았으며, 그 변화량은 10.6%∼24%가 감소하는 것으로 제시 하였다.[9]
국내의 도로용량편람(2013)도 고속도로 기본구간 을 대상으로 강우의 경우 도로용량을 설계속도별로 구분하여 그 감소율을 제시하였다. 강우량이 증가 할수록 또 설계속도가 높을수록 도로용량은 감소하 며, 상황별로 도로용량 감소율은 3.5%∼19.1%로 제 시하였다. 강설의 경우 강설량에 따라서 최대관측 교통량과 평균통행속도가 감소한다고 제시하고 있 으며, 최대관측 교통량의 감소율은 강설량에 따라 13.1%에서 32.7%까지 되는 것으로 제시하였다.[10]
2.교통량보정 연구사례
Conklin(2004)의 연구에서는 교통량, 속도, 점유율 이 각각 누락되었을 때, 여러 보정방법론들을 적용 하여 그 정확도를 평가하였다. 정확도분석 기준으 로 MAPE (Mean Absolute Percent Error)와 RMSE (Root Mean Squared Error)를 사용하였다. 총 7개의 보정방법론들을 비교분석하였으며, 이중 E.M. Algorithm 방법이 가장 좋은 보정치를 산출하였다고 제 시하였다.[11]
Ming Zhong(2005)은 캐나다 Alberta주에서 수집 된 교통량 자료를 활용하여 두 가지 보정방법론의 정확도를 평가하였다. 전년도 혹은 과거 년도의 동 일한 주의 동일한 요일 자료를 설명변수로 사용하 는 Factor 모형과 과거의 자료를 사용하되 최근에 수집된 자료에 더 높은 가중치를 주는 지수이동평 균 모형을 정확도 평가 대상으로 하였다. 정확도분 석 기준은 절대 백분율 오차인 APE(Absolute Percent Error)를 사용하였다. 두 모형 중 지수이동평 균 모형이 더 좋은 보정치를 생산한다고 제시하였 다.[12]
Ming Zhong(2009)이 2009년에 진행한 연구에서 는 기존의 연구와 동일하게 보정방법론들의 정확도 를 APE를 기준으로 평가하였다. 단 기존연구와는 다르게 총 8개의 보정방법론들을 비교하였으며, 기 존의 방법론들보다 개선된 방법론들이 더 정확한 보정치를 산출한다고 평가하였다. 특히 기존 방법 론들은 여러 지점의 도로에서 큰 범위의 정확도(2% ∼20%)를 보였으며, 일부 경우 사용할 수 없을 정 도로 에러치가 높게 나와 현장에 적용하기 어려울 것이라는 판단을 내렸다.[13]
장진환(2004)의 연구는 국도 3호선 중 한 지점에 서 수집된 교통량자료를 대상으로 교통량자료의 누 락시 대체하는 방법에 대한 연구이다. 전·후 기간 평균값, 회귀모형, E.M. Algorithm, 시계열모형 (Autoregressive integrated moving average : ARIMA) 이렇게 4가지 보정방법론들의 정확도를 평가하였 다. 정확도분석 기준으로는 MAPE, RMSE 등을 사 용하였으며, 평가결과 ARIMA모형이 가장 좋은 정 확도를 보인 것으로 분석하였다. [14]
김정연(2006)은 보정방법론들에 대한 구분을 인 접지역 참조방식과 이력자료 활용방식으로 구분하 였으며, 고속도로에서 수집된 교통량자료를 대상으 로 각 방법들의 정확도를 평가하였다. 분석결과 이 력자료 활용방식이 더 정확도가 높은 것으로 분석 하였다.[15] 하정아(2007)의 연구에는 계절시계열 분 석과 자기회귀분석을 이용하여 누락자료의 보정시 행 후 정확도를 분석하였다. 개절시계열 분석은 장 기예측의 경우 보정치의 정확도가 하락한다는 한계 점이 존재하며, 이에 반해 자기회귀 분석은 시계열 분석보다 오차가 적은 것으로 제시하였다.[16] 김현 석(2007)의 연구는 교통량 자료 보정에 있어 해당 자료가 가지고 있는 주기적 순환성을 반영하기 위 해 순환확률 분포모형을 제안하였다. [17]
김정연(2007)은 인접지점 자료를 활용하는 공간 적 보정방법과, 이력자료를 사용하는 시간적 보정 방법의 각 종류별로 보정정확도를 살펴보았다. 고 속도로의 2개 지점에서 수집한 교통량자료를 대상 으로 진행하였으며, 정확도를 평가하기 위하여 사 용한 기준은 Mean Absolute Error(MAE)와 RMSE를 사용하였다. 이력자료를 사용하는 방법이 인접지점 자료를 사용하는 방법보다 정확도가 더 높은 것으 로 분석하였다.[18]
3.기존문헌 고찰의 시사점
기후와 교통과의 관계에 대한 기존문헌들을 검 토한 결과 기후는 교통에 영향을 미치는 중요한 요 소임을 알 수 있다. 특히 여러 연구에서 강우는 내 리는 비의 양에 따라서 교통에 미치는 영향 정도가 차이가 발생한다는 것이 일반적인 결론이었다. 따 라서 본 연구를 진행함에 있어 모든 강우가 교통량 에 영향을 준다고 보지 않고, 일정 수준이상의 강우 만 교통량에 영향을 준다고 판단하고 내린 강우량 이 적은 경우 맑은 날과 동일하게 처리하는 과정의 수행이 필요할 것으로 사료된다.
그리고, 교통량자료 보정관련 기존문헌들을 검토 한 결과, 기후의 영향을 고려해서 보정을 수행한 방 법론에 대한 연구는 거의 찾아보기 힘든 상황이다. 따라서 본 연구에서 시도하려는 강우의 영향을 고 려하여 교통량자료를 보정방안은 기존연구들과 차 별성을 가진 연구라고 판단된다.
III연구 방법론
기존 문헌들을 검토해본 결과 교통량자료의 보 정방법론은 그 특징에 따라 크게 2가지로 분류가 가능하다. 하나는 인근지점의 자료로 해당지점의 교통량자료를 보정하는 공간적 방법과 다른 하나는 해당지점의 과거시점의 자료로 보정하는 시간적 방 법이다. 본 연구에서는 강우 이외의 요인이 교통량 에 영향을 주는 것을 피하고자 시간적 방법에 해당 하는 보정방법들로 한정지어 연구를 진행하였다.
기존에 시간적 보정방법론에서는 교통량자료가 수집된 날의 강우 여부에 대한 검토는 수행되지 않 았다. 이에 강우의 영향을 반영하기 위하여 본 연구 에서는 “강우일에 발생한 교통량자료의 누락의 보 정시에는 과거 강우일의 교통량자료만을 활용하여 보정하는 것이 더 정확할 것이다.”라는 가정을 수립 하고 이를 확인하고자 하는 분석을 수행하였다. 본 격적인 분석에 앞서 전체조건으로는 교통분야에서 널리 알려진 사항중 하나로 평일과 휴일에 서로 상 이한 교통특성이 있다는 것을 반영하기 위하여 평 일과 휴일을 구분하여 분석을 진행하였다. 가정을 확인하기 위한 분석의 연구 흐름도는 다음과 같다.그림 .1
1.교통량자료와 기상자료의 매칭
분석에 사용한 교통량자료는 일반국도에서 수행 된 2013년 상시교통량조사 결과 수집된 자료를 사 용하였다. 기상자료는 동일한 년도에 기상청의 자 동기상관측 장비인 AWS(Automatic Weather System) 에서 수집된 자료를 활용하였다.
교통량자료 조사지점을 기반으로 교통량자료와 기상자료의 매칭을 수행하였다. 교통량자료와 기상 청자료와의 매칭은 총 두 단계로 진행하였다. 첫 번 째 단계는 주소를 기반으로 일차로 매칭을 수행하 였으며, 이후 두 번째 단계로 매칭 되지 않은 지점 들을 대상으로 추가로 GIS 좌표를 통하여 매칭을 수행하여 짝을 형성하였다. 이렇게 매칭을 수행하 여 분석에 사용할 지점들을 도출하였다.
2.분석지점 선정
조사지점의 매칭이 끝난 지점들 중 상세한 분석 을 위하여 실제 분석지점을 선정하는 작업을 수행 하였다. 분석지점의 선정은 다음 두 가지 기준이 적 용되었다. 첫째 분석에 사용되는 자료는 일반국도 에서 수집된 자료이기 때문에 일반국도의 교통특성 을 잘 반영해야한다는 점과 둘째 전제조건인 평일 과 휴일의 구분하여 분석을 수행하기 위하여 분석 지점은 평일과 휴일 동시에 일정 수준 이상 강우일 이 확보 되어야 한다는 점이다.
이를 위해서 본 연구에서는 우선 일반국도가 가 지고 있는 교통특성을 검토해 보았다. 일반국도의 경우 우리나라에서 고속국도와 함께 국가의 기간도 로망을 형성하는 도로로서, 고속국도보다 더 많은 지역들을 커버하기 때문에 매우 다양한 형태의 교통 특성을 가지고 있는 것으로 알려져 있다. 이런 일반 국도들의 교통특성을 반영하기 위하여 본 연구에서 는 일반국도의 교통특성별로 유형을 분류한 후, 각 유형별로 대표지점을 선택하는 방법을 사용하였다.
일반국도의 교통특성에 따라 유형을 분류한 연구 들은 예전부터 꾸준히 진행되어 왔다. 백남철(1999) 의 연구에서는 일반국도의 분류를 총 11개로 제시 하고 있으나, 각 분류집단이 가지는 정의는 제시하 지 못하고 있다는 한계점이 존재한다.[19] 김범진 (2006)은 도로의 군집별로 설계시간계수의 산출에 관한 연구를 진행하는 과정에서서 일반국도의 분류 를 도시부/지방부/관광-위락부 이렇게 셋으로 구분 하였다.[20] 임성한(2008)의 연구에서는 혼합모형을 이용하여 일반국도의 도류유형을 진행하였다. 해당 연구에서는 도시부/지방부/관광부로 총 3개의 분류 로 구분하였다.[21] 하정아(2012)의 연구는 일반국도 에 대한 분류를 수행한 후 연평균 일교통량을 추정 하는 연구를 진행하면서 총 5개의 그룹으로 분류하 였다. 하지만 이 그룹 중 정의를 제시하고 있는 그 룹은 출-퇴근/관광부/지방부 이 셋만 제시하고, 나머 지 두 그룹은 기타1과 기타2로만 제시하고 있다.[22]
기존연구들의 일반국도 유형 분류결과를 살펴보 면 초기연구의 경우 11개까지 유형을 분류한경우도 존재하지만, 후기연구에 들어서는 3개 군집으로 구 분하는 것이 일반적인 결론이었다. 따라서 본 연구 에서도 일반국도에서 관측되는 교통특성에 따른 유 형의 분류를 도시부, 지방부, 관광부로 선정하고, 교 통량자료가 수집된 496개 지점들의 교통특성별 유 형 분류를 위하여 K-mean 군집분석을 수행하였다.
군집분석은 K-mean방법(K는 3으로 설정)을 이용 하였다. 군집분석에 사용한 변수는 AADT(Annual Average Daily Traffic), 설계시간 계수(K30), 일요일 계수, 휴가철계수, 주간교통량비율, 첨두율, 변동계 수이다. 각 설명변수의 정의는 다음 <표 1>과 같다.
각 설명 변수들 간의 상관성 검토 및 요인분석을 진행하여 도출된 2개의 요인으로 K-mean 군집분석 을 수행하였다. 군집의 수는 앞서 관련연구의 검토 결과 선택된 도시부/지방부/관광부 이렇게 3개로 정 하였다. 군집분석결과 각 그룹별로 포함된 지점의 수는 우선 1번 그룹의 경우 269개 지점이 포함되었 으며, 2번 그룹은 76개의 지점이며, 마지막으로 3번 그룹은 151개의 지점이다. 각 그룹별로 설명변수들 의 평균값은 위의 <표 2>와 같다. 우선 1번 그룹의 경우 모든 설명변수들의 평균값이 세 그룹의 중간 에 위치하고 있는 것을 확인 할 수 있는데, 이는 1 번 그룹은 세 그룹 중 중간의 특성을 가지는 지방 부의 특성을 가지고 있는 것으로 판단된다. 2번 그 룹은 가장 낮은 AADT(5,936 대/일)를 가지고 있으 며, 교통량의 변동과 관련된 값들은 전부 가장 높은 값을 가지고 있다. 이런 교통특성을 유추하여 볼 때, 2번 그룹은 관광부인 것으로 판단된다. 마지막 으로 3번 그룹의 경우 가장 많은 AADT를 가지고 있으며, 교통량 변동과 관련된 설명 변수값은 가장 낮은 것을 확인 할 수 있다. 따라서 3번 그룹은 도 시부로 판단된다.
군집분석의 결과를 바탕으로 각 그룹에서 해당 그룹의 특성을 잘 반영하는 지점들을 3지점씩 선택 하여 분석지점으로 선정하였다. 분석 지점 선정의 기준은 각 그룹의 교통 특성을 잘 반영하는지 여부 와 평일과 휴일 각각 충분한 수의 강우일이 관측되 는지 여부이다.
충분한 수준의 강우의 관측여부를 판단하기 위 하여 우선 평일과 휴일의 구분은 다음과 같은 기준 으로 나누었다. 휴일은 토요일과 일요일이 기본으 로 포함되며, 그 외의 요일 중 법정휴일로 지정된 날을 포함시켰다. 평일은 휴일 이외의 날로 정하였 다.
또한 기존의 문헌검토 결과 일정 수준이상의 강 우만이 교통에 영향을 준다는 시사점이 도출되었기 때문에 다음과 같은 두 경우에서는 강우가 관측되 지 않은 것으로 처리하였다. 첫째, 적은 강우량 (10mm/일 이하)이 내린 경우와 둘째, 많은 양의 강 우가 관측되었다고 하더라도 통행량이 적어 강우가 교통에 미치는 영향이 없다고 판단되는 시간대인 심야(00시∼06시)에 강우가 내릴 경우가 그것이다.
그리고 마지막으로 강우에 대한 영향을 반영하 는 것이 본 연구의 목적이기 때문에, 1년 중에 강우 보다는 강설상황이 자주 발생하는 1월/2월/12월과 기온이 영하로 내려간 11월의 날은 분석에서 제외 하였다. 이후 3월부터 11월(단, 기온이 영상 이상인 날) 사이에 관측된 교통량자료를 대상으로 평일과 휴일에 각각 강우 일수가 10일 이상이며, 가능한 한 많은 강우가 관측된 지점을 선정하였다. 이렇게 선 정된 지점은 각 그룹별로 3지점씩, 총 9지점이며 이 들의 교통특성은 앞 쪽의 <표 3>과 같다.
지점 3의 경우 AADT값이 6,541대/일로 관광부의 평균치와 유사하지만, 다른 교통특성들은 전부 지 방부의 특성을 가지고 있어 단순히 지방부 그룹들 중 일교통량이 적은 지점으로 판단된다.
3.분석지점의 교통량자료 분석
앞에서 선정한 분석지점들을 대상으로 강우가 영향을 미치는 여부를 확인하기 위하여, 지점별로 강우일과 비 강우일로 구분하여 평균일교통량의 동 일여부를 T-검증을 통하여 살펴보았다. 신뢰구간 95%의 수준에서 양측검정을 수행하였으며, 결과는 다음 <표 4>와 같다.
강우일과 비 강우일의 교통량의 분산이 등분산 하는 지는 Levene의 등분산 검정을 통하여 수행하 였으나, <표 4>를 보면 알 수 있듯이 두 집단이 등 분산 하는 지에 상관없이 모든 T-검증의 유의확률 값이 0.05보다 작을 것으로 분석되었다. 이는 강우 일의 평균교통량과 비 강우일의 평균교통량은 통계 적으로 유의미한 차이가 존재하다는 의미이다. 또 한 두 집단의 평균값이 동일하지 않기 때문에 강우 일과 비 강우일의 교통량은 서로 다른 집단이라는 의미이며, 이는 강우의 영향으로 인하여 교통량이 달라졌다는 것을 뜻한다.
특히 평균 AADT만을 보았을 때 이번에 분석한 9개의 분석지점에서는 강우일이 비 강우일보다 적 은 값을 가지는 것으로 분석되었다. 즉 강우가 본 연구의 분석지점들에서는 교통량을 감소시키는 방 향으로 영향을 준 것으로 판단된다. 물론 이는 모든 일반국도에서 강우는 교통량의 감소를 가져온다는 것을 뜻하는 것이 아니며, 이를 증빙하기 위해서는 더 많은 일반국도 지점들을 대상으로 추가적인 연 구가 진행 되어야 할 것으로 판단된다.
IV분석 결과
누락 보정을 수행하기에 앞서 누락 자료가 존재 하지 않은 정상인 9개의 분석지점의 교통량자료를 대상으로 누락을 발생시켰다. 누락 자료의 발생의 대상은 강우일만1) 대상으로 진행하였으며, 10%, 20%, 30%, 40%, 50% 까지 임의로 누락을 발생시켰 다.
이후 누락된 자료를 보정하기 위하여 사용할 누 락보정 방법론을 선택하였다. 누락보정 방법론은 실제 교통량과 관련하여 자료를 관리하는 기관에서 사용하는 방법을 사용 하는 것이 가장 좋으나. 각 기관에서 사용하는 누락보정 방법론에 대하여 명확 하게 공개를 하지 않고 있는 실정이다. 따라서 본 연구에서는 자료의 누락이 있는 경우 보정을 위하 여 일반적으로 사용하는 통계적인 방법론들인 “평 균대체법(Unconditional Mean: 이하 UM)”, “자기회 귀모형(Auto Regression Model: 이하 AR)기법 ”, “EM (Expectation-Maximization: 이하 EM) 기법”을 선택하여 누락보정 및 정확도 분석을 진행하였다. 각 보정방법론들의 정의는 다음과 같다.
UM은 누락이 발생한 자료들을 전부 평균값을 대체하는 기법이다. 이 방법은 적용하기 쉽다는 장 점을 가지고 있다. 하지만, 이상치 등의 영향 받기 쉬운 평균값을 보정값으로 사용한다는 한계점이 있 다.
여기에서,
Missing Data = 누락 교통량자료
Data = 관측된 교통량자료
n = 관측 교통량자료 수
AR은 누락이 발생된 자료를 종속변수, 그리고 한 시점 전(전주의 동일요일 일교통량)의 자료들을 설명변수로 설정하여 회귀분석을 수행한 뒤 도출된 회귀모형을 활용하여 누락을 보정하는 방법이다. 본 연구에서는 현 시점의 교통량자료를 종속변수, 한 시점 전의 과거의 교통량자료를 설명변수로 설 정(AR(1))하여 분석을 진행하였다.
여기에서,
Xt = 현 시점 교통량자료
Xt-1 = 과거 한시점 전 교통량자료
t = 시점
c = 회귀 상수
εt = t 시점에서 회귀 오차
EM은 누락치를 보정하는 방법은 E 단계와 M 단 계가 반복적으로 수행되는 과정으로 진행된다. E 단계는 누락된 자료 집단과 계수의 추정치가 주어 진 상황에서 누락값들의 조건부 기댓값을 산출하 고, 이 기댓값으로 누락을 보정한다. 이어서 M 단 계에서는 E 단계의 기댓값으로 보정된 데이터 집단 의 Loglikelihood 값을 최대화시킴으로서 계수 추정 치 값들을 갱신한다. 이런 과정의 반복을 통하여 기 댓값이 일정한 값으로 수렴하게 되며, 이 수렴값을 최종 보정값으로 사용하는 방법이다.
본 연구에서는 SPSS를 사용하여 이 세 가지 보 정 방법론들을 적용하였다. UM의 경우 변수변환에 있는 결측값 대체의 기능 중 평균값 대체를 활용하 여 보정값을 산출하였으며, AR와 EM의 경우 분석 의 결측값 분석에 있는 회귀분석과 EM 기법을 활 용하여 보정값을 산출하였다.
강우영향 미고려와 고려시 각 보정방법별로 적 용방법은 다음과 같다. 우선 UM의 경우 평균값의 산출시 강우영향 미고려 케이스는 전체 자료에서 평균값을 산출하여 이를 보정값으로 활용하였고, 강우영향 고려 케이스는 강우일의 일교통량자료에 서 평균값을 산출하여 이를 보정값으로 활용하였 다. AR의 경우 강우영향 미고려 케이스는 전체 자 료에서 한 시점 전의 자료로 자기회귀모형을 수행 하여 보정값을 산출하였고, 강우영향 고려 케이스 는 강우일의 일교통량자료만으로 자기회귀모형을 수행하여 보정값을 산출하였다. EM 역시 AR와 동 일하게 강우영향 미고려 케이스는 전체 자료에서 EM 알고리즘을 수행하여 보정값을 산출하였고, 강 우영향 고려 케이스에서는 강우일의 교통량자료만 을 가지고 EM 알고리즘을 수행하여 보정값을 산출 하였다.
본 연구에서는 보정값의 정확도를 확인하기 위 한 지표로 MAPE(Mean Absolute Percent Error)값을 이용하였다. MAPE는 참값과 보정값 간의 절대값의 차를 참값대비 비율값으로 나타낸 평가기준으로, 참값 대비 오차의 크기를 비율로 계산하기 때문에 서로 다른 크기를 가지는 보정값들의 상대적인 비 교가 가능한 장점이 있다. 앞서 제시한 <표 4>를 보 듯이 본 연구에서 사용한 일교통량의 경우 표준편 차가 가장 큰 경우 약 4,244대로 나타나 그 차이가 심한 지점은 일교통량의 차이가 매우 큰 것을 알 수 있다. 따라서 다른 평가기준보다, 보정값들의 상 대적인 비교가 가능한 MAPE를 지표로 선정하였다. MAPE의 상세한 계산식은 다음과 같다.
여기에서,
n = 전체 교통량자료 수
Xi = 누락된 교통량의 보정값
Yi = 누락된 교통량의 실제값
각 보정방법 별로 보정된 값들의 정확도인 MAPE를 계산하였다. 대부분의 케이스에서 강우의 영향을 반영하였을 때 더 정확한 보정치를 산출하 는 것으로 분석되었다. 각 보정방법별로 상세히 살 펴보면 다음과 같다.
우선 UM을 활용하여 보정한 값들의 MAPE를 정 리하면 다음 <표 5>와 같다. 대부분의 케이스에서 강우의 영향을 고려하여 보정한 경우 MAPE값이 더 낮게 산출되었다. 하지만, 도시부 그룹 지점 8번 의 평일에 10%의 교통량누락을 발생시킨 케이스에 서는 강우의 영향을 반영하여 보정한 정확도가 더 나쁜 것(0.50%→0.58%)으로 산출 되었다. 이후 평일 20%의 교통량누락 발생 때부터 강우의 영향을 반 영하여 보정하는 것이 더 높은 정확도를 보이는 것 으로 보아, 적은 표본에 의한 편중이 발생하였기 때 문인 것으로 사료된다. 강우의 영향을 반영후의 산 출된 MAPE값은 약 0.04%에서 약 7.87%까지의 범 위를 가지는 것으로 산출되었으며, 가장 높은 개선 효과를 보인 곳은 관광그룹의 4번 지점이다.
AR을 활용하여 수행한 보정값들의 MAPE를 산 출하면 다음 <표 6>과 같다. 표에서도 나오듯이 모 든 케이스에서 강우의 영향을 반영하여 보정하였을 때가 더 낮은 MAPE 값이 산출되었다. 가장 많은 개선의 효과를 보이는 곳은 관광그룹에 속하는 6번 지점의 휴일로서, 50% 결측 발생시 MAPE값이 약 22.02%에서 약 5.63%로 정확도가 증가(약 16.39% 감소)한 것으로 계산되었다. 강우의 영향을 반영한 후에 산출된 MAPE 값의 범위는 약 0.04%에서 약 9.72%인 것으로 산출되었다.
EM을 활용하여 수행한 보정값들의 MAPE역시 AR의 결과와 동일하게 모든 경우에서 더 낮은 MAPE 값을 가지는 것으로 산출되었다. 강우의 영 향을 반영한 후 산출된 MPAE는 약 0.04%에서 약 10.40%까지 있는 것으로 분석되었다. 가장 높은 정 확도의 향상을 보인 케이스는 역시 관광그룹의 6번 지점이며, 50%의 결측 발생시 MAPE 값이 약 21.84%에서 약 6.52%로 개선의 효과(약 15.32% 감 소)가 있는 것으로 산출되었다.표 .7
V결론
본 연구에서는 강우일에 발생한 교통량자료의 누락을 보정하는 경우, 과거 강우시의 교통량자료 만으로 보정을 하는 것이 더 정확할 것이라는 것을 증명하고자 하였다.
이러한 증명을 위하여 일반국도에서 수집된 교 통량자료와 기상자료를 매칭 하였으며, 다양한 교 통특성을 가지고 있는 일반국도의 상황을 반영하기 위하여 군집분석을 수행 한 후 분석지점을 선정하 였다. 이후 UM, AR, EM 보정기법들을 사용하여 기 존의 과거 전체일의 교통량자료로 보정하는 것과 과거 강우일의 교통량자료만 가지고 보정하는 것의 정확도를 분석하여 보았다.
분석결과 대부분의 케이스에서 과거 강우일의 교통량자료만을 가지고 보정하는 경우가 더 좋은 정확도를 가지는 것으로 분석되어 본 연구의 가정 이 옮음을 증명하였다. 또한 각 보정방법별로 정확 도 개선효과가 가장 높은 경우를 살펴보았는데, 각 보정방법별로 분석지점의 차이는 존재하나 모두 관 광그룹에서 가장 높은 개선효과를 보이는 것으로 분석되었다. 이는 관광지에서 강우가 교통량에 영 향을 미치는 강도가 더 강하다는 것을 의미하며, 강 우시 관광지로 통행을 하지 않아 교통량차이가 많 이 발생한다는 것과 일치한다고 할 수 있다.
본 연구의 결과를 활용하여 강우시 교통량의 누 락이 발생하였을 때 현재보다 더 정확도 높은 보정 값을 산출이 가능하리라 판단된다. 본 연구의 한계 점은 강우가 교통량에 어떤 영향을 주는지에 대한 분석을 하기 보다는 단순히 강우일에 발생한 교통 량자료 누락시 이를 보정하는 방법에 관한 연구였 다. 따라서 강우가 교통량에 주는 영향이 어떤 것인 지를 증명하고, 이를 바탕으로 누락 교통량자료 보 정에 사용할 수 있는 날씨 보정계수를 산출하기 위 한 추가 연구가 필요한 것으로 사료된다. 또한 이런 추가 연구를 진행하기 위해서는 보다 다양한 분석 지점과 더욱 많은 일교통량과 매칭된 강우의 자료 의 구축이 필요할 것으로 판단된다.