I.서 론
수요 및 통행시간 예측, 교통류 분석 등 교통 분야에서 회귀모형(Regression model)은 매우 다양하고 폭 넓 게 활용되고 있다. 회귀모형은 시간이나 비용의 제약으로 모집단 전체를 분석할 수 없는 상황에서 표본만을 이용해 모형을 구축함으로써 현실세계를 모사할 수 있게 해주는 통계적 방법론으로 널리 알려져 있다.
그러나 두 집단의 표본을 이용한 모형화 과정에서 간혹 두 집단의 회귀모형 간에 통계적으로 유의미한 차 이가 존재하는지 의문을 가질 경우가 있으며, 경우에 따라 공학적 판단을 위해 두 회귀모형간의 유사성을 검 증하는 작업이 필요할 때도 있다.
예를 들어, A지역과 인근에 위치한 B지역에 대한 각각의 인구수를 자동차보유대수로 추정하는 단순선형 회귀모형을 만든다고 가정해 보자. 두 모형식의 기울기 모수에 대한 추정값이 수학적으로 다르다 하더라도, 통계적 유의성 검정을 통해 통계적으로 두 모형은 같다는 결과가 나올 수 있다. 이러한 경우 각각의 회귀식 을 제시하면서 두 지역에 어떤 차이가 존재한다는 식의 해석을 한다면 중대한 오류를 범할 수 있다.
회귀모형은 미지의 모수에 대한 추정값과 추정값에 대한 표준오차를 제공하기 때문에 모수의 추정값 만 의 비교를 통해 모형 간 유사성 판단을 위해 적용하는 것은 문제가 있다는 말이다.
이러한 회귀모형간의 유사성 검증을 위해 Chow(1960)가 개발한 회귀계수들에 대한 통계적 검정기법을 다 양한 분야에서 활용해 오고 있는데, 국내 교통분야에서는 이러한 추가적인 검증절차를 실제 적용한 사례가 거의 없는 실정이다.
외국 연구사례를 살펴보면 차우검정기법을 활용하여 메카로 향하는 성지순례객의 통행패턴 분석을 통해 양방향 교통류의 속도-밀도 관계식을 해석하거나(AlGadhi, 2002), 북미·아시아·유럽·기타 국가들의 도시 교통수요를 분석하는 데 있어 승용차 수요와 대중교통 수요를 나타내는 두 개의 모형이 지역별로 차이가 있 지 않다는 결론을 얻어내기도 하였다(Souche, 2010). 또한, 교통량이 많아 대기행렬이 발생하는 신호교차로의 대기행렬 길이를 예측하는 모형에 활용되기도 하였으며(Yang et al., 2013), 인도에서는 사망사고 분석 모형에 활용되어 전체 분석기간을 사용한 모형과 분석기간을 세분한 모형간의 차이점을 증명하기도 하였다 (Ponnaluri, 2012). 팔레스타인 지역에서 자동차 수요와 운전자 간의 상관관계를 모형화 하는데 있어 지역간 모형의 차이점을 차우검정기법을 활용해 밝혀낸 사례는 본 연구의 목적과 유사한 사례라 하겠다(Abu-Eisheh, 2001).
교통분야의 회귀모형간 비교연구 사례를 살펴보면 주야간 교통사고 특성분석을 통해 각기 다른 사고모형 을 개발한 후 공통변수와 특정변수를 활용해 단순히 변수의 의미를 비교하는 과정을 거치거나(Yoo et al., 2008), 고령운전자와 비고령운전자 간의 교통사고 심각도 모형을 구하고 개별 모형의 유의성을 검증하는 연 구(Kim et al., 2009)가 주를 이루었다.
최근 들어 Akaike information criterion(AIC)과 유한표본을 이용해 수정한 AIC(AICC), Schwarz’s Bayesian information criterion(BIC) 등을 활용해 교통사고 모형을 도출하는데 있어 선형, 비선형, 비내포모형과 내포모 형 모두에 활용할 수 있는 새로운 함수식 선정 방법을 제시한 진일보한 연구가 이루어지기도 하였으나(Baek and Joseph, 2012) 여전히 회귀한 모형식간의 유사성 혹은 차이를 비교하는 연구는 매우 드문 실정이다.
따라서 본 연구에서는 교통류 모형에서의 속도-밀도함수식을 선형 회귀 모형식으로 개발하고, 차우검정기 법을 활용하여 추정된 모수 값들이 통계적으로 차이가 있는지를 검정해 보고자 한다. 결국 모형을 구성하는 모수 추정값들이 통계적으로 차이가 있는지를 검정해 봄으로써 모형간의 유사성 유무를 판단해 보고자 한다.
II.문제점 고찰 및 개선방안 검토
1.회귀모형간 비교 검증 필요성
회귀모형은 비교적 간단하게 분석을 수행할 수 있는 반면, 통계적인 검증절차를 면밀히 수행하지 않을 경 우 오류 발생 가능성이 있다. 회귀모형의 구축과 활용에 있어서의 이러한 가능성을 교통류 분석에 활용되는 속도-밀도 회귀모형식을 이용해 설명해 보고자 한다.
<Fig. 1>은 비가 내리는 상황에서 고속도로 특정구간의 주간과 야간에 관측된 속도 및 밀도 자료를 바탕 으로 한 속도-밀도간의 선형회귀식(Greenshields 제안)을 나타내고 있다. 통상 기존 문헌에서는 기상조건에 따 라, 주야에 따라 교통특성이 다름을 제시하고 있다(Miao and Fred, 1999; Robert et al., 2006).
<Fig. 1>의 자료 분포를 살펴보면 야간이 주간보다 평균적으로 속도가 낮게 분포함을 알 수 있다. 각각의 속도-밀도 관계를 선형식으로 표현하면 식 (1)과 같다. 식 (1)에서 모형 1은 특정구간의 낮에 해당하는 모형 식이며, 모형 2는 동 구간의 밤에 해당하는 모형식이다. 단, 여기서 u는 속도, k는 밀도를 나타낸다.
<Fig. 1>에서와 같이 우천 야간시 동일한 밀도상태에서 주간보다 속도가 낮게 형성됨을 알 수 있으므로, 일단 두 모형이 다름을 전제하고 속도-밀도 모형식의 상이함을 해석하려고 할 것이다.
그러나 만약 통계적 검정에 의해 α1 = α2, β1 = β2임을 밝힐 수 있다면, 두 모형은 동일한 모형이라고 할 수 있어 우천시 주야간 통행특성이 다르지 않음을 밝혀낼 수 있다. 따라서 이러한 목적으로 활용되는 차우검 정은 두 회귀모형 간의 유사성 검증에 있어 매우 의미 있는 도구라 할 수 있다.
2.유사성 검정
1)차우검정
Chow는 회귀모형에서 추정된 회귀계수값을 비교하기 위해 통계적 검정 방법을 제안하였으며, 이를 통해 모형 간 유사성 여부를 판정하였다. 차우검정을 통해 두 교통 모형의 유사성이 증명된다면, 이를 하나의 모 형으로 통합하는데 있어 논리적 타당성을 제공하게 된다.
본 연구에서는 속도-밀도와 관련된 두 회귀모형 간 구조적인 차이가 있는지를 확인하기 위해 차우검정을 실시하였다. 구축된 모형의 회귀계수 값들의 비교를 통해 종속변수인 속도의 변화에 영향에 미치는 독립변 수인 밀도와의 관계가 서로 유사한지를 파악하고자 한다. 두 회귀모형의 유사성을 통계적으로 검정하기 위 해 식 (2)와 같은 귀무가설을 설정하였다.
여기서, αi와 βi (i = 1,2)는 각 모형의 설명변수의 절편과 기울기에 대한 계수값을 각각 의미한다. 두 모형 의 해당 모수 추정값의 차이가 존재하여 귀무가설을 기각하게 되면 두 모형은 독립변수들이 서로 다른 영향 을 준다고 말할 수 있다. 식 (2)에서 α1≠α2 또는 β1≠β2일 경우 서로 다른 모형으로 받아들이게 되며, α1 = α2, β1 = β2임이면, 두 모형은 통계적으로 동일한 모형이라는 것이 검증되는 것이다.
차우검정은 전체 자료를 가지고 추정한 회귀계수와 일부의 부분집합 자료를 가지고 추정한 회귀계수가 서로 같다는 가정을 통계적으로 검정할 때 사용하며, F-분포를 따르는 검정이다. 제약이 있는 경우의 잔차제 곱합은 자료를 통합하여 하나의 회귀모형을 구축하고, 여기에서 도출된 잔차제곱합(rSSE : restricted sum of squared errors)을 이용하며, 이때의 자유도는 n – k이다.
제약이 없는 경우는 각각의 회귀모형을 추정하여 얻어진 각 모형의 잔차의 합인 SSEi를 더한 잔차제곱합 으로 얻어지며, 이때의 자유도는 n – 2k이다. 여기서 n은 관측값의 수를 나타내며, k는 모수의 개수를 나타 낸다. 차우검정을 요약하면 식 (3)와 같다.
식 (2)에서와 같이 차우검정의 경우, 두 모형의 절편과 기울기 중 어느 하나만 달라도 귀무가설을 기각하 기 때문에, 절편과 기울기 중 어느 모수 또는 두 모수 모두 때문에 모형의 구조적 변화가 발생했는지에 대해 확인해야 하는 과정이 필요하다. 따라서 차우검정 후 절편과 기울기 각각에 대하여 모수의 추정값의 차이가 존재하는지를 검증하는 작업을 수행해야 한다.
2)절편검정
두 모형 간의 절편(α)의 차이를 확인하기 위해 다음과 같은 기본 식을 활용한다.
여기서, α는 절편, β와 γ는 각각 밀도 변수 xi와 더미변수에 대한 계수값을 의미한다. di는 더미변수로서 주간은 0, 야간은 1로 가정했다. 이를 모형식으로 표현하면 식 (5)와 같다.
여기서 γ가 통계적으로 0이면 모형 1과 모형 2의 절편은 서로 같은 것이며, γ가 통계적으로 0이 아니면 절편이 서로 다르다고 할 수 있다.
3)기울기검정
두 모형간의 기울기(β)의 차이가 존재하는지에 대한 통계적 검정을 실시하며, 이에 대한 기본식은 식(6)과 같다.
이를 모형식으로 표현하면 다음과 같다.
여기서, δ가 0이면 기울기는 β로 같고 δ가 0이 아니면 두 모형의 기울기가 서로 다르다고 판단할 수 있 다. 여기서 만약 δ가 통계적으로 유의하지 않아 δ=0으로 판단하게 될 경우, 모형 1과 모형 2의 기울기는 서 로 동일하다고 판단할 수 있다.
4)모형설계 및 절차
<Fig. 2>는 교통 속도-밀도간 선형회귀식을 대상으로 한 모형 유사성 검정 절차를 나타낸 것이다.
III.적용사례 분석
1.분석 대상
이제 모형의 유사성 검정의 유용성을 밝혀내기 위해, 동일 도로지점에서 조건이 다른 두 상황에 대한 속 도-밀도 함수를 추정하고, 이를 검증해 보고자 한다.
먼저 비교를 위해 <Table 1>과 같이 두 가지 경우를 고려하였다. 직관적으로도 차이를 보일 것으로 예상 되는 동일 도로구간에서 우천시 주야 구분을 통해 수집된 두 자료에서 일반적인 선형회귀모형을 추청하기로 한 것이다.
모형 구축을 위해 중부고속도로의 서청주IC~오창IC 구간내 설치된 루프 검지기에서 수집된 교통자료를 활용하였다. 동 구간에 설치된 루프검지기 8개중에서 오차율이 가장 낮고 이상치가 가장 적게 검지되는 두 개의 검지기를 선정하여, 각각 주간과 야간 모형을 개발하였다.
분석대상 기간은 대표적인 우기인 7월, 8월로 하였으며, 1시간 단위의 교통 특성 자료를 수집하여 분석에 활용하였다. 또한 야간주행 여부는 일단위로 기상청에서 제공되는 일몰시간을 기준으로 하여 판단하였으며, 우천여부 역시 기상청에서 제공하는 시간단위 강우량 자료를 활용하여 분리하였다. 본 연구에서는 결과의 객관성을 높이기 위해 상기 대상구간 내 두 개 지점을 선정하여 지점별 우천시 주간과 야간 교통특성 자료 를 확보하였다.
수집된 자료를 바탕으로 속도-밀도식을 추정해 본 결과, 우천시 주간(Model 1)과 야간(Model 2) 자료에서 통계적으로 유의한 모형식이 도출되었다. 따라서 주간(Model 1)과 야간(Model 2)에 대한 모형 간 차이 여부 를 밝히고자 한다.
2.모형 개발
선정된 두 지점의 주간과 야간에 대한 속도-밀도 함수에 대한 모형 추정 결과는 <Table 2>와 같으며, 통계 적으로 유의한 결과를 보이고 있음을 알 수 있다. 속도-밀도 관계의 가장 기본적인 함수식은 Greenshields가 제안한 선형 모형식이며, 기본 형태는 식 (1)과 같다(Chow, 1960).
<Table 2>의 두 지점의 주간과 야간에 대한 통계적 모형에 대한 유의성 검정 결과 P-값이 0.001보다 작아 유의수준 5%에서 제안된 모형이 적합함을 알 수 있다. 따라서 <Table 2>의 결과를 놓고 볼 때 앞에서도 설 명한 바와 같이 α1≠α2, β1≠β2 라는 결과에 근거하여 우천시 주간과 야간의 속도-밀도 관계식은 전혀 다 른 것으로 받아들이게 된다. 두 지점에서 모두 주간과 야간의 속도-밀도 관계식이 다르다고 확인할 수 있다.
통상적으로 우천 시에는 시인성 저하, 노면 마찰력 감소로 인해 운전에 어려움을 겪게 된다. 특히 야간에 비가 내릴 경우, 주간에 비해 운전자는 더 큰 부담을 갖게 된다. 이는 크게 3가지 요인이 있는데, 첫째, 차량 불빛이 차선위의 물에 의해 불규칙적으로 반사하기 때문에 운전자가 차선을 인식하는데 어려움이 있으며, 둘째, 비로 인해 전조등 불빛이 멀리 가지 못하는 현상이 발생하며, 셋째, 앞 유리에 맺힌 물방울로 인해 운 전자의 시거를 방해하기 때문이다.
3.검정 결과
1)모형간 유사성 검정 결과
본 연구에서의 차우검정에 대한 귀무가설은 식 (8)과 같다. 여기서, αi와 βi는 각 모형의 절편과 기울기에 대한 계수값을 각각 의미한다.
<Table 3>의 차우검정 결과를 보면, 두 지점 모두가 P-값(<0.0001)이 0.05보다 매우 작아 유의수준 5%에서 식 (8)의 귀무가설을 모두 기각하였다. 이 검정결과는 두 조건의 모형으로부터 추정된 회귀계수값 αi와 βi 중 최소 하나는 통계적으로 상이한 값임을 의미한다.
2)절편과 기울기에 대한 검정 결과
앞에서의 차우검정 결과, 두 개 지점 모두 주간과 야간의 모형 간에 상이점이 있음이 밝혀졌으며, 이는 우 천시 주간과 야간의 통행특성이 서로 다르다는 식으로 해석될 수 있음을 의미한다.
따라서 절편과 기울기 중 어느 요소가 모형의 차이에 기여했는지를 밝혀내기 위해 통계적 검정을 시행하 였다. 먼저 모형식간에 절편의 차이를 확인하기 위해 앞서 제시한 다음의 모형식을 이용하였다.
분석 결과는 <Table 4>와 같으며, 두 개 지점 모두 절편의 차이를 나타내는 γ가 통계적으로 유의한 것으 로 나타났다.
다음으로 두 모형간 기울기에 대한 차이가 존재하는지에 대한 통계적 검정을 시행하였다. 역시 앞에서 제 시한 아래의 모형식을 이용하였다.
<Table 5>는 기울기 βi의 차이에 대한 검정 결과를 나타내고 있다. 결과적으로 상기 두 지점에서는 기울 기의 차이를 나타내는 δ가 통계적으로 유의하지 않아 기울기의 차이가 없는 것으로 나타났다.
분석 결과를 요약해 보면, 두 지점 간에는α1≠α2 , β1 = β2의 통계적 검증 결과가 도출되었다. 즉 이를 통해 두 모형은 서로 다름을 알 수 있어 자료를 분리하여 각각의 모형을 세운 것은 타당하다는 결론을 도출 할 수 있다.
또한 본 연구에서 제안한 모형비교 방법을 통해 우천시 야간이 주간보다 용량이 떨어지게 되며, 특히 밀 도의 변화에 따라 일정한 속도차(α1 – α2)를 유지하게 됨을 알 수 있다.
분석 결과를 토대로 우리는 아래와 같은 공학적 판단을 내릴 수 있다. 첫째, 교통류 특성 분석을 위해 우 천시 주간과 야간 데이터를 분리하여 분석하는 것이 타당하며, 만약 분리하지 않은 자료를 사용했다면 분석 자는 결과에 있어 오류를 범할 가능성이 높다. 둘째, 우천시 야간에도 밀도 변화에 따른 속도 감소율이 주간 과 동일하다는 결과를 알 수 있다. 통상 최대 교통류율을 가지고 용량감소 여부를 판정(Point기반)하는 것 보 다는 보다 안정적인 해석(Line기반)을 할 수 있는 셈이다.
물론 국지적인 검지기 자료를 바탕으로 우천시 주간과 야간의 통행속도의 차이가 존재한다는 결론을 내 리기에는 분명 한계가 존재하나, 본 연구는 차우검정 단계가 회귀분석 모형간의 유사성과 차이점을 통계적 으로 설명하는데 매우 유용하게 활용될 수 있음을 증명하였다는 점에서 그 의미가 매우 크다 하겠다.
IV.결론 및 향후과제
교통분야에 널리 사용되는 회귀모형은 분석의 목적에 따라 회귀모형 간 유사성을 검증하는 작업이 필요 한 경우가 발생한다. 이를 위해 본 연구에서는 차우검정이라는 통계적 검정방법을 활용하여 유사성을 증명 하는 방법론을 제안하였다.
특히, 교통분야에서 차우검정법 활용의 유용성을 증명하기 위해, 고속도로 특정구간에서 우천시 주간과 야간의 교통데이터를 수집하여 각각의 속도-밀도 회귀모형을 추정한 후 비교해 보았다.
그 결과 일반적인 상황이라면 통계적으로 두 모형이 상이하다는 결론에 도달했을 회귀결과가 두 모형간 에는 절편의 차이만 통계적으로 유의할 뿐 기울기의 차이는 통계적으로 유의하지 않다는 보다 정제된 결과 를 도출할 수 있었다.
본 연구의 핵심은 우천시 주·야간의 교통 특성에 대한 결론을 내리는 것이 아니라, 교통류 모형간 비교에 차우검정이 얼마나 유용하게 활용될 수 있는지 그 가능성을 보여주는데 있다 하겠다.
결론적으로 차우검정이라는 모형 유사성 검정 절차는 연구자가 내린 결론에 대해 통계적으로 보다 구체 적인 객관성을 담보할 수 있는 것으로 나타났다. 모형 간의 유사성 검정 방법은 다수의 설명변수를 갖는 모 형에도 적용 가능하며, 선형화가 가능한 비선형 회귀모형도 적용이 가능한 바, 향후 회귀모형간의 유사성 검 증에 있어 폭넓은 활용이 기대된다.