Ⅰ서 론
1.연구 배경 및 목적
교통사고로 인한 사회적 손실이 커지면서 교통 사고 발생빈도와 교통사고 심각도에 영향을 미치는 교통량(AADT: Annual Average Daily Traffic), 도로 지형 및 기하구조(Geometric Information) 그리고 교 차로 및 가로구간 신호정보(Signalized Traffic Control) 등과의 관계를 분석하고 이를 모형화 (Safety Performance Functions 또는 Accident Prediction Models)하는 연구가 많이 진행되어져 왔다. 교통사고모형에 주로 사용되는 모형은 다중선형회 귀분석(Multiple Linear Regression), 포아송 회귀모형 (Poisson Regression Model) 그리고 음이항 회귀모형 (Negative Binomial Regression Model) 등이 있으며 각 모형의 선택은 교통사고데이터(Crash Frequency Data)와 교통사고 요인이 되는 변수(Variables)와의 관계에 의하여 이루어진다. 하지만 다중선형회귀분 석의 경우 무작위적이고 산발적으로 발생하는 교통 사고특성을 적절하게 반영할 수 없는 한계를 가지 고 있다. [1, 2] 또한 교통사고데이터가 항상 양의 수(Non-negative)이고 교통사고 발생이 이산적 (Discrete)이므로 선형모형이 적당하지 않으며, 교통 사고 데이터의 오차항(Error Terms, Residual)이 선형 모형처럼 정규분포의 형태를 띠지 않기 때문에 기 존 연구에서는 포아송 모형과 음이항 모형을 이용 하여 교통사고모형을 개발하고 있다. [3, 4, 5, 6]
포아송 모형의 경우 종속변수의 분산이 분산의 평균과 같아야 하며 만약 분산이 분산평균보다 크 다면 (과분산, Over-Dispersion) 계수 벡터 β는 편향 (Biased)된다는 한계를 가지고 있다. [4] 이러한 포 아송 모형의 한계를 극복하기 위해 포아송 모형을 변형한 음이항 분포를 이용하여 교통사고발생빈도 를 예측할 수 있다. [1, 7]
하지만 포아송 모형과 음이항 모형은 교통사고 발생빈도(Crash Frequency)를 결정하는 독립변수인 교통량, 도로지형 및 기하구조 그리고 신호정보 등 에 대한 추정된 모수(Parameter)가 고정되어 있다고 가정하고 있다. [8] 교차로나 가로구간의 도로지형 및 기하구조가 이질성(Heterogeneity)이 존재함에도 불구하고 기존의 많은 연구에서는 기하구조가 동일 하다고 가정하고 교통사고모형을 개발하였다. 이러 한 고정효과를 이용한 모형(Fixed Effect Model)은 모형을 통해 추정된 계수의 표준오차 값이 과소 추 정되거나 각 계수의 t-값이 과도하게 산정되어 모형 의 설명력이 낮아지게 된다. [7, 8, 9] 이러한 고정 효과의 한계를 극복하기 위하여 기존연구에서는 임 의효과(Random Effect)를 이용하여 교통사고모형을 개발하였다. [7, 8, 9, 10]
본 연구에서는 임의효과모형의 적합성을 분석하 기 위하여 국내 교통사고발생 데이터를 이용하여 고정효과를 이용한 음이항 회귀모형(Fixed Effect Negative Binomial Regression Model)과 임의효과를 이용한 음이항 회귀모형(Random Effect Negative Binomial Regression Model) 개발하여 이 두 모형을 비교ㆍ분석하였다.
2연구의 범위와 내용
<Fig 1>에서 보는 바와 같이, 본 연구는 대전광 역시의 주요 89개 교차로를 대상으로 자료를 수집 하여 교통사고모형을 개발하였다.
교통사고데이터는 경찰청과 도로교통공단의 교 통사고분석시스템(TAAS: Traffic Accident Analysis System)에서 제공하고 있는 2007년부터 2012년까지 6년간의 지역별 교통사고발생 데이터를 이용하였 다. 교통량과 교차로 기하구조는 대전광역시 교통 조사ㆍ분석 보고서와 현장조사를 통하여 수집하였 으며, 교통사고모형은 NLOGIT 4.0 econometrics을 이용하여 개발하였다. 고정효과와 임의효과를 이용 한 음이항 회귀모형은 교통사고에 영향을 많이 미 친다고 판단되는 변수를 차례로 대입하여 최적의 모형을 개발하는 기법인 단계적 방법(Stepwise Manner)을 이용하여 개발하였다. 개발된 두 개의 모 형을 비교ㆍ분석하여 임의효과를 이용한 음이항 회 귀모형의 효용성을 분석하였다.
Ⅱ이론적 배경
1.포아송 회귀모형
포아송 모형은 각 교차로에서 발생하는 교통사 고가 각각 독립적으로 발생하는 것으로 전제로 하 고 주어진 시간 또는 기간에서 교통사고가 발생할 확률을 모형화한 통계학 분포로 일반식은 다음과 같다. [4]
P(Y = yi): 주어진 기간 동안 i교차로에서 yi번의 교통사고가 발생할 확률
μi : 주어진 기간 동안 i교차로에서 발생한 기대 교통사고건수
xij: 설명변수
βi : 계수
또한 포아송 회귀모형은 우도함수(Likelihood Function)를 적용한 최우추정법(Standard Maximum Likelihood Method)을 이용하여 모형을 개발할 수 있다.
여기서,
β: 계수(β0, β1, ...,βn )의 벡터값
yi : i교차로에서 관측된 교통사고건수
μi : i교차로에서 예측된 교통사고건수
2.음이항 회귀모형
음이항 분포는 포아송 회귀모형에서 포함되지 않은 변수로 인하여 과분산을 모형에 반영하여 교 차로의 교통사고확률을 모형화한 통계학적 분포로 일반식은 다음과 같다. [4]
α: 최우추정법에 의해 예측된 과포화 Parameter
Γ: 감마함수
Var(Y): 분산
또한 음이항 회귀모형은 우도함수를 적용한 최 우추정법을 이용하여 모형을 개발할 수 있다.
α: 과포화 Parameter
β: 계수(β0, β1, ...,βn )의 벡터값
yi : i교차로에서 관측된 교통사고건수
μi : i교차로에서 예측된 교통사고건수
3.임의효과
임의효과를 이용한 포아송 회귀모형이나 음이항 회귀모형을 개발할 때 교차로나 가로구간의 도로지 형 및 기하구조의 이질성(Heterogeneity)-수집된 데 이터에서 관찰되어지지 않은 요인-을 설명하기 위 하여 시뮬레이션 최우추정법(Simulated Maximum Likelihood Estimation)을 이용한다. [10, 11] 임의효 과를 설명하기 위한 계수추정의 일반식은 아래와 같다. [10]
φ: 임의분포항(Random Distributed Term)
식 (7)을 적용하면 기대 교통사고 발생건수 μ는 포아송 회귀모형에서는 μi|φi= EXP(βXi) 으로 음 이항 회귀모형에서는 μi|φi= EXP(βXi + εi) 으로 되어 교통사고 발생확률 P(Y = yi)은 P(Y = yi|φi) 가 된다. 이를 이용한 우도함수를 적용하여 모형을 개발할 수 있다.
여기서,
g(φi ): φi의 확률밀도함수(Probability Density Function)
Ⅲ교차로 교통사고 모형개발
1.변수선택 및 분석
본 연구에서 도심지 교차로의 년간교통사고발생 빈도(Annual Crash Frequency)를 종속변수로 하는 교 통사고모형을 개발하기 위하여 교통사고발생에 영 향을 미친다고 판단되는 변수를 대상으로 데이터를 수집ㆍ분석하였다. 교통사고데이터는 횡단면 시계 열자료(Cross-sectional Time Series Data)로 2007년부 터 2012년까지 6년간의 총 교통사고발생건수가 아 닌 교차로별/년도별 교통사고발생건수를 종속변수 로 지정하였으며, 교통사고발생빈도는 사망사고 (Fatality)발생빈도, 중상사고(Injury A)발생빈도, 그 리고 경상사고(Injury B)발생빈도의 합인 총 교통사 고발생빈도(Total Crash Frequency)로 산정하였다.
모형개발에 이용된 독립변수는 기존연구에서 조 사 및 분석된 바와 같이, 교통사고발생빈도에 영향 을 미치는 요소인 년평균일교통량(AADT), 주간선 도로 교통량(Major Road AADT), 보조간선도로 교 통량(Minor Road AADT), 제한속도(Speed Limit), 교 통섬(Traffic Island)설치유무, 차로수(Number of Lanes), 중앙분리대(Median Barrier)설치유무, 횡단보 도(Pedestrian Crossing)설치유무, 좌회전 전용차로 (Left Turn with an Exclusive Turn Lane)설치유무, 우 회전 전용차로(Right Turn with an Exclusive Turn Lane)설치유무, 회전유도선(Turning Guideline)설치유 무, 그리고 전방신호등(Front Signal)설치유무를 독 립변수로 활용하여 모형을 개발하였다. [1, 4, 7, 8]
<Table 1>은 주요변수의 기초통계분석 결과를 나 타낸 것으로 주요변수의 기초통계분석 결과를 살펴 보면, 연구대상 교차로의 총 교통사고발생빈도는 교차로당 평균 10.545건/년, 최대 교통사고건수는 43건/년으로 나타났다. 차로수는 대도시 주요 간선 도로의 특성이 반영되어 평균 3.933차로/교차로, 최 대 차로수 7차로/교차로, 최소 차로수 2차로/교차로 로 나타나 광역 도심지 특성상 잦은 교통사고발생 빈도와 비도심지와 비교하여 넓은 교차로 면적을 가지는 것으로 조사되었다. 그리고 고속국도와 일 반국도와 달리 도심지 도로에서는 중앙분리대가 설 치된 구간이 많지 않아 중앙분리대 설치유무의 평 균은 0.584로 나타났으며 넓은 교차로 면적으로 인 해 전방신호등 설치는 비도심지 교차로에 비해 많 은 평균 0.404대/교차로로 나타났다.
또한, 연구대상 교차로의 년평균일교통량은 평균 72,840대/일로 나타났으며, 최대 교통량은 164,488대/ 일, 최소 교통량은 19,932대/일로 조사되었으며 본 연 구에서 년평균일교통량의 경우 로그값으로 변환된 값을 이용하여 모형개발의 독립변수로 활용하였다.
2.모형개발
본 연구에서는 도심지 교차로의 교통사고모형을 개발하기 위하여 교차로의 교통사고발생빈도를 종 속변수로 하고 수집된 교차로의 지형정보와 교통량 정보 등을 독립변수로 하여 모형개발 및 분석 소프 트웨어인 NLOGIT 4.0 econometrics를 이용하여 모 형을 개발하였다.
교통사고모형은 모형개발에 주로 이용되는 음이 항 회귀모형을 이용하였으며, 특히 교통사고모형개 발에서 임의효과의 적합성을 기존의 모형개발기법인 고정효과와 비교·분석하기 위해 임의효과와 고정효 과를 이용한 음이항 회귀모형을 각각 개발하였다.
모형개발 시 독립변수를 투입하는 방법으로 모 든 독립변수를 모형개발에 이용하는 입력방식(Enter Manner)과 독립변수의 중요도(Weight)가 높은 순서 대로 모형개발에 투입하여 모형의 적합도가 가장 높은 모형을 개발하는 위계적 방식(Hierarchical Manner), 그리고 F-통계량의 유의확률이 가장 낮게 하는 독립변수를 하나씩 선택하여 모형을 개발하는 단계적 방식(Stepwise Manner)이 있다. 모형개발은 독립변수간의 상관관계(Correlations), 종속변수와 독 립변수의 편상관관계(Partial Correlations)와 부분상 관관계(Part Correlations)를 고려하여야 한다. 또한 어떤 독립변수가 종속변수에 유의한 영향력이 없더 라도 다른 독립변수에 의하여 유의성이 나타날 수 있기 때문에 본 연구에서는 도심지 교차로 교통사 고에 영향을 많이 미치는 독립변수를 넣어서 모형 을 개발하는 단계적 방식(Stepwise Manner)으로 모 형을 산정하였다.
또한, 임의효과를 이용한 음이항 회귀모형을 개 발하기 위해 Halton Draws를 이용한 시뮬레이션 최 우추정법을 사용하였다. 시뮬레이션 최우추정법을 이용하기 위하여 난수를 발생하여야 하는데 보통은 Random Draws를 이용하게 되지만 모형이 복잡하고 데이터가 큰 경우에는 모형추정의 시간이 오래 걸 린다는 단점이 있어 본 연구에서는 Random Draws 보다 적은 연산으로 같은 결과를 산정할 수 있는 Halton Draws를 이용하여 모형을 개발하였다.
그리고 임의효과를 이용한 회귀모형의 계수를 추정할 때 밀도함수의 함수형태는 여러 확률분포를 고려할 수 있는데, 본 연구에서는 정규분포(Normal Distribution)가 통계적으로 가장 유효한 것으로 나 타났다.
교차로 교통사고모형개발 결과, 년평균일교통량 (Logarithm of Total AADT), 제한속도(Speed Limit), 차로수(Number of Lanes), 우회전 전용차로(Right Turn with an Exclusive Turn Lane)설치유무, 그리고 전방신호등(Front Signal)설치유무가 교통사고발생빈 도에 영향을 미치는 유효한 설명변수로 나타났다. 또한, 음이항 회귀모형의 모형적합성을 검증할 수 있는 과포화 Parameter(α)는 임의효과를 이용한 음 이항 회귀모형에서 19.645와 t-statistics 14.149로 나 타나 통계적으로 유의한 것으로 나타났다.
Ⅳ모형개발 결과 및 분석
<Table 2>는 임의효과와 고정효과를 이용한 도심 지 교차로 교통사고모형 산정 결과를 나타낸 것이 며, <Table 3>은 교통량과 기하구조의 단위변화 (Changing Units)가 교통사고발생빈도에 미치는 영 향을 분석하고자 산정한 음이항 모형의 계수에 대 한 한계효과(Marginal Effects)분석 결과이다.
<Table 2>에서 보는 바와 같이, 임의효과와 고정 효과를 이용한 음이항 회귀모형의 모형 설명력을 비교해보면 로그-우도함수값(Log-Likelihood at Convergence) 이 임의효과에서는 -1537.802로 고정효과 의 로그-우도함수값 -1691.327보다 모형 설명력이 좋은 것으로 나타났으며, 우도비(ρ2)의 경우 임의효 과에서 0.279로 나타나 고정효과의 0.207보다 개선 된 것으로 분석되었다.
음이항 회귀분석에서 변수밀도(Parameter Density) 의 표준편차가 통계적으로 유의(Statistical Significance) 하여야 임의효과를 고려하여 모형을 개발할 수 있다. 임의효과를 이용한 음이항 회귀모형에서 추정된 계수의 표준편차가 0과 다르고 t-값이 1.96 보다 같거나 클 때 (Standard Deviation≠0, t-value≥ 1.96) 통계적으로 유의하며, 만약 표준편차가 0과 같으며 t-값이 1.96보다 작을 경우 (Standard Deviation〓0, t-value<1.96) 추정된 계수는 고정효과 를 이용한 모형처럼 모든 교차로에서 동일한 값을 가지게 된다.
본 연구에서 개발된 임의효과를 이용한 음이항 회귀모형의 결과를 분석해보면, 로그값으로 변환된 년평균일교통량은 평균 0.301, 표준편차 0.138이며 t-값은 각각 9.160과 14.725로 나타나 높은 유의함을 보이는 것으로 나타났다. 이는 교통량이 증가할수 록 교통사고발생빈도가 높아지는 것을 의미하며, 또한 표준편차가 유의한 값을 나타내는 것은 연구 대상 교차로 89군데에서 교통량이 교통사고에 각기 다른 영향을 미친다는 것을 의미한다.
한계효과를 살펴보면 임의효과를 이용한 음이항 회귀모형에서는 교통량이 1단위 증가할 때 교통사 고는 평균 2.434 만큼 증가하는 것으로 나타났다. 반면 고정효과를 이용한 음이항 회귀모형의 경우 교통량이 1단위 증가할 때 교통사고는 평균 10.806 만큼 증가하는 것으로 나타나 임의효과 모형보다 교통량에 더 민감한 것으로 나타났다.
제한속도의 경우, 평균 –0.028, 표준편차 0.025 t 값 30.302로 나타나 제한속도가 높아질수록 교통사 고발생빈도가 낮아지는 것으로 나타났다. 이는 제 한속도가 1%증가 시 –0.028%의 교통사고발생빈도 에 영향을 준다는 의미로 보통은 제한속도가 높아 질수록 교통사고발생빈도가 높아지지만 연구대상 지역에 따라 제한속도가 높아질수록 교통사고발생 빈도는 낮아질 수 있다는 연구결과도 있어 본 연구 의 결과는 유의하다고 할 수 있다. [12]
반면 차로수는 평균 0.261, 표준편차 0.010이며 t- 값은 1.910으로 나타나 임의효과에는 통계적으로 유의하지 못한 것으로 나타났지만 모형변수의 적합 도(p-값)는 0.056로 어느 정도 모형에 적합한 것으 로 나탔다. 이런 경우, 모형개발 시 차로수는 고정 효과로 전환하여 분석하면 좀 더 설명력이 좋은 모 형을 개발할 수 있다.
또한, 우회전 전용차로와 전방신호등 설치유무의 경우 표준편차가 각각 0.117가 0.165 t-값이 각각 6.648가 7.869로 나타나 통계적으로 유의한 것으로 나타났다. 한계효과에서는 우회전 전용차로 설치유 무가 –2.611로 전방신호등 설치유무의 –1.361로 나타나 우회전 전용차로 설치가 전방신호등 설치보 다 효용성이 높은 것으로 분석되었다.
Ⅴ결론
임의효과를 이용한 음이항 회귀모형(Random Effect Negative Binomial Regression Model)은 교통 량, 도로지형 및 기하구조 그리고 교차로 및 가로구 간 신호정보와 관측되지 않은 다른 요인(Unobserved Factors) 등에 대한 이질성(Heterogeneity)을 고려하여 모형을 개발할 수 있는 장점이 있는 접근 방법이다.
본 연구에서는 기존 도심지 교차로 교통사고모 형을 개발하기 위해 이용된 고정효과를 이용한 음 이항 회귀모형(Fixed Effect Negative Binomial Regression Model)과 임의효과를 이용한 음이항 회 귀모형을 이용하여 교통사고모형을 개발하여 모형 의 설명력과 적합성을 비교ㆍ분석하였다.
임의효과와 고정효과를 이용한 음이항 회귀모형 은 교통사고발생빈도에 영향을 미친다고 판단되는 변수를 단계적 방식(Stepwise Manner)으로 모형을 산정하였으며, 그 결과 년평균일교통량, 제한속도, 차로수, 우회전 전용차로 설치유무, 전방신호등 설 치유무 등이 유효한 설명변수로 나타났다. 또한 임 의효과와 고정효과모형의 모형 설명력을 비교해보 면 로그-우도함수값이 임의효과에서 –1537.802로 고정효과의 로그-우도함수값 –1691.327보다 모형 설명력이 좋은 것으로 나타났으며, 우도비(ρ2)의 경 우 임의효과에서 0.279로 고정효과의 0.207보다 개 선된 것으로 나타났다.
지금까지 교통사고발생모형 개발은 수집된 데이 터에 대한 추정된 모수(Parameter)가 고정되어있다 고 가정하여 교통량이나 기하구조의 길이와 폭 등 은 설치 형태와 관계없이 동일한 값을 적용하여 모 형을 산정하였다. 하지만 위에서 나타낸 바와 같이, 기하구조의 이질성(Heterogeneity)을 고려한 임의효 과를 이용한 음이항 회귀모형으로 개발한 교통사고 발생모형이 기존 고정효과모형보다 모형의 설명력 이 뛰어난 것으로 분석되었다. 이러한 결과는 향후 교통사고발생에 대한 원인 분석 및 개선사업 시행 시 좀 더 명확한 원인과 해결방법을 제공해 줄 것 으로 기대된다.