Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.24 No.6 pp.1-16
DOI : https://doi.org/10.12815/kits.2025.24.6.1

Analysis of Secondary Highway Accident Severity: Robust and Quantile Regression Approach

Jaeduk Lee*, Sangbeom Lee**, Jeongjin Chang**, Seyoung Ahn***, Iljoon Chang****
*Research Professor, Dept. of Urban Planning., Gachon University
**Ph.D Student, Dept. of Urban Planning., Gachon University
***Research Professor, Dept. of Urban Planning., Gachon University
****Professor, Dept. of Urban Planning., Gachon University
Corresponding author : Iljoon Chang, ijchang@gachon.ac.kr
2 October 2025 │ 23 October 2025 │ 4 November 2025

Abstract


This study applied the Equivalent Property Damage Only (EPDO) index to quantify the traffic accident severity and examined the determinants of severity in secondary accidents on expressways. The analysis was based on a ten-year dataset (2014–2023) from the Korea Expressway Corporation. Descriptive statistics and correlation analysis were first conducted, followed by robust regression (RR) and quantile regression (QR) to identify the key influencing factors. The results showed that the accident scale (number of vehicles involved) and accident type (particularly pedestrian accidents) had the most significant effects on severity, with these effects being more pronounced in high-severity accidents. In contrast, environmental conditions such as weather and road surface played a relatively minor role. These findings address the limitations of conventional ordinal categorical approaches by introducing an EPDO-based framework for quantifying the severity of accidents in terms of social cost. From a policy perspective, this study highlights multi-vehicle and pedestrian accidents as priority targets and underscores the need for differentiated safety measures to prevent secondary accidents on expressways.



고속도로 2차 교통사고 심각도 분석: 강건·분위수 회귀 모형 적용

이 재 덕*, 이 상 범**, 장 정 진**, 안 세 영***, 장 일 준****
*주저자 : 가천대학교 도시계획학과 연구교수
**공저자 : 가천대학교 도시계획학과 박사과정
***공저자 : 가천대학교 도시계획학과 연구교수
****교신저자 : 가천대학교 도시계획학과 교수

초록


본 연구는 교통사고 심각도를 정량적으로 측정하기 위해 대물피해환산법(EPDO: Equivalent Property Damage Only) 지표를 활용하고, 이를 기반으로 고속도로 2차 사고의 심각도 결정 요인 을 규명하였다. 분석 자료는 한국도로공사 관할 고속도로에서 발생한 최근 10년간의 사고 데 이터(2014~2023)이며, 기초통계와 상관분석을 거쳐 강건 회귀(Robust Regression)와 분위수 회 귀(Quantile Regression)를 적용하였다. 분석 결과, 사고 규모와 사고 유형이 심각도에 가장 큰 영향을 미쳤으며, 특히 고심각도 구간에서 그 효과가 더욱 두드러졌다. 반면, 날씨·노면 상태와 같은 환경 요인은 상대적으로 제한적인 영향을 보였다. 이러한 결과는 기존의 범주형 접근의 한계를 보완하며, 사고 심각도를 사회적 비용 차원에서 정량화할 수 있는 대안을 제시한다. 정 책적으로는 다중 차량사고와 보행자 사고를 핵심 관리 대상으로 설정하고, 고속도로 2차 사고 예방을 위한 차별화된 안전대책 마련이 필요함을 시사한다.



    Ⅰ. 서 론

    1. 연구 배경 및 목적

    교통사고는 전 세계적으로 사회·경제적 손실을 유발하는 주요 원인 중 하나이며, 우리나라 역시 매년 수 만 건의 사고와 이로 인한 인명·재산 피해가 발생하고 있다. 특히 교통사고로 인한 사회적 비용은 단순한 물 적 피해를 넘어 의료비, 생산성 손실, 교통 혼잡 등 다양한 형태로 확산되면서 국가적 부담으로 이어지고 있 다. 이에 따라 교통사고의 심각도를 정확하게 파악하고, 이를 결정짓는 영향 요인을 규명하는 것은 교통안전 정책 수립과 효과적인 자원 배분에 있어 핵심적인 과제가 되어왔다.

    기존 연구들은 주로 사고 심각도를 사망·중상·경상과 같이 순서형 범주로 구분하여, 순서형 로짓·프로빗 모형, 혼합로짓, 일반화 순서형 로짓 등의 통계적 기법을 적용해 왔다(Kockelman and Kweon, 2002;Milton et al., 2008). 이러한 연구들은 사고 요인의 방향성과 한계효과를 규명하는 데 기여했으나, 사고 심각도의 질적 구분만을 반영하기 때문에 사고 피해의 절대적 크기 차이를 충분히 설명하지는 못한다는 한계를 지닌다. 예 를 들어, 경상 사고 10건이 중상 사고 1건보다 사회적 부담이 더 클 수 있음에도 불구하고, 순서형 범주 접근 은 이를 동일하게 취급하기 어렵다. 또한 최근에는 자율주행자동차(Autonomous Vehicle, AV) 및 첨단운전자 보조시스템(Advanced Driver Assistance System, ADAS)의 확산으로 사고 양상이 변화하고 있으며, 1차 사고 이후 추가적으로 발생하는 2차 사고 역시 사고 심각도를 높이는 주요 원인으로 주목받고 있다. 2차 사고는 1차 사고로 인한 정체, 시야 제한, 차로 차단 등 복합적 요인이 결합되어 피해 규모가 커지고 치사율이 증가 하는 특성을 보인다(Yang et al., 2014;Gao et al., 2025). 이러한 변화는 기존의 범주형 접근만으로는 충분히 설명하기 어려운 새로운 연구 수요를 만들어내고 있다.

    본 연구에서 분석 대상으로 삼은 고속도로 2차 교통사고는 전체 교통사고 중 발생 빈도가 현저히 낮은 희 귀한 사고 유형이다. 그럼에도 불구하고 치사율과 심각도가 높아 사회적 비용을 크게 초래하는 문제점을 지 니고 있다(Ahn et al., 2024;Sarker et al., 2017). 본 연구는 한국도로공사 관할 고속도로에서 발생한 지난 10년 간의 2차 사고 데이터를 기반으로 심층 분석을 수행하였으며, 이는 제한된 데이터 속에서 정책적 우선순위 를 도출하는 데 유용하다는 의의를 가진다.

    이에 본 연구는 기존의 순서형 범주 접근을 보완하여, 사고 심각도를 EPDO(Equivalent Property Damage Only) 지표로 환산하고 이를 연속형 변수로 설정함으로써 사고 심각도를 사회적 비용 차원에서 정량화하고자 한다. EPDO는 사망·중상·경상 각각의 사고에 차등 가중치를 부여하여 피해 강도를 수치화할 수 있으므로, 사 고 규모의 미세한 차이를 반영할 수 있으며 정책적 비용–편익 분석에도 직접적으로 활용 가능하다 (Washington et al., 2020). 또한 분석 대상은 2차 교통사고로 한정하여, 1차 사고와의 연계성 속에서 심각도에 영향을 미치는 요인을 규명하고자 한다. 분석 방법론 측면에서는 EPDO를 종속변수로 설정하여 분포 특성을 고려한 회귀 분석 기법을 적용하며, 변수의 영향력을 검증하는 동시에 설명력과 해석 가능성을 확보하고자 한다. 특히 본 연구는 기존 연구에서 주로 활용되지 않았던 강건 회귀(Robust Regression)와 분위수 회귀 (Quantile Regression)를 병행하여, 이상치와 분산 불균등 문제를 보완하는 동시에 평균적 사고와 고심각도 사 고 간의 요인 효과 차이를 규명하는 방법론적 확장을 시도하였다(Washington et al., 2014;Yu et al., 2021). 아울 러 기존 선행연구에서 주로 다뤄온 시간적·공간적 요인, 운전자 및 차량 특성, 도로 환경 변수뿐 아니라 자율 주행차 사고 특성 연구(Park et al., 2024;Lee and Park, 2024)와 머신러닝 기반 접근(Cho and Kim, 2025;Yoon et al., 2025)까지 반영하여, 2차 사고 맥락에서 심각도를 결정짓는 핵심 요인을 종합적으로 규명할 것이다.

    결국 본 연구는 기존 순서형 범주 중심 연구가 지닌 한계를 극복하고, EPDO를 활용한 연속형 접근을 통 해 사고 심각도의 사회적 비용적 함의를 제시하며, 특히 2차 사고라는 고위험 교통사고 유형에 초점을 맞춤 으로써 정책적·학문적 기여를 도모한다. 이러한 접근은 교통안전 정책 수립 과정에서 보다 정량적이고 실효 성 있는 시사점을 제공할 수 있을 것으로 기대된다.

    Ⅱ. 선행연구 검토

    1. 사고 심각도 측정과 EPDO 활용

    사고 심각도 분석은 전통적으로 사망·중상·경상 등 순서형 범주를 중심으로 수행되어 왔으나, 이러한 질 적 구분은 사고 피해의 절대적 크기 차이를 충분히 반영하기 어렵다는 한계를 지닌다. 이를 보완하기 위해 EPDO 지표가 활용되었으며, 사망·부상·물적 피해 사고에 차등 가중치를 부여하여 피해 강도를 비용 차원에 서 정량화할 수 있다. EPDO는 사회적 비용을 반영하는 대표 지표로서, Highway Safety Manual에서도 교통사 고 위험도 분석에 표준적으로 적용되고 있으며 국내외 연구들은 EPDO를 활용하여 사고위험지점(blackspot) 식별이나 정책효과 평가에 활용한 바 있다(Ahn et al., 2024;Washington et al., 2014). 최근에는 EPDO 기반 심 각도를 머신러닝 기법으로 예측하고 변수 중요도를 분석하는 연구도 제시되었다(Cho and Kim, 2025).

    2. 사고 심각도 분석 방법론의 발전

    초기 연구들은 순서형 로짓(Ordered Logit)과 순서형 프로빗(Ordered Probit)을 주로 활용하여 심각도 수준 별 요인을 분석하였다(Kockelman and Kweon, 2002). 이후 혼합 로짓(Mixed Logit)을 적용해 관측 불가능한 이 질성을 반영(Milton et al., 2008)하였으며, 일반화 순서형 로짓(Generalized Ordered Logit)과 부분비례오즈 (Partial Proportional Odds) 모형을 통해 단계별로 변수 효과가 달라질 수 있음을 고려하였다. 더 나아가 베이 지안 접근 역시 도입되어 사고 심각도의 불확실성을 정량화하는 연구가 확산되었다(Lee and Park, 2024).

    2차 사고는 사고 발생 직후의 교통환경 요인과 차로 차단 여부 등이 핵심적 변수로 분석되었다. Yang et al.(2014)은 뉴저지 턴파이크 사고데이터와 교통센서 자료를 결합해 2차 사고 발생 확률을 rare-event logistic 회귀로 추정하였으며, Sarker et al.(2017)은 미국 고속도로 네트워크에서 2차 사고 빈도를 포아송·음이항 회귀 모형으로 분석하여 AADT, 교통구성, 속도 제한이 주요 요인임을 밝혔다. Gao et al.(2025)은 중국 고속도로 사고보고서를 활용해 1차 사고와 2차 사고 간의 위험 결합 효과를 정량적으로 규명하였다.

    Kim and Kim(2023)Lee and Park(2024)는 모두 미국 DMV 사고보고서를 활용하였으며, 각각 다른 통계 모형을 적용했음에도 불구하고 조명·교차로 환경, 운행행태 등의 공통 요인이 사고 심각도에 유의한 영향을 미치는 것으로 분석하였다. Lee and Park(2024)은 캘리포니아 DMV 사고보고서를 기반으로 베이지안 잠재계 층분석과 순서형 프로빗을 결합하여, 교통약자(VRU, Vulnerable Road Users) 사고에서 조명·교차로 환경이 사 고 심각도를 높이는 요인임을 밝혔다.

    머신러닝 기반 연구도 활발히 진행되고 있다. Yoon et al.(2025)은 인천광역시 이륜차 사고 데이터를 활용 하여 도시·비도시 지역별 사고 심각도에 영향을 주는 요인을 Random Forest로 분석하였다. Cho and Kim(2025)은 전국 교통사고 데이터 47,296건을 활용하여 RF, XGBoost, DNN을 비교한 결과, RF가 가장 높은 예측력을 보였으며 사고유형·차량수·법규위반이 핵심 요인으로 확인되었다. 이 외에도 Brubacher et al.(2017) 은 응급실 데이터를 기반으로 경상사고(minor injury crash)에서도 운전자 행태적 요인이 심각도를 좌우함을 규명하며, 사고 심각도 예측 시 경상사고를 포함한 다양한 스펙트럼 고려의 필요성을 강조하였다.

    3. 연구의 차별성

    선행연구들은 Ordered Logit, Probit, Mixed Logit, Bayesian 등의 전통적 통계모형을 통해 사고 요인의 방향 성과 효과를 규명하였으며, 최근에는 머신러닝 기반 기법이 도입되면서 예측력과 해석 가능성이 확대되었다. 그러나 대부분의 연구는 종속변수를 사망·중상·경상과 같은 순서형 범주로 설정하여 사고 피해 규모를 연속 적으로 비교하기 어렵다는 한계가 있다. 또한 자율주행차·이륜차 등 특수사고 맥락 연구에서도 여전히 표본 한계와 데이터 제약이 존재한다.

    본 연구는 전체 사고를 대상으로 한 기존 EPDO 연구들과 달리, 고속도로 2차 사고에 집중하여 분석하였 다. 또한 대부분의 연구에서 EPDO가 skewed(비대칭) 형태의 분포를 보이는 한계를 인식하고, 로그변환·윈저 라이징·강건·분위수 회귀를 병행함으로써 고심각도 사고의 영향요인을 다층적으로 규명하였다는 점에서 차 별성을 지닌다.

    Ⅲ. 데이터 수집 및 분석

    1. 데이터 수집

    본 연구는 한국도로공사 관할 고속도로에서 최근 10년(2014–2023년) 동안 발생한 2차 사고 기록을 분석 대상으로 삼았다. 통계 분석의 내적 타당성을 확보하기 위해 자료 정비 절차를 선행하였다. 먼저 결측치와 이상치를 전수 점검하여 표식하였고, 기상 상태·노면 상태 등 외부 자료를 통해 확인 또는 합리적 추정이 가 능한 결측 항목은 대체하였다. 이상치는 각 변수의 평균값으로부터 ±3표준편차를 초과하는 관측값으로 정의 하였으며, 해당 값들은 분포를 왜곡할 가능성이 높다고 판단되어 분석자료에서 제외하였다.

    이후 모형 구축에 적합하도록 변수 단위와 범주를 정합화하여 필요 변수에 대해 정규화와 스케일링을 수 행하여 입력 특성의 스케일의 차이를 최소화하였다. 이러한 검토·전처리 과정을 거쳐 최종적으로 509건의 2 차 사고 사례가 분석에 활용되었다.

    2. EPDO

    사고 심각도 평가는 EPDO를 채택하였다. EPDO는 상해 수준별 가중치를 적용하여 사고 결과를 단일 척도 로 환산하는 방법으로, 국내 교통사고 심각도 평가에서 널리 쓰이는 표준화 지표이다. 해당 지표는 신뢰성과 비교 가능성이 확보되어 있어 본 연구 결과의 객관성을 담보하고 선행 연구와의 정합적 비교를 가능하게 한 다(Ahn et al., 2024). EPDO는 사고 유형별 사회적 비용 차이를 반영하기 위해 Equation(1)과 같이 정의된다.

    E P D O = w F × N F + w I × N I + w P × N P
    (1)

    여기서, NF는 사망자 수, NI는 부상자 수(중상·경상 포함), NP는 물적 피해 차량 수를 의미하며, wF, wI, wP는 각각의 가중치 계수를 나타낸다. 가중치 계수는 사회적 비용 기준을 준용하여 각각 12,3,1로 설정하였다.

    데이터 분석 결과 물적 피해 차량 수는 평균 2.79대로, 사고 차량 수가 대체로 2~3대 수준임을 보여주었 다. 중앙값은 2대였으나, 최대 22대의 사고도 존재하여 대형 다중추돌사고의 위험성을 확인할 수 있었다. 사 고 차량 수 역시 물피와 유사한 경향을 보였으며, 평균 2.8대로 나타났다. 대부분의 사고는 2~3대 차량이였 지만, 최대 22대가 충돌한 초대형 다중추돌사고 사례가 확인되었다. 이는 사고 차량 수가 많아질수록 구조 및 대응이 복잡해지고 인명피해 가능성이 높아짐을 의미한다.

    기술통계 분석 결과 EPDO의 평균은 14.53, 중앙값은 14로 나타났으며, 최소값은 1, 최대값은 146으로 일 부 대형사고에서 값이 급격히 증가하는 특성이 확인되었다. 특히 상위 1% 분위수(P99)가 64.3으로, 극단적 사고에서 EPDO 값이 빠르게 커지는 현상이 드러났다. 이러한 분포적 특성은 왜도 3.91, 초과첨도 28.89에서 확인되듯, 심한 비대칭성과 긴 꼬리 분포를 형성하고 있었다.

    Shapiro–Wilk 정규성 검정 결과 역시 W=0.710, p<0.001로 정규분포를 따르지 않는 것으로 나타났다. 즉, EPDO 원시 값은 모수적 통계분석에서 정규성 가정을 충족하지 못하며, 극단값에 민감하게 반응할 가능성이 크다는 점에서 보정이 필요하다고 판단되었다. <Table 1>과 <Fig. 1>은 각각 EPDO 원시값, 로그 변환값, 윈 저라이징값의 분포를 비교한 것으로, 로그 변환은 정규성 개선 효과가, 윈저라이징은 극단값 억제 효과가 뚜 렷하게 나타났다. 또한, EPDO 지표의 분포 특성을 검토하기에 앞서 이상치 검토를 병행하였다. Box-plot 및 상위 1% 분위수를 활용하여 극단값을 확인하였으며, 빈도가 매우 낮고 물리적으로 비현실적인 관측치는 제 외하였다. 다만, 극단값의 빈도가 전체 표본의 1% 미만으로 제한적이었기 때문에, 본 연구에서는 전체 분포 왜곡이 크지 않다고 판단하였다.

    <Table 1>

    Comparison of EPDO distribution characteristics

    Mean Median Standard Deviation (S.D.) Minimum (Min.) Maximum (Max.) Skewness Kurtosis Shapiro-Wilk (p-value)
    Raw EPDO 14.53 14 12.71 1 146 3.91 28.89 0.711 (p<0.001)
    log1p (EPDO) 2.48 2.71 0.77 0.69 4.99 –0.42 –0.09 0.932 (p<0.001)
    Winsorized (99%) 14.23 14 10.7 1 64.28 1.81 5.3 0.843 (p<0.001)
    KITS-24-6-1_F1.jpg
    <Fig. 1>

    Histogram of EPDO

    분포 특성을 검토한 결과, EPDO 원시 값은 극단값의 영향으로 평균과 분산이 왜곡되고, 모수적 통계분석 에서 추정치를 불안정하게 만들 수 있음을 확인하였다. 이에 따라 분포 보정 방법을 적용하였다.

    로그 변환(log1p)을 적용한 결과 평균 2.48, 중앙값 2.71, 표준편차 0.77, 최대 4.99로 값이 압축되었으며, 왜 도 –0.42, 초과첨도 –0.09로 개선되어 분포가 대칭적이고 정규분포에 근접한 형태를 보였다. 이러한 변환 및 보정 효과를 보다 직관적으로 확인하기 위해 <Fig. 2>의 QQ-plot을 제시하였다. 원시 EPDO의 경우, 데이 터 점들이 상단 꼬리 부분에서 이론적 직선으로부터 크게 벗어나 정규성을 충족하지 못하는 모습이 뚜렷하 게 나타났다. 반면, 로그 변환된 EPDO는 데이터 분포가 직선에 근접하여 정규성에 가까워졌으며, 윈저라이 징을 적용한 경우에도 극단값의 영향이 다소 완화되면서 직선에 가까운 패턴을 보였다. 이는 로그 변환이 정 규성 개선에 가장 효과적임을 시각적으로 뒷받침한다. Shapiro–Wilk 통계 역시 W=0.932로 개선되었으며, QQ-plot에서도 직선에 근접하는 모습을 보여 정규성이 크게 향상된 것을 확인할 수 있었다.

    KITS-24-6-1_F2.jpg
    <Fig. 2>

    QQ-plots of EPDO

    둘째, 상위 1% 극단값을 윈저라이징(Winsorizing) 한 결과 평균 14.23, 중앙값 14, 최대 64.28로 극단값의 영향이 줄었으며, 왜도 1.81, 초과첨도 5.3으로 원시값보다 개선되었다. 다만 Shapiro–Wilk 검정에서는 여전 히 p<0.001로 정규성이 기각되었다.

    <Fig. 3>은 Box-plot을 통해 세 가지 분포의 극단값 패턴을 비교한 결과이다. 원시 EPDO에서는 다수의 이 상치가 두드러지게 나타났으나, 로그 변환 후에는 상대적으로 완화되어 분포가 안정적인 양상을 보였다. 윈 저라이징 또한 상위 극단값을 억제하여 Box-plot의 상자 길이와 수염(whisker)의 범위를 줄임으로써 극단값의 영향을 완화하였다. 다만, Box-plot 상에서는 극단값 억제 후에도 분포의 전반적 형태 차이가 뚜렷하게 드러 나지 않아, 통계적 보정의 효과는 주로 분산지표와 정규성 개선에서 확인된다.

    KITS-24-6-1_F3.jpg
    <Fig. 3>

    Box-plots of EPDO

    요약하면, 로그 변환은 분포의 대칭성과 정규성 근접도를 크게 개선하였으며, 윈저라이징은 상위 극단값 의 값을 일정 수준으로 제한하여, 이상치의 영향을 통계적으로 완화하였다. 다만 본 데이터에서는 극단치가 전체 분포에서 차지하는 비중이 크지 않아, Box-plot의 전반적 형태는 Raw EPDO와 유사하게 나타났다. 그러 나 세 가지 접근 모두 정규성을 완전히 만족시키지는 못했으므로, 본 연구에서는 로그 변환된 EPDO를 주요 분석에 활용하는 동시에, Spearman 상관계수와 윈저라이징을 적용한 보완 분석을 병행하였다.

    3. 교차분석

    주요 명목형 변수와 사고유형 간의 연관성을 탐색하기 위하여 교차분석(cross-tabulation analysis)을 수행하 였다. 교차분석은 변수 간의 단순 연관성을 확인하는 탐색적 기법으로, 본 연구에서는 관측빈도와 기대빈도 를 비교하는 카이제곱 검정을 적용하고, 효과크기를 나타내는 Cramer’s V를 산출하였으며 <Table 2>와 같다.

    <Table 2>

    Summary of cross-tabulation results between accident type and major categorical variables

    Variables n χ2(df) p-value Cramer’s V
    Weather × Accident Type 509 185.712 (16) <0.001 0.302
    Road Surface × Accident Type 509 263.057(12) <0.001 0.415
    Location × Accident Type 509 273.339 (12) <0.001 0.423
    Day of Week × Accident Type 509 517.021(8) <0.001 0.712
    Longitudinal slope × Accident Type 509 516.590(12) <0.001 0.581
    Day/Night × Accident Type 509 516.429(8) <0.001 0.712
    Horizontal curve × Accident Type 509 520.604 (12) <0.001 0.583

    분석 결과 모든 변수에서 사고유형과 유의한 연관성이 확인되었으며(p<0.001), Cramer’s V는 0.302에서 0.712 사이로 중간에서 큰 수준의 연관성을 보였다. 특히 요일(Day of week) 및 주야구분(Day/Night)과 같은 활동 패턴 관련 변수에서 강한 연관성이 나타난 반면, 날씨(Weather)와 같은 환경적 변수에서는 상대적으로 낮은 수준의 연관성이 확인되었다. 이는 2차 사고의 발생이 교통량 분포와 시인성 등과 밀접하게 관련되어 있음을 시사한다.

    다만, 일부 분할표에서는 기대빈도 5 미만의 셀이 다수 발생하여 결과 해석에 주의가 필요하며, ‘기타’ 범 주에서 과다 잔차가 나타나는 경우가 확인되었다. 이는 희귀 사례나 결측치를 통합 처리한 결과로, 본 분석 의 해석적 핵심은 아니다. 따라서 교차분석은 어디까지나 탐색적 차원에서 변수 간 기본적인 연관성을 확인 하기 위한 절차로 제시되며, 이후 진행되는 상관분석과 회귀분석을 통한 심층 분석으로 보완된다.

    Ⅳ. 2차 사고 심층분석

    1. 상관관계 분석

    본 연구에서는 심층분석에 앞서 주요 변수들 간의 기초적 연관성을 확인하기 위하여 상관관계 분석을 수 행하였다. 상관분석은 변수 간 선형적 또는 비선형적 연관 정도를 수치로 제시함으로써, 변수들이 동일한 방 향으로 변화하는지 혹은 독립적인 양상을 보이는지를 파악할 수 있는 기법이다. 이는 이후 다중 회귀분석 및 서열 로지스틱 회귀분석을 수행하기 전에 변수 간 다중공선성 가능성을 점검하고, 주요 영향요인의 후보를 선별하는 기초 단계로 중요한 의미를 가진다.

    분석에 포함된 변수는 사고 심각도의 대표 지표인 연속형 변수인 EPDO를 중심으로, 수치형 변수인 사고 차량 수(Number of vehicles) 및 월별구분(Month), 이분형 변수인 주야구분(Day/Night), 그리고 명목형 변수인 날씨(Weather), 노면상태(Road condition), 사고유형(Accident type), 발생지점(Location), 사고차종(Vehicle type), 종단경사(Longitudinal slope), 주사고원인(그룹)(Primary cause group), 주사고원인(Primary cause), 평면선형 (Horizontal curve), 요일(Day of week)을 포함하였으며 <Table 3>과 같다. 변수 유형에 따라 적절한 상관계수 산출 방법을 차별적으로 적용하였다.

    <Table 3>

    Classification and definition of variables

    Variable Description Variable Type
    EPDO Accident severity index (12×Fatal+3×(Serious+Minor+Slight Injury)+1×Property Damage) Continuous
    Number of Vehicles Number of vehicles involved in the crash Discrete numeric
    Month Month of crash occurrence (January to December) Ordinal /Numeric
    Day/Night Time of crash occurrence (Daytime/Nighttime) Binary
    Weather Clear, Rain, Snow, Fog, Others Nominal
    Road Surface Dry, Wet/Moist, Snow/Icy, Others Nominal
    Accident type Vehicle to Vehicle, Vehicle to Pedestrian, Vehicle to Infrastructure, etc. Nominal
    Location Main lane, Tunnel, Ramp, Rest Area, etc. Nominal
    Vehicle Type Passenger car, Van/Bus, Truck, Trailer, Others Nominal
    Longitudinal slope Level, Uphill, Downhill Nominal
    Primary cause (group) Driver factors, Vehicle factors, Other factors Nominal
    Primary cause Speeding, Failure to maintain safe distance, Improper loading, etc. Nominal
    Horizontal curve Straight, Left curve, Right curve Nominal
    Day of week Monday to Sunday (Auxiliary: distinction between Weekday/Weekend possible) Nominal

    본 연구는 2차 사고 심각도 지표인 EPDO와 설명변수 간의 관계를 파악하기 위해 변수 유형에 적합한 상 관분석 절차를 적용하였다. 연속형·수치형 변수에 대해서는 Pearson 상관계수(r)를 기본으로 보고, 동시에 강 건성을 확인하기 위해 Spearman 순위상관계수(ρ)를 병기하였다. 이분형 변수(주야구분)에 대해서는 포인트- 바이시리얼 상관계수(rpb)를 적용하였다. 명목형 변수에 대해서는 일원분산분석(ANOVA)을 실시하여 집단 간 차이를 검정하고, 효과크기(η²)를 산출하였다.

    상관관계 분석 결과, 연속형 변수 가운데 사고 차량 수(Number of vehicles)가 log1p(EPDO)와 가장 높은 상 관을 보였다(Pearson r≈0.32, Spearman ρ≈0.34, p<0.001). 이는 차량이 많을수록 사고 심각도가 높아지는 경 향을 반영하는 것으로, 본 연구의 주된 분석 변수로 고려할 충분한 근거가 된다. 반면, 월별(Month)은 계절 성·월별 특성이 사고 심각도에 큰 영향을 주지 않는다는 점을 보여주었다. 이분형 변수인 주야구분 (Day/Night)은 rpb≈0.08 수준의 작은 상관을 보였으며, 야간에 사고 심각도가 다소 높게 나타나는 경향이 확 인되었다.

    명목형 변수에 대한 ANOVA 효과크기(η²) 결과, 사고유형(Accident type)에서 η²≈0.13으로 중간 수준의 효 과가 나타나 log1p(EPDO)에 유의미한 차이를 주는 요인임이 확인되었다. 주사고원인(Primary cause)은 η²≈ 0.04로 작은 효과를 보였으며, 주사고원인(그룹)(Primary cause group) 변수는 η²≈0.02로 매우 작은 수준에 머 물렀다. 노면상태(Road condition)와 날씨(Weather) 역시 η²≈0.01–0.02로 효과는 미약하였으며, 그 외 발생지 점(Location), 평면선형(Horizontal curve), 종단경사(Longitudinal slope), 요일(Day of week)은 통계적으로 유의하 더라도 효과크기가 매우 작아 해석적 중요성은 낮다고 판단된다. 이러한 결과는 <Table 4>에 정리하였다.

    <Table 4>

    Correlation coefficients between explanatory variables and accident severity

    Continuous variables were analyzed using Pearson’s r (and Spearman’s ρ for robustness)

    Binary variables were analyzed using Point-Biserial correlation (rpb)

    Nominal variables were tested by one-way ANOVA, with effect sizes reported as η2

    Significance levels: *p<0.05, **p<0.01, ***p<0.001

    FDR-adjusted p-values are reported to control for multiple testing

    Variable Type Method Effect p-value p (FDR)
    Number of vehicles Continuous Pearson 0.319*** p <0.001 p <0.001
    Number of vehicles Continuous Spearman 0.342*** p <0.001 p <0.001
    Month Continuous (time) Pearson -0.003 p =0.951 p =0.951
    Month Continuous (time) Spearman 0.031 p =0.491 p =0.654
    Day/Night (Night=1) Binary Point-Biserial 0.077 p =0.081 p =0.081
    Weather Nominal ANOVA η 0.008 p =0.400 p =0.400
    Road surface Nominal ANOVA η 0.011 p =0.126 p =0.209
    Accident type Nominal ANOVA η 0.131*** p <0.001 p <0.001
    Location Nominal ANOVA η 0.009 p =0.198 p =0.255
    Longitudinal slope Nominal ANOVA η 0.008 p =0.139 p =0.209
    Primary cause (group) Nominal ANOVA η 0.015* p =0.021 p =0.095
    Primary cause Nominal ANOVA η 0.039 p =0.103 p =0.209
    Horizontal curve Nominal ANOVA η 0.01 p =0.086 p =0.209
    Day of week Nominal ANOVA η 0.002 p =0.289 p =0.325

    분석결과 사고 차량 수와 사고유형이 EPDO에 가장 두드러진 영향을 미쳤으며, 날씨·노면상태 등 환경적 요인은 작은 수준의 차이를 보였다. 따라서 본 연구의 후속 회귀모형에서는 사고 규모와 유형 변수를 중심으 로, 환경 요인은 보조적 맥락으로 해석하는 것이 적절하다. 한편, 사고 차량 수가 EPDO와 높은 상관을 보인 것은 EPDO 산정식 내 물적 피해 항목(wp×Np)이 차량 수와 직접적으로 관련되기 때문으로 해석된다. 즉, 차 량 수가 증가할수록 물적 피해비용이 선형적으로 확대되므로, EPDO 지표와의 높은 상관은 개념적으로도 일 관된 결과이다. 본 연구에서는 이러한 구조적 연관성을 인지한 상태에서, 사고 규모를 심각도 결정의 핵심 요인으로 해석하였다.

    2. 영향요인 분석(다중회귀 분석)

    본 연구에서는 단순 상관분석을 넘어 여러 독립변수가 사고 심각도에 미치는 영향을 동시에 검증하기 위 하여 다중 회귀분석을 실시하였다. 다중 회귀분석은 개별 변수의 효과를 다른 요인의 영향을 통제한 상태에 서 추정할 수 있다는 점에서 중요하다. 이를 통해 단순한 상관관계로는 확인할 수 없었던 변수 간 상대적 영 향력과 순수한 기여도를 규명할 수 있으며, 이는 교통사고 심각도에 대한 정책적 개입 지점을 구체화하는 데 기여한다.

    분석 방법으로는 로그 변환된 사고 심각도 지수 log1p(EPDO)를 종속변수로 설정하였다. 독립변수에는 상 관분석 단계에서 유의한 결과를 보였던 차량 수(Number of vehicles)와 사고 유형(Accident type)을 중심으로, 주야구분(Day/Night)은 정책적 중요성을 고려하여 포함하였다. 또한 날씨(Weather)와 노면 상태(Road surface) 는 개별 효과가 크지 않았으나 통제변수 차원에서 모형에 투입하였다. 범주형 변수는 기준 범주를 설정한 후 더미변수로 변환하여 분석에 사용하였다.

    다중 회귀분석 결과는 <Table 5>와 같으며 사고 차량 수(Number of vehicles)는 log1p(EPDO)에 유의한 정 (+)의 영향을 미쳤으며(β=0.126, p<0.001), 사고 차량 수(Number of vehicles)가 많을수록 사고 심각도가 높아 지는 경향을 보였다. 사고 유형(Accident type)에서는 Vehicle to Pedestrian이 기준 대비 사고 심각도를 높였고 (β= 0.318, p<0.001), Vehicle to Infrastructure는 낮추는 결과를 보였다(β=-0.606, p<0.001). 기타 사고 유형 (Other)은 유의하지 않았다. 한편 야간(Day/Night = Night)은 OLS에서는 유의(p=0.049)했으나, 등분산성 위배 를 보완한 HC3 강건 표준오차 적용 시 경계선 수준(p=0.058)으로 나타났다. 날씨(Weather)에서는 Snow 조건 에서 심각도가 낮아지는 결과가 유지되었으며(β=-0.504, p=0.025), 노면 상태(Road condition = Other)는 OLS에 서는 유의(p=0.037)했으나 강건 표준오차 적용 후 비유의(p=0.955)로 변경되었다. 이는 해당 범주의 표본 불 균형 및 이상치의 영향 가능성을 시사한다.

    <Table 5>

    Multiple regression analysis results for factors affecting accident severity

    Model fit indices: R² = 0.207, Adjusted R² = 0.188, AIC = 1081.1, BIC = 1136.1, Durbin–Watson = 1.981

    *p<0.05, **p<0.01, ***p<0.001

    Variable β (Coef) Robust SE t-value p-value
    Number of vehicles 0.126*** 0.022 5.666 <0.001
    Accident type = Vehicle to Pedestrian 0.318*** 0.052 6.11 <0.001
    Accident type = Vehicle to Infrastructure -0.606*** 0.113 -5.34 <0.001
    Accident type = other -0.26 0.568 -0.457 0.648
    Day/Night = Night 0.129 0.068 1.9 0.058
    Weather = Snow -0.504* 0.223 -2.256 0.025
    Weather = Cloudy -0.074 0.093 -0.794 0.427
    Weather = Rain -0.137 0.191 -0.717 0.473
    Weather = Fog 0.212 0.23 0.92 0.358
    Road condition = Wet 0.103 0.171 0.603 0.547
    Road condition = Snow-covered 0.184 0.325 0.567 0.571
    Road condition = Other 1.528 27.201 0.056 0.955

    모형 설명력은 R²=0.207, Adjusted R²=0.188로 사고 심각도 분산의 약 19~21%를 설명하였으며, AIC =1081.1, BIC=1136.1로 산출되었다. Durbin–Watson 통계량은 1.981로 잔차 간 자기상관은 문제되지 않았다. Breusch–Pagan 검정에서는 등분산성 가정 위배가 확인되어, HC3 강건 표준오차를 병행 보고함으로써 결과 의 신뢰성을 높였다. 본 연구의 종속변수는 log1p(EPDO)이므로 계수 β는 (1+EPDO)에 대한 준탄력으로 해석 할 수 있다. 사고 관련 차량 수의 계수는 OLS에서 약 13.4% 증가, GLM(Gamma–log link)에서 약 13.1% 증가 로 일관되게 나타나, 차량 수가 늘어날수록 사고 심각도가 기하급수적으로 확대됨을 확인하였다. 또한 보행 자 사고, 야간 사고, 불량 노면 상태, 램프 지점 사고 역시 심각도를 유의하게 증가시키는 것으로 나타나, 정 책적으로 다중추돌 억제와 보행자 사고 특화 관리, 도로 인프라 취약 구간에 대한 집중 관리가 필요함을 시 사한다.

    요약하면, 사고 규모와 유형이 사고 심각도에 가장 두드러진 영향을 미쳤으며, 환경 요인은 전반적으로 작 은 영향을 주었으나 특정 조건에서는 의미 있는 차이를 보였다. 이러한 결과는 교통사고 예방 정책 수립 시, 사고 규모와 유형을 핵심 요인으로 고려하는 동시에 환경적 요인을 보조적으로 반영할 필요성을 시사한다. 추가적으로, 모형의 적합성을 검증하기 위한 잔차 진단을 실시하였으며 <Fig. 4>와 같다.

    KITS-24-6-1_F4.jpg
    <Fig. 4>

    Residual diagnostics of the multiple regression model: (a) QQ plot for normality and (b) residuals vs. fitted values for homoscedasticity

    정규성 검토 결과, QQ plot에서는 전반적으로 직선에 근접하였으나 꼬리 부분에서 이탈이 관찰되었고, Shapiro–Wilk 검정에서도 p<0.001로 정규성 가정은 일부 위배되었다. 등분산성 검토에서는 Residuals vs Fitted plot에서 분산이 일정하지 않은 패턴이 확인되었으며, Breusch–Pagan 검정 역시 유의하게 나타나 (p<0.001) 등분산성 가정이 다소 위배되었다. 그러나 Durbin–Watson 통계량은 1.981로 2에 근접하여 잔차 간 자기상관 문제는 없는 것으로 확인되었다.

    이러한 결과는 회귀모형의 일부 가정이 완벽하게 충족되지 않음을 보여주지만, 표본 규모가 충분히 크고 HC3 강건 표준오차를 적용한 경우 주요 변수들의 계수 방향과 유의성 수준이 일관되게 유지되었다. 따라서 본 연구의 주요 결론은 신뢰할 수 있는 것으로 판단된다.

    한편, 분석 결과의 안정성을 검증하고 고심각도 사고의 특수성을 규명하기 위해, 본 연구에서는 OLS 모형 의 보완적 접근으로서 강건 회귀(Robust Regression)와 분위수 회귀(Quantile Regression)를 추가로 실시하였다. 본 연구에서는 이상치(outlier)와 분산 불균등성(heteroscedasticity)으로 인한 추정치 왜곡을 완화하기 위해 강 건 회귀(Robust Regression) 기법을 적용하였다. 강건 회귀는 일반 최소자승법(OLS)과 달리 오차항 분포에 대 한 가정을 완화하고, 손실 함수 ρ(ㆍ)를 통해 극단값의 영향을 제한하는 방식으로 추정치를 산출한다. 강건 회귀의 일반적 추정식은 Equation(2)와 같다.

    β ^ = arg  min β i = 1 n ρ y i x i β σ ^
    (2)

    여기서, yi는 i번째 사고의 종속변수(EPDO), xi는 설명변수 벡터, β는 회귀계수, KITS-24-6-1_I1.jpg는 추정된 표준편차를 의 미한다. ρ(·)는 손실 함수(loss function)로, 본 연구에서는 Huber 함수와 Tukey Biweight 함수를 적용하여 이상 치의 영향을 줄이고 추정 결과의 안정성을 확보하였다.

    강건 회귀 분석 결과, 주요 변수들의 효과 방향과 유의성은 OLS와 일관되게 유지되었으며 <Table 6>과 같다.

    <Table 6>

    Robust regression results for factors affecting accident severity

    *p<0.05, **p<0.01, ***p<0.001

    Variable OLS β (SE) Huber β (SE) Tukey β (SE)
    Number of vehicles 0.126*** 0.124*** 0.125***
    Accident type = Vehicle to Pedestrian 0.318*** 0.320*** 0.321***
    Accident type = Vehicle to Infrastructure -0.606*** -0.601*** -0.603***
    Day/Night = Night 0.129* 0.127* 0.128*
    Weather = Snow -0.504* -0.495* -0.497*
    Road condition = Other 1.528* 1.540* 1.545*

    강건 추정치에서도 사고 차량 수(Number of vehicles)의 계수는 β≈0.124~0.125 범위로 OLS와 유사하며(허 버/투키), 이는 (1+EPDO)가 exp(0.124)≈1.132 ~ exp(0.125)≈1.134로 약 13.2~13.4% 증가함을 뜻하며 Vehicle to Pedestrian 사고는 심각도를 높이고, Vehicle to Infrastructure 사고는 낮추는 효과가 강건 추정치에서도 동일 하게 나타났다. 또한 Weather=Snow 조건 역시 음(-)의 영향을 유지하였다. 즉, 이상치·분산 불균등을 보정하 더라도 본 연구의 주요 결론이 안정적임을 시사한다. 더 나아가, 본 연구에서는 사고 심각도의 분포 특성을 보다 정밀하게 규명하기 위해 분위수 회귀(Quantile Regression)를 추가로 적용하였다. 분위수 회귀는 종속변 수의 조건부 평균을 추정하는 일반 최소자승법(OLS)과 달리, 조건부 분포의 특정 분위수(τ, 0<τ<1)를 직접 추정할 수 있다는 장점을 가진다. 이를 통해 평균적 사고뿐만 아니라 고심각도 사고와 같이 분포의 상단부에 해당하는 사례에서 요인들의 효과 차이를 확인할 수 있다. 분위수 회귀의 일반적 형태는 Equation(3)과 같다.

    β ^ τ = arg  min β i = 1 n ρ τ y i x i β
    (3)

    여기서, τ(0<τ<1)은 추정하고자 하는 분위수, yi는 종속변수(EPDO), xi는 설명변수 벡터, β는 회귀계수를 의미한다. ρτ (u)는 체크 함수(check function)로 정의되며, 그 형태는 Equation(4)와 같다.

    ρ τ u = u τ 1 u < 0
    (4)

    즉, 잔차가 양수일 때와 음수일 때 서로 다른 가중치를 부여하여, 특정 분위수에 해당하는 회귀선을 추정 하게 된다. 이러한 특성 덕분에 분위수 회귀는 평균적 분석만으로는 드러나지 않는 고심각도 사고의 위험 요 인을 규명하는 데 유용하다.

    <Fig. 5>의 각 점은 분위수별 추정 계수를, 음영 band는 95% 신뢰구간을 나타내며 이는 본 연구의 회귀 결과가 데이터 특성에 따라 크게 흔들리지 않으며, 결론의 안정성이 확보되었음을 의미한다. 한편, 분위수 회귀 분석 결과는 평균적 사고와 고심각도 사고 간에 결정 요인의 영향력이 강도의 측면에서 차별성을 확인하였다.

    KITS-24-6-1_F5.jpg
    <Fig. 5>

    Quantile regression coefficient paths for selected variables. Each line shows the estimated coefficient (β) across quantiles (τ), with error bars indicating 95% confidence intervals.

    Variables: Number of vehicles, Vehicle to Pedestrian, Vehicle to Infrastructure, Night, and Snow.

    Reference categories: Vehicle-to-Vehicle, Day, Clear weather, and Dry road surface.

    특히 사고 규모(Number of vehicles)와 보행자 사고(Vehicle to Pedestrian)는 고심각도 사고에서 그 영향력이 더욱 두드러지게 나타나, 대형사고 예방 및 보행자 안전 확보를 위한 정책적 대응의 중요성을 강조한다. 이 러한 보완 분석은 본 연구 결론의 신뢰성을 한층 강화하는 동시에, 정책적으로 고위험군을 선별·관리할 수 있는 근거를 제시한다.

    그럼에도 불구하고 본 연구는 여전히 몇 가지 한계를 가진다. 잔차의 비정규성과 분산 불균등 문제를 보 다 정교하게 다루기 위해서는 분위수 회귀(Quantile Regression) 이외에도 Generalized Linear Model(GLM), 다 층모형 등 다양한 대안적 분석 방법을 병행할 필요가 있다. 특히 향후 연구에서는 고심각도 사고(highseverity accidents)에 대한 위험 요인을 더 세밀하게 규명할 수 있는 모형적 확장이 이루어진다면, 이 분야 연 구의 학문적·실무적 기여가 더욱 강화될 것이다.

    Ⅴ. 결론 및 향후연구

    본 연구는 교통사고 심각도를 정량적으로 측정하기 위해 EPDO 지표를 활용하고, 이를 로그 변환한 log1p(EPDO)를 종속변수로 설정하여 사고 요인들이 사고 심각도에 미치는 영향을 심층적으로 분석하였다. 연구의 절차는 기초통계 분석, 상관관계 분석, 다중회귀 분석, 모형 진단, 그리고 강건 회귀와 분위수 회귀를 통한 보완 분석으로 체계적으로 진행되었다.

    분석 결과, 사고 규모(사고 차량 수)와 사고유형은 교통사고 심각도에 가장 큰 영향을 미치는 요인으로 확 인되었다. 특히 사고 차량 수가 많을수록 심각도가 증가하는 경향이 뚜렷하게 나타났으며, 보행자 사고 (Vehicle to Pedestrian)는 평균적 사고뿐만 아니라 고심각도 사고에서도 두드러진 위험 요인으로 작용하였다. 반면, 시설물 충돌 사고(Vehicle to Infrastructure)는 상대적으로 낮은 심각도를 보였으며, 날씨·노면상태 등 환 경적 요인은 통계적으로 유의할 수 있으나 효과 크기 측면에서는 제한적인 수준에 머물렀다. 이러한 결과는 사고 심각도의 주요 결정 요인이 사고 규모와 유형임을 명확히 보여준다.

    강건 회귀(Robust Regression)를 통해 이상치와 분산 불균등에 대한 영향을 통제한 결과, 주요 변수들의 효 과 방향과 유의성이 일관되게 유지되어 분석 결과의 안정성이 검증되었다. 또한 분위수 회귀(Quantile Regression)를 통해 사고 심각도의 분위수별 차이를 살펴본 결과, 사고 규모와 보행자 사고는 고심각도 사고 에서 그 영향력이 더욱 크게 나타나, 평균적 사고 분석만으로는 드러나지 않는 위험 요인을 규명할 수 있었 다. 이는 고위험군에 대한 차별적 관리 필요성을 뒷받침하는 근거가 된다.

    본 연구의 학문적 기여는 교통사고 심각도 분석에서 기존 연구들이 주로 사망·중상·경상 등 서열형 범주 에 의존하던 접근을 넘어, EPDO 지표를 활용한 연속형 변수 기반 분석을 수행하였다는 점에 있다. 이를 통 해 사고 심각도의 미세한 변동을 반영할 수 있었으며, 강건 회귀와 분위수 회귀를 병행함으로써 평균적 분석 을 넘어 고심각도 사고의 특수성을 규명하였다. 정책적 측면에서는 다수 차량이 관련된 사고와 보행자 사고 를 교통안전정책의 핵심 관리 대상으로 설정하고, 야간 조명 강화·보행자 보호 시설물 확충 등 고심각도 사 고 예방을 위한 차별적 개입 방안을 제시할 수 있다. 더 나아가, 본 연구 결과를 기반으로 사고 위험 예측시 스템 구축, 2차 사고 조기 탐지 및 대응 프로토콜 개발 등 실질적 예방시스템의 설계 방향을 제안할 수 있다. 아울러 본 연구의 준탄력 해석 결과, 사고 관련 차량 수가 1대 증가할 때 2차 사고 심각도(1+EPDO)는 평균 적으로 약 13% 증가하는 것으로 나타나, 다중추돌 억제와 보행자 사고 특화 관리가 비용-효과적 정책 우선 순위임을 정량적으로 확인하였다.

    본 연구는 2차 사고를 ‘1차 사고 차량에 직접적인 물리적 피해를 가한 추가 추돌 사고’로 한정하였다는 한 계를 지니며, 향후에는 해외 사례를 참고하여 2차 사고 정의와 영향권 범위를 확장할 필요가 있다. 또한 표 본 수가 509건으로 제한되어 일반화 가능성에 한계가 있으므로, 경찰청(TAAS) 및 보험사 자료 등 대규모 데 이터를 활용하고, 데이터 불균형 문제를 보완할 방법을 모색해야 한다.

    분석 모형 측면에서는 정규성 및 등분산성 가정 위배를 보완하기 위해 다층모형(Multilevel Model)이나 베 이지안 계층모형(Bayesian Hierarchical Model)과 같은 대안적 접근을 적용할 필요가 있으며, 환경 요인과 공간 적 맥락은 외부 기상 및 GIS 자료와의 연계를 통해 정밀하게 검증해야 한다. 특히 콘존·링크 단위 등 공간적 요인을 반영할 수 있는 GIS 기반 공간회귀 등을 적용한다면 고속도로 공간 특성과 연계된 해석이 가능할 것 으로 기대된다. 더불어 기상 데이터를 단순 범주형(맑음/비/눈 등)에 그치지 않고, 기상청 기준의 ‘약한 비-보 통 비-강한 비-매우 강한 비' 구분이나 기상특보(주의보/경보), 혹은 연속형 변수인 강수량/강설량을 반영한다 면 날씨 요인 또한 심층적으로 해석 가능한 결과가 나올 것으로 기대된다. 마지막으로, 향후 연구에서는 머 신러닝 기반 예측모형을 도입하여 예측력을 강화하고 변수 중요도를 설명함으로써 학문적·실무적 활용성을 높일 수 있을 것이다.

    ACKNOWLEDGEMENTS

    본 연구는 행정안전부 국민수요맞춤형 생활안전 연구개발사업(RS-2024-004 07311)의 지원을 받아 수행하 였으며, 2024년 한국ITS학회 추계학술대회(2024.10.24)에서 발표된 내용을 보완하여 작성된 것입니다.

    Figure

    KITS-24-6-1_F1.jpg

    Histogram of EPDO

    KITS-24-6-1_F2.jpg

    QQ-plots of EPDO

    KITS-24-6-1_F3.jpg

    Box-plots of EPDO

    KITS-24-6-1_F4.jpg

    Residual diagnostics of the multiple regression model: (a) QQ plot for normality and (b) residuals vs. fitted values for homoscedasticity

    KITS-24-6-1_F5.jpg

    Quantile regression coefficient paths for selected variables. Each line shows the estimated coefficient (β) across quantiles (τ), with error bars indicating 95% confidence intervals.

    Variables: Number of vehicles, Vehicle to Pedestrian, Vehicle to Infrastructure, Night, and Snow.

    Reference categories: Vehicle-to-Vehicle, Day, Clear weather, and Dry road surface.

    Table

    Comparison of EPDO distribution characteristics

    Summary of cross-tabulation results between accident type and major categorical variables

    Classification and definition of variables

    Correlation coefficients between explanatory variables and accident severity

    Continuous variables were analyzed using Pearson’s r (and Spearman’s ρ for robustness)
    Binary variables were analyzed using Point-Biserial correlation (rpb)
    Nominal variables were tested by one-way ANOVA, with effect sizes reported as η2
    Significance levels: *p<0.05, **p<0.01, ***p<0.001
    FDR-adjusted p-values are reported to control for multiple testing

    Multiple regression analysis results for factors affecting accident severity

    Model fit indices: R² = 0.207, Adjusted R² = 0.188, AIC = 1081.1, BIC = 1136.1, Durbin–Watson = 1.981
    *p<0.05, **p<0.01, ***p<0.001

    Robust regression results for factors affecting accident severity

    *p<0.05, **p<0.01, ***p<0.001

    Reference

    1. Ahn, S., Lee, J. and Chang, I. ( 2024), “Analysis of Severity Factor of Secondary Incidents along Highway Segment”, Journal of the Korea Institute of Intelligent Transport Systems, vol. 23, no. 6, pp.28-42.
    2. Brubacher, J. R., Chan, H., Purssell, E., Tuyp, B. J., Ting, D. K. and Mehrnoush, V. ( 2017), “Minor injury crashes: Prevalence of driver-related risk factors and outcome”, The Journal of Emergency Medicine, vol. 52, no. 5, pp.632-638.
    3. Cho, N. W. and Kim, J. H. ( 2025), “Development of a model for predicting the severity of traffic accidents and analysis of accident factors based on machine learning”, Transactions of the Korea Information Processing Society, vol. 14, no. 2, pp.72-81.
    4. Gao, P., Chen, N., Li, L., Du, J. and Jin, Y. ( 2025), “Quantitative analysis of risk coupling effects in highway accidents: A focus on primary and secondary accidents”, Applied Sciences, vol. 15, no. 6, p.3114.
    5. Kim, C. and Kim, J. ( 2023), “A study on factors influencing the severity of autonomous vehicle accidents: Combining accident data and transportation infrastructure information”, Journal of the Korea Institute of Intelligent Transport Systems, vol. 22, no. 5, pp.200-215.
    6. Kockelman, K. M. and Kweon, Y. J. ( 2002), “Driver injury severity: An application of ordered probit models”, Accident Analysis & Prevention, vol. 34, no. 3, pp.313-321.
    7. Kwon, Y. M., Jang, K. T. and Son, S. H. ( 2018), “Risk factors affecting the injury severity of rental car accidents in South Korea: An application of ordered probit model”, Journal of the Korea Institute of Intelligent Transport Systems, vol. 17, no. 3, pp.1-17.
    8. Lee, S. and Park, J. ( 2024), “A study on autonomous vehicle crash hierarchy analysis and severity model based on Bayesian probabilistic inference”, Journal of Korean Society of Transportation, vol. 42, no. 1, pp.77-93.
    9. Lee, S. H., Jeung, W. D. and Woo, Y. H. ( 2012), “Comparative analysis of elderly’s and non-elderly’s human traffic accident severity”, Journal of the Korea Institute of Intelligent Transport Systems, vol. 11, no. 6, pp.133-144.
    10. Milton, J., Shankar, V. and Mannering, F. ( 2008), “Highway accident severities and the mixed logit model: An exploratory empirical analysis”, Accident Analysis & Prevention, vol. 40, no. 1, pp.260-266.
    11. Park, G., Lee, Y., Lee, H., Jang, J. and Yun, I. ( 2024), “Analysis of the factors influencing the severity of automated vehicle traffic accidents based on actual accident data”, Journal of the Korea Institute of Intelligent Transport Systems, vol. 23, no. 6, pp.63-80.
    12. Sarker, A. A., Paleti, R., Mishra, S., Golias, M. M. and Freeze, P. B. ( 2017), “Prediction of secondary crash frequency on highway networks”, Accident Analysis and Prevention, vol. 98, pp.108-117.
    13. Washington, S., Haque, M., Oh, J. and Lee, D. ( 2014), “Applying quantile regression for modeling equivalent property damage only crashes to identify accident blackspots”, Accident Analysis & Prevention, vol. 66, pp.136-144.
    14. Washington, S., Karlaftis, M. and Mannering, F. ( 2020), Statistical and Econometric Methods for Transportation Data Analysis, Chapman and Hall/CRC, Boca Raton, FL.
    15. Yang, H., Ozbay, K. and Xie, K. ( 2014), “Assessing the risk of secondary crashes on highways”, Journal of Safety Research, vol. 49, pp.143-149.
    16. Yoon, B. J., Lee, G. J. and Hong, S. G. ( 2025), “A Study on the Comparative Analysis of Accident Severity of Two-Wheeled Vehicles Using Random Forest Research Method”, Journal of the Society of Disaster Information, vol. 21, no. 2, pp.357-365.
    17. Yu, T., Gao, F., Liu, X. and Tang, J. ( 2021), “A spatial autoregressive quantile regression to examine quantile effects of regional factors on crash rates”, Sensors, vol. 22, no. 1, p.5.

    저자소개

    Footnote