Ⅰ. 서 론
1. 개요
교통사고는 교통사고처리 특례법에 따르면, 차량 운행 중 사람을 사상하거나 물건을 손괴하는 것을 의미 한다(National Law Information Center, 2024). 교통사고 발생 시 인명 피해는 피할 수 없으며, 이는 전 세계적 으로 심각한 사회적 문제로 주목받고 있다. 특히 대한민국의 경우, 2023년 인구는 약 5,100만 명이고, 자동차 등록 대수는 약 2,600만 대로, 인구 대비 차량 등록 비율이 2대 1에 달한다(Ministry of Land, Infrastructure and Transport, 2024). 이러한 수치는 자동차가 현대 생활과 얼마나 밀접하게 연관되어 있는지를 잘 보여준다.
2022년 하루 평균 540건의 교통사고가 발생하며, 이로 인해 772명의 부상자와 7명의 사망자가 발생한다 (National Police Agency, 2024). 여기에는 사고 후 부상으로 인한 사망자도 포함되며, 이는 사고 후 응급처치 및 회복 과정에서의 대응이 얼마나 중요한지를 보여준다. 이 문제는 단순히 사고 원인 분석만으로는 문제 해 결이 어렵고, 사고 후 대응 체계의 구축이 필수적이다.
이를 보완하기 위해 개발된 차량 긴급구난체계 서비스(e-call)는 교통사고 발생 시 사고 정보를 자동으로 구난센터에 전송해, 구조대와 교통관리기관에 신속히 알리는 시스템이다. 이를 통해 교통사고로 인한 인명 피해를 줄일 수 있을 것으로 기대된다.
그러나 긴급 구조대가 사고 현장에서 모든 상황을 즉각적으로 파악하고 대응하는 데 한계가 있으며, 이에 따른 중요한 요소가 바로 상해도 예측이다. 상해도는 사고 후 구조 조치와 후속 대응을 결정하는 데 중요한 역할을 하며, 후송 병원 선택에도 영향을 미친다. 신속하고 정확한 구조 대응을 위해서는 교통사고 발생 시 상해도 예측이 필수적이다.
본 연구에서는 머신러닝 기법을 활용해 교통사고 데이터를 분석하고 상해도를 예측하는 모델을 개발하고 자 한다. 이를 통해 구조대가 보다 신속하고 정확하게 대응할 수 있는 방법을 제시하며, 차량 긴급구난체계 서비스의 효율성을 극대화하는 데 기여할 것이다.
2. 선행 연구
교통사고와 관련된 연구는 다양한 측면에서 지속적으로 이루어져 왔다. 교통사고 원인 분석, 사고 유형 분 류, 상해 발생 여부, 교통량 예측 등 다방면에서 연구가 진행되었으며, 최근에는 교통사고 데이터를 활용한 머신러닝 기법의 적용 가능성에 대한 관심이 증가하고 있다.
Kim(2013)은 "우리나라 교통사고 발생 현황 및 도로교통사고 원인 분석"을 통해 한국의 교통사고 발생률 을 분석하고, OECD 국가들과 비교하여 사고 감소를 위한 정책적 방안을 제시하였다. 이 연구는 교통사고의 전반적인 원인과 발생 패턴을 파악하여 사고 예방 방안을 도출하는 데 중점을 두었다.
Jeong et al.(2014)은 "경미한 교통사고 유형에 관한 연구"에서 실제 교통사고 상황을 시뮬레이션하여 탑승 자의 상해 발생 여부를 분석하였다. 경미한 사고에 대한 상해 발생 가능성을 규명하며, 이를 통해 사고 상황 에 따른 대응 방안을 모색하였다.
또한, Jeong et al.(2016)은 "대형 교통사고 특성과 사고 유발 인자 분석"에서 대형 교통사고의 특성을 분석 하고, 사고 발생 요인(인적, 차량적, 도로 환경적 요인)을 도출하였다. 이 연구는 교통사고 특성에 따라 상해 발생 가능성이 달라질 수 있음을 보여주었고, 이를 바탕으로 사고 예방 방안을 제시하였다.
Moon et al.(2021)은 "유형별 교통사고 데이터 분석 및 관계성 분석"*을 통해 교통사고 유형별 상관관계를 분석하고, 상해 발생 패턴을 이해하는 데 기여하였다.
다음으로, 교통량 및 운전 경로 예측 연구에서는 Oh et al.(2023)이 "머신러닝을 이용한 이동통신 데이터 기반 교통량 추정 모형 개발"에서 VDS(도로 상황 데이터)와 이동통신 데이터를 활용해 교통량 예측 모델을 개발하였다. 이 연구는 교통량 예측의 정확도를 높이는 데 중점을 두었다.
Lee et al.(2023)은 "스태킹 앙상블 기법을 활용한 고속도로 교통 정보 예측 모델 개발 및 교차 검증" 연구에 서 딥러닝을 적용해 고속도로 교통 정보를 예측하였으며, VDS 데이터를 사용하여 예측 성능을 분석하였다.
마지막으로, Shim(2023)은 "교통 빅데이터 활용 시 개인정보 보호를 위한 연합 학습 기반 경로 선택 모델 링"에서 구글이 제안한 연합 학습 기법을 활용하여 교통사고 데이터를 분석하였다. 이 연구는 분산형 데이터 학습을 통해 운전 경로 예측 모델을 개발하였으며, 개인정보 보호를 고려한 연구였지만, 사고 후 상해도 예 측에 대한 내용은 다루지 않았다.
3. 연구의 필요성
기존 연구들은 교통사고 예방과 원인 분석, 교통량 예측에 중점을 두고 있으나, 사고 발생 후의 상해 예측 에 대한 연구는 상대적으로 부족하다. Kim(2013)의 연구는 교통사고 원인 분석과 발생 패턴을 중심으로 사고 예방을 위한 정책적 방안을 도출하는 데 초점을 맞추고 있으며, Jeong et al.(2014)은 경미한 교통사고에서 상 해 발생 여부를 다루었으나, 사고 이후의 상해 예측에 대한 구체적인 모델은 제시되지 않았다. Jeong et al.(2016)의 연구 역시 대형 교통사고의 원인 분석을 다루었으나, 사고 후 상해도 예측에는 집중하지 않았다. Moon et al.(2021)은 교통사고 유형별 상관관계를 분석하였지만, 사고 후 대응 체계와 관련된 연구는 부족한 실정이다.
또한, 교통량 예측 연구들은 주로 교통사고 예방에 중점을 두었고, Shim(2023)의 연구는 연합 학습 기법을 통해 경로 선택 모델을 개발하였지만, 상해도 예측과 같은 사고 후 대응에 대한 구체적인 접근은 이루어지지 않았다.
따라서 본 연구는 이러한 기존 연구들의 한계를 보완하고자 한다. iGLAD 데이터를 기반으로 교통사고 후 상해도를 예측하는 머신러닝 모델을 개발하여, 사고 후 구조 활동의 효율성을 높이는 실질적인 모델을 제시 하고자 한다. 상해도 예측에 중요한 변수를 선정하고, Random Forest, SVM, AdaBoost, CatBoost와 같은 앙상 블 모델을 적용하여 비교 분석함으로써, 데이터의 불균형 문제를 SMOTE 기법으로 해결하고, GridSearch 기 법을 사용하여 최적의 모델을 도출하였다.
본 연구는 사고 후 상해도 예측에 초점을 맞춘 첫 번째 구체적인 연구로, 기존의 교통사고 예방 및 원인 분석 연구와 차별화된다. 또한, 상해도 예측을 통해 사고 후 신속한 구조 활동을 지원함으로써 사고 대응 체 계를 개선하는 데 중점을 두고 있으며, 이는 기존 연구들과의 중요한 차별성을 강조한다. 실시간 데이터 처 리 및 예측이 가능한 머신러닝 모델을 적용하여, 교통사고로 인한 인명 피해를 줄이는 데 실질적인 대응 방 안을 제시하는 데 목표를 두고 있다.
Ⅱ. 학습 데이터 및 데이터
1. iGLAD(Initiative for the Global Harmonization of Accident Data)
iGLAD(Initiative for the Global Harmonization of Accident Data)는 교통사고 데이터의 표준화를 통해 전 세 계적으로 일관된 방식으로 데이터 수집과 분석을 가능하게 하는 프로젝트이다. 이 프로젝트는 교통사고 국 제 가이드라인 및 프로토콜의 개발, 교통사고 데이터베이스의 구축 및 관리, 그리고 교통사고 데이터의 공유 와 활용을 통해 연구와 정책 개발을 촉진하고 있다.
즉, iGLAD의 국제 표준화 작업은 교통 안전 연구자 및 자동차 제조업체 등 다양한 이해관계자들이 교통 사고 데이터를 보다 효과적으로 비교하고 분석할 수 있는 기반을 제공한다. iGLAD 데이터베이스는 크게 사 Accident, Participant, Occupant, Safety System 등 네 가지 항목으로 분류된다.
본 연구에서는 iGLAD에서 제공받은 데이터를 사용하여 머신러닝 알고리즘을 학습시키고, 이를 통해 상해 도를 예측하는 모델을 개발하였다.
2. Data의 특성 및 변수
iGLAD는 총 125개의 사고 관련 정보를 제공한다. 이 중 사고 정보는 27개 항목, 사고 차량 정보는 52개 항목, 탑승자 정보는 40개 항목, 안전 시스템 정보는 6개 항목으로 분류된다. 본 연구에서는 상해도 예측을 위해 이 중 6개의 특성 항목과 1개의 타겟 항목, 총 7개의 항목을 선정하였다.
첫 번째 항목은 상해도로, 본 연구의 타겟 변수이다. 상해도는 교통사고로 인한 인명 피해의 심각도를 예 측하며, 사고 후 대응 조치와 후송 병원 선택에 중요한 영향을 미친다. 상해 수준을 미리 예측할 수 있다면, 보다 나은 응급 구조 서비스를 제공할 수 있다.
두 번째 항목은 충돌 유형이다. 이는 교통사고의 충돌 형태를 정의하는 변수로, iGLAD에서는 10가지 유형 으로 분류된다. 충돌 유형에 따라 사고의 심각성과 상해도의 패턴이 다르게 나타나며, 정면 충돌은 측면 충돌 보다 더 심각한 상해를 초래할 가능성이 높다. 따라서 충돌 유형은 상해 예측에서 중요한 변수로 작용한다.
세 번째 항목은 충돌 속도이다. 사고 발생 시 차량의 속도는 상해도를 결정하는 주요 요인 중 하나로, 높 은 속도는 더 큰 에너지를 발생시켜 탑승자에게 전달되는 충격이 커지게 된다. 따라서 충돌 속도는 상해도 예측에 필수적인 요소이다.
네 번째 항목은 충돌 후 속도 변화량이다. 충돌 후 차량이 겪는 속도 변화는 탑승자가 받는 충격의 크기를 결정하는 중요한 변수이다. 속도의 급격한 변화는 탑승자에게 심각한 상해를 유발할 수 있으며, 감속과 가속 도는 상해 예측 모델에서 중요한 역할을 한다.
다섯 번째 항목은 차량의 무게이다. 차량 무게는 사고 시 에너지를 흡수하고 분산시키는 데 영향을 미친 다. 무거운 차량은 경량 차량에 비해 더 큰 충돌 에너지를 발생시키며, 탑승자에게 전달되는 충격을 증가시 키므로 상해도 예측에서 중요한 변수로 고려된다.
마지막으로 여섯 번째, 일곱 번째 항목으로는 안전벨트 착용 여부와 에어백 작동 여부이다. 안전벨트는 탑 승자를 보호하는 주요 안전 장치로, 착용 여부에 따라 상해도가 크게 달라질 수 있다. 에어백 역시 중요한 보호 장치로, 작동 여부가 상해도를 완화하는 데 중요한 역할을 한다. 따라서 두 변수는 상해 예측 모델에서 필수적으로 사용된다.
<Table 1>
Variable Name | Description | Type |
---|---|---|
MAIS | This variable shows the maximum single AIS | Categorical (0: MAIS 0, ~6: MAIS 6) |
Collision Type | The vehicle movement at the first point of collision or first mechanical impact if no collision occurred | Categorical (10 types) |
Collision Speed | Speed of the vehicle in km/h at the time of collision | Continuous |
Delta V | The Delta-v is the vector difference between immediate post-crash and pre-crash velocity. | Continuous |
Vehicle Weight | Weight of the vehicle | Continuous |
Seatbelt Use | Statement whether the seat belt was used (occupant was buckled up) during the accident | Categorical (0: Not used, 1: Used) |
Air bag Deployment | Statement whether the Airbag front was deployed. | Categorical (0: Not deployed, 1: Deployed) |
Ⅲ. 학습 데이터 및 데이터 특성
1. 머신러닝 알고리즘의 개요
머신러닝은 인공지능의 주요 분야 중 하나로, 기계가 데이터를 분석하고 학습하여 예측이나 결정을 자동 으로 수행할 수 있도록 하는 기술을 의미한다. 이 기술은 대량의 데이터 속에서 패턴을 인식하고, 이를 바탕 으로 새로운 데이터에 대해 예측하거나 분류하는 데 활용된다. 머신러닝 알고리즘은 크게 지도학습, 비지도 학습, 강화학습으로 구분되며, 각각의 학습 방식은 데이터와 상황에 따라 다르게 적용된다. 이들은 의료 진 단, 금융 분석, 이미지 및 음성 인식, 자연어 처리, 추천 시스템 등 다양한 분야에서 활용되고 있다.
본 연구에서는 이러한 머신러닝 기법을 활용하여 교통사고 데이터를 학습하고 상해도를 예측하는 모델을 개발하였다. 머신러닝 알고리즘으로는 Random Forest, SVM, AdaBoost, CatBoost를 사용하여 앙상블 모델의 성능을 비교하였다. 각 모델의 선택 및 적용 과정은 데이터의 특성에 맞춰 진행되었으며, 머신러닝을 위한 진행 과정은 다음과 같다.
<Table 2>
Model | Characteristic |
---|---|
Random Forest | An ensemble-based model that combines multiple decision trees to enhance prediction accuracy and robustness. |
Ada Boost | A boosting ensemble technique that iteratively improves performance by correcting learning errors. |
Cat Boost | A high-performance ensemble learning model based on gradient boosting that automatically handles categorical data. |
SVM | A powerful linear model that classifies data or performs regression by finding the maximum margin between classes. |
1) 데이터 전처리 및 불균형 해결 (Data Preprocessing and Handling Imbalance)
교통사고 데이터는 종종 불균형한 분포를 보인다. 심각한 상해가 발생하는 사고는 적고, 경미한 상해나 무 상해 사고가 비교적 더 많이 기록된다. 이러한 불균형으로 인해 모델 학습 시 특정 클래스에 편향될 가능성 이 높다. 이를 해결하기 위해 SMOTE(Synthetic Minority Over-sampling Technique) 기법을 사용하여 소수 클래 스 데이터를 증강하였다. SMOTE는 소수 클래스 데이터를 인위적으로 생성하여 데이터셋의 균형을 맞추고, 모델의 성능을 향상시킨다.
2) 앙상블 기법의 적용 (Application of Ensemble Methods)
앙상블 기법은 여러 모델을 결합하여 예측 성능을 향상시키는 방법이다. 본 연구에서는 Random Forest, AdaBoost, CatBoost와 같은 다양한 앙상블 기법을 적용하였다. Random Forest는 다수의 결정 트리를 학습시키 고, 그 결과를 종합하여 예측 정확도를 높인다. 특히 복잡한 데이터셋에서 강력한 성능을 발휘한다. AdaBoost는 이전 단계에서 잘못 분류된 데이터를 가중치로 반영하여 다음 학습 과정에서 더 나은 예측을 가 능하게 하는 부스팅 기법이다. CatBoost는 범주형 데이터를 효과적으로 처리할 수 있으며, 다양한 데이터 유 형에서도 높은 성능을 제공하는 앙상블 기법이다.
3) SVM을 활용한 고차원 데이터 분류 (SVM for High-Dimensional Data Classification)
SVM(Support Vector Machine)은 고차원 공간에서 데이터 분류에 강점을 가진 모델이다. 교통사고와 같은 복잡한 다차원 데이터를 처리할 때 유용하며, 커널 트릭을 통해 비선형 데이터를 효과적으로 분류할 수 있 다. 그러나 본 연구에서는 SVM이 상대적으로 낮은 성능을 보였는데, 이는 교통사고 데이터의 복잡성과 규모 가 SVM의 효과적인 학습을 제한했기 때문으로 해석된다.
4) 모델 최적화 (Model Optimization)
각 모델의 성능을 극대화하기 위해 GridSearch 기법을 사용하여 초모수(hyperparameters)를 최적화하였다. GridSearch는 다양한 파라미터 조합을 시도하여 최적의 학습 조건을 찾는 방법이다. 이를 통해 각 모델의 예 측 성능을 최대한 끌어올릴 수 있었다. 최적화된 모델은 정확도(Accuracy), 재현율(Recall), F1 스코어 등을 통 해 평가되었으며, 각 지표를 바탕으로 모델의 성능을 비교하였다.
2. 머신러닝 앙상블 모델
본 연구에서는 Random Forest, AdaBoost, CatBoost, SVM 4가지 앙상블 기법을 사용하여 교통사고 상해도 를 예측하고, 각 모델의 성능을 비교하였다. 앙상블 기법은 여러 모델을 결합해 예측 성능을 향상시키는 방 법으로, 각 모델의 강점을 극대화하고 약점을 보완하는 데 효과적이다.
1) Random Forest
Random Forest는 여러 결정 트리를 무작위로 학습시켜 과적합을 방지하고, 데이터 노이즈에 강한 성능을 보인다. 각 트리의 결과를 다수결로 결합해 최종 예측을 수행하며, 변수 중요도를 분석할 수 있어 다양한 변 수 간의 상관관계를 파악하는 데 유용하다. 이는 대규모 데이터셋에서도 빠르고 안정적인 성능을 제공한다.
2) AdaBoost
AdaBoost는 여러 약한 학습기를 결합해 강력한 예측 모델을 만드는 부스팅 기법이다. 잘못 분류된 데이터 에 가중치를 부여하며, 각 학습기 성능을 개선해 나간다. 특히 이진 분류 문제에서 효과적이며, 불균형 데이 터에서도 성능 향상을 기대할 수 있다. 다만, 노이즈에 민감한 특성을 보인다.
3) CatBoost
CatBoost는 범주형 데이터를 처리하는 데 특화된 그래디언트 부스팅 기법이다. 데이터 전처리 없이 범주 형 변수를 직접 처리할 수 있으며, 과적합 방지와 빠른 학습 속도를 제공해 실시간 예측 상황에서도 사용이 가능하다. 그러나 본 연구의 데이터 특성과는 완전히 일치하지 않아 성능이 다소 낮게 나타났다.
4) SVM (Support Vector Machine)
SVM은 데이터를 고차원 공간에서 분류하며, 커널 트릭을 통해 비선형 데이터 처리에 강점을 지닌다. 특 히, 복잡한 교통사고 데이터를 다루는 데 적합하나, 대규모 데이터셋에서는 학습 속도와 성능 저하가 발생할 수 있다. 본 연구에서는 상대적으로 낮은 성능을 보였다.
3. 머신러닝 앙상블 모델별 성능 및 선정
본 연구에서는 교통사고 데이터베이스를 활용하여 각 머신러닝 모델에 학습을 시킨 후 그 결과를 예측하 였다. 각 모델의 성능은 Accuracy, Error Rate, Recall, F1 Score 등의 평가 지표를 사용해 비교 분석되었다.
이 중 Accuracy 값을 최우선적으로 고려하여 모델의 성능을 평가하였다. 이를 통해 가장 적합한 모델을 선 정하고, 상해도 예측에 가장 효과적인 머신러닝 모델을 도출하는 데 중점을 두었다.
<Table 3>
Item | Method |
---|---|
Accuracy | True Positives + True Natives |
Error Rate | False Positives + False-atives |
Recall | |
F1Score |
1) Random Forest 모델의 예측 결과
Random Forest는 상해도 예측에서 높은 정확도와 재현율을 보였으며, F1 스코어 또한 우수한 성능을 나타 냈다. 특히, 86.04%의 정확도와 86%의 재현율을 기록하여, Random Forest가 도로환경 교통사고 데이터의 다 양한 특성과 복잡성을 효과적으로 처리할 수 있음을 보여주었다. 이러한 결과는 Random Forest의 강력한 데 이터 적응력과 노이즈 저항성 덕분으로 판단된다.
또한, Random Forest의 feature importance를 분석한 결과, 충돌 후 속도 변화가 상해 예측에 가장 중요한 변 수로 나타났다. 그 다음으로 차량의 무게, 안전벨트 사용 여부, 사고 발생 시 충돌 속도, 사고 분류, 에어백 작동 여부 순으로 중요도가 분포되었다. 교통사고로 인해 발생하는 속도 변화는 사고로 인해 발생하는 힘의 크기와 직결되기 때문에, 운전자 상해도와 밀접한 연관이 있는 것으로 예상된다.
2) AdaBoost 모델의 예측 결과
AdaBoost는 본 연구에서 정확도 38.99%로 가장 낮은 성능을 보였다. 이는 AdaBoost가 연구에서 사용된 복 잡한 데이터셋을 처리하는 데 어려움을 겪었음을 나타낸다.
특히, 복잡한 도로환경 데이터에서 과적합을 방지하고 정확한 예측을 수행하는 데 있어 AdaBoost가 한계 를 보였을 가능성이 크다. 이러한 이유로, 다른 모델에 비해 성능이 가장 낮게 나타난 것으로 판단된다.
3) CatBoost 모델의 예측 결과
CatBoost는 범주형 데이터 처리에 특화된 모델이지만, 본 연구에서는 Random Forest에 비해 다소 낮은 성 능을 보였다. 정확도는 79.09%로, Random Forest의 성능보다 다소 낮은 결과를 기록했다.
이는 CatBoost의 강점인 범주형 데이터 처리가 본 연구의 데이터 특성과 완전히 일치하지 않았을 가능성 이 있으며, 또한 도로환경과 관련된 특정 유형의 데이터에 최적화되지 않았기 때문에 예측 성능에 영향을 미 쳤을 것으로 판단된다.
4) SVM 모델의 예측 결과
SVM은 본 연구에서 상대적으로 낮은 성능을 보였다. 정확도는 46.05%로, 도로환경 데이터를 예측하는 데 있어서 매우 낮은 성능을 기록했다.
SVM은 고차원 데이터 처리에 강점을 지니고 있으나, 도로환경 데이터의 특성상 대규모이면서도 복잡한 데이터셋을 포함하고 있어, 이러한 요소들이 SVM의 효과적인 학습을 제한했을 가능성이 있다. 이러한 이유 로 예측 성능이 낮게 나타난 것으로 판단된다.
Ⅳ. 결론 및 향후 연구과제
본 연구는 교통사고 상해도를 예측하기 위해 iGLAD 데이터를 기반으로 머신러닝 기법을 활용하여 상해 예측 모델을 개발하였다. 연구 결과, Random Forest 모델이 86.04%의 정확도로 가장 높은 성능을 보였으며, 상해도 예측에 있어 가장 효과적인 모델임을 확인하였다. 특히, 속도 변화, 차량 무게, 안전벨트 사용 여부가 상해도 예측에 중요한 변수로 도출되었으며, 이는 사고 후 구조 및 응급 처치 방향을 결정하는 데 있어 핵심 적인 기준이 될 수 있음을 보여준다.
CatBoost 모델은 79.09%의 정확도를 기록하였으나, 범주형 데이터 처리의 이점이 본 연구의 데이터 특성 에 충분히 반영되지 않아 성능이 최적화되지 않았다고 판단된다. 반면, SVM 모델과 AdaBoost 모델은 복잡한 도로환경 데이터를 처리하는 데 적합하지 않아 상대적으로 낮은 성능을 보였다. 이러한 결과는 다양한 모델 의 특성과 데이터셋의 특성이 맞아떨어질 때 성능이 극대화될 수 있음을 시사한다.
또한, 본 논문은 실시간 상해도 예측이 가능한 머신러닝 모델을 제시하여, 교통사고 후 신속하고 정확한 구조 활동을 지원할 수 있는 시스템을 제안했다. 이를 통해 구조 대응 시간을 단축하고, 적절한 응급조치를 신속하게 제공함으로써 교통사고로 인한 인명 피해를 실질적으로 줄일 수 있는 가능성을 확인하였다. 이러 한 시스템은 향후 교통사고 대응 체계에 중요한 역할을 할 수 있을 것이다.
본 연구의 한계로는 iGLAD 데이터가 표준화된 형식으로 수집되었음에도 불구하고 모든 교통사고 데이터 를 포괄하지 못한다는 점이 있다. 지역적 특성, 교통 환경, 차량 특성 등이 상이할 경우, 모델의 예측 정확도 에 영향을 미칠 수 있다. 또한, 실제 응급 상황에서 예측 모델의 유용성을 검증하기 위한 현장 테스트가 이 루어지지 않았다는 점도 한계로 지적된다.
향후 연구에서는 더 다양한 데이터셋을 활용하여 지역별 특성, 날씨, 운전자의 신체 상태 등 상황적 요소 를 반영한 모델의 개선이 필요하다. 특히, 실시간 데이터 처리 시스템을 구축하여 사고 직후 신속한 구조 활 동을 가능하게 하는 연구가 중요하다. 이를 통해 교통사고 후 구조 대응 체계의 효율성을 높이고, 더 나아가 교통사고 예방 측면에서도 머신러닝 모델을 확장하여 활용할 수 있을 것이다.