Ⅰ. 서 론
1. 개요
수송부문은 국가 온실가스 배출의 주요 원천으로, 특히 도로교통 비중은 96.5%에 달한다(GIR, 2022). 파리 협정 이후 각국은 국가온실가스감축목표(NDC)를 설정했으며, 우리나라도 2030년까지 2018년 대비 40% 감축 을 목표로 하고 있다(Presidential Commission on Carbon Neutrality and Green Growth, 2025). 이는 「탄소중립·녹 색성장기본법」(2021)에 근거한 2050 탄소중립 달성을 위한 중간 목표이다. 따라서 수송부문 배출량을 정밀하 게 산정하는 것은 감축 전략 수립과 정책 효과 검증의 핵심 과제다.
국외에서는 다양한 국가 배출량 산정 모형이 이미 개발·운영되고 있다. 대표적으로 유럽 환경청(EEA)의 COPERT (Computer Programme to calculate Emissions from Road Transport), 미국 환경보호청(EPA)의 MOVES (Motor Vehicle Emission Simulator), 캘리포니아 대기자원위원회(CARB)의 EMFAC(EMission FACtor model) 등 이 있다. 이들 모형은 차종, 유종, 규모, 속도, 가감속도, 운행시간 등 세분화된 요인을 입력으로 활용하며 (EEA, 2023;EPA, 2024;CARB, 2021), 이러한 요인들의 정밀성이 높을수록 산정 결과의 신뢰성도 향상된다.
국내 도로운송 부문의 온실가스 배출량 산정은 국립환경과학원(NIER)과 한국교통안전공단(KTSA)의 배출 계수식에 기반하며, 차종(승용차·승합차·트럭), 유종(휘발유·경유·LPG), 규모(소형·중형·대형), 평균속도를 주 요 변수로 활용한다(NIER, 2012;KTSA, 2021). 그러나 실제 차종·유종·규모별 데이터는 시군구 단위 집계 통 계에 의존해 지역·도로링크별 특성을 반영하기 어렵다(Kim et al., 2024). Han et al.(2022)은 영상검지 자료를 활용해 교차로 접근로의 속도·교통량·가속도를 고려했으나, 평균속도와 단순 교통량 기반 방식으로는 교차 로 특성을 설명하기 부족함을 확인했다. Yun(2023) 또한 서울시 행정동 단위 VKT를 활용한 분석에서, 집계 지표만으로는 도시공간구조에 따른 배출 특성 차이를 설명하기 어렵다고 지적했다. 따라서 국내 산정체계는 여전히 정밀한 공간 단위와 차종·유종별 특성을 충분히 반영하지 못하고 있다.
최근 교통데이터의 축적은 배출량 산정에 새로운 기회를 제공하고 있다. 내비게이션과 디지털운행기록장 치(Digital Tachograph, DTG)에서 수집된 차량 궤적 데이터는 실제 이동 경로와 주행 특성을 고해상도로 관찰 할 수 있게 하지만, 특정 지역·시간대에서는 표본 대표성의 한계가 존재한다(Lu et al., 2017;Meppelink et al., 2020). 따라서 궤적 데이터를 모집단 수준으로 확장하고, 배출모형이 요구하는 형식에 맞게 보정하는 과정이 필요하다.
본 연구는 이를 위해 다양한 교통 데이터와 차량 등록 정보를 결합한 링크 단위 차종별 교통량 추정 모형 을 개발한다. 관측 교통량은 한국도로공사 TCS(톨게이트 전수)와 건설기술연구원의 상시검지기 기반 AADT 에서 확보하였고, 미관측 구간은 한국교통연구원(KOTI)의 View-T DB(KOTI, 2025)로 보완하였다. View-T DB 는 Level 6 상세도로망(약 11만 km)을 기반으로 구축된 자료로, 연평균일교통량을 차종별로 제공한다. 해당 상세도로망은 본 연구에서 링크 단위 교통량 추정 및 배출량 산정의 기본 공간 단위로 활용된다. 여기에 시· 군·구별 등록차량의 차종·유종·규모별 VKT 분포를 추가하여 모형의 제약조건으로 활용하였다.
제안된 모형은 관측 및 추정 교통량과의 정합성을 유지한 상태에서 내비게이션(비사업용)과 DTG(사업용) 궤적을 상호 보완적으로 보정·확장하여 링크 단위 차종별 교통량을 산출한다. 이 이후 궤적의 출발지와 등록 차량의 VKT 분포를 결합해, 최종적으로 링크 단위 차종·유종·규모별 교통량을 추정한다.
본 연구의 기여는 다음과 같다. 첫째, 내비게이션 및 DTG 차량 궤적 데이터를 상호 보완적으로 결합하여 국가 온실가스 배출·흡수 계수 분류체계에 따르되, 유종이 ‘전기’인 경우를 포함한 세부 차종(차종·유종·규 모)별 교통량 추정을 수행하였다. 둘째, 차종별 교통량 추정 문제를 효율적인 최적화 문제로 정의함으로써, 최종적으로 학습에 쓰인 274,742개 링크와 전국 2일 치에 해당하는 10,799,025개의 궤적으로 구성된 대규모 데이터에도 개인용 PC 수준에서 확장성 있게 적용할 수 있도록 하였다. 셋째, 궤적 데이터의 고해상도 시공 간 특성과 자동차 등록자료 기반 VKT 분포를 결합함으로써, 기존 집계 데이터를 단순 분해하는 방식이 아 닌 실제 주행 행태에 기반한 정밀한 교통량 산출을 가능하게 하였다. 넷째, 이러한 접근은 국내 온실가스 배 출량 산정 모형의 정밀화를 위한 실질적 토대를 제공한다는 점에서 학문적·실무적 의의를 가진다.
Ⅱ. 선행 연구
1. 궤적 기반 교통량 추정 연구
차량 궤적 데이터는 시·공간적으로 고해상도의 이동 정보를 제공하므로, 전통적인 OD 행렬 기반 교통량 추정(통행배정)과 달리 실제 경로를 반영하여 링크 통과 정보를 직접적으로 고려할 수 있다는 장점이 있다. 국내에서는 Jung et al.(2021)이 차량 궤적 자료를 활용해 교통량과 통행지연 간의 관계를 나타내는 통행비용 함수(VDF)를 보정함으로써 추정 교통량과 관측 교통량 간의 적합도를 개선한 바 있다.
국외에서는 표본 궤적 데이터를 전체 교통량으로 확장하기 위한 다양한 방법이 제안되었다. Miller et al.(2020)은 약 3% 수준의 GPS 궤적 표본을 활용하여 링크별 교통량을 추정하는 최적화 기법을 개발하였고, 이를 통해 기존 방법 대비 약 45%의 오차를 줄였다. 또한 Zhong et al.(2023)은 표본 대표성 부족 문제를 해 결하기 위해 역강화학습(Inverse Reinforcement Learning) 기반 궤적 생성 모형을 제안하여, 낮은 표본률 상황 에서도 네트워크 전 구간의 링크 교통량을 비교적 정확히 추정하였다.
이처럼 기존 연구들은 공통적으로 표본 궤적 데이터를 전수 수준의 교통량으로 확장하기 위한 기법을 발 전시켜 왔으며, 이는 본 연구의 문제의식과 직결될 뿐만 아니라 제안하는 최적화 기반 교통량 추정 방법론의 토대를 이룬다.
2. 세분화된 차량유형별 입력자료를 통한 배출계수 산정 연구
국외의 대표적 배출모형인 COPERT, MOVES, EMFAC은 모두 차종·유종·규모별 세분화된 입력을 요구한 다. COPERT는 링크 단위 평균속도와 주행거리를 활용하며, Lejri et al.(2018)은 초단위 궤적 기반 속도·거리 분포와 공회전 시간을 반영하면 혼잡 배출을 더 현실적으로 설명할 수 있음을 보였다. MOVES는 링크, 시간, 차량유형 단위에서 초단위 속도·가속도·경사로부터 산출한 운행모드(op-mode) 분포와 도로유형·기상·연료·연 식 등 다차원 입력을 반영해 대규모 네트워크에서도 정밀한 배출 추정을 지원한다(Liu et al., 2019). EMFAC 은 권역 단위에서 등록차량 기반 차종·유종·규모별 구성과 주행거리를 결합하지만, Bishop(2021)은 실도로 관 측과 비교해 경량 가솔린차의 NOx 과소추정을 지적하였다.
국내에서는 12개 차종 분류체계와 집계된 차종·유종·평균속도를 주로 활용한다. Kim et al.(2025)은 이를 보완하기 위해 도로 종단경사를 추가 입력으로 반영하는 보정계수를 제시하였고, 적용 결과 차종·유종·규모 별 배출계수와 링크별 배출량이 크게 달라짐을 확인하였다. 이는 국내 모형에서도 정밀 입력 확보가 배출 추 정 정확도 향상에 필수적임을 시사한다.
결국, 배출 산정의 신뢰성은 입력자료의 정밀성에 달려 있으며, 링크 단위에서 차종·유종·규모별 교통량을 정합적으로 산출하려는 본 연구의 목적은 이러한 요구와 직접적으로 맞닿아 있다.
3. 최적화 기반 표본 대표성 보정 연구
차종·유종·규모별 교통량을 산출하기 위해서는 표본 기반 궤적 데이터의 대표성 한계를 보정해야 한다. 이를 위해 국외 연구에서는 최적화 기법이 주로 활용된다. Yang et al.(2017)은 난징 GPS 궤적에서 구축한 OD 행렬을 네트워크에 할당한 뒤, 링크별 추정 교통량이 관측값과 일치하도록 일반화 최소제곱(GLS) 최적 화를 적용하였다. 그러나 시뮬레이션 네트워크에 한정되었고 세분화된 차량 유형은 고려하지 못했다. Zhao et al.(2020)은 플로리다에서 GPS, OD 총량, 관측교통량을 결합하여 공차·부분 적재·만차 상태별 화물차 교통 량을 동시에 추정하는 비선형 최적화 모형을 제시했으며, 이를 통해 관측치와 근사하면서 빈 차 비율의 공간 분포까지 분석할 수 있었다.
즉, 궤적 데이터를 모집단 수준으로 확장하기 위해 최소제곱·비선형 최적화가 적용되어 왔으나, 특정 지 역·차종에 국한된 한계가 있었다. 본 연구는 이를 확장하여 비사업용 표본(T-MAP)과 사업용 전수(DTG)를 통 합하고, 관측·추정 교통량 및 시군구별 VKT 차량구성과 동시에 정합되도록 하는 최적화 모형을 제시한다. 이를 통해 국내 전역 상세도로망(Level 6)에서 차종·유종·규모별 교통량을 실측 기반으로 정밀 추정한다는 점에서 차별성을 가진다.
Ⅲ. 활용 데이터
1. 관측교통량 및 추정교통량
본 연구는 전국 상세도로망(Level 6) 단위의 링크별 교통량 참값으로 관측교통량과 추정교통량을 결합하 여 활용하였다. 관측교통량은 2023년 기준 한국도로공사의 TCS(연평균일교통량 및 24시간대 교통량), 건설 기술연구원의 수시·상시 조사자료, 주요 8개 도시(서울, 인천, 세종, 대전, 대구, 광주, 울산, 부산) 자료를 포 함한 총 11,050개 링크 값이다. 추정교통량은 한국교통연구원(KOTI)의 View-T DB로, 전국 상세도로망(Level 6) 단위에서 링크별 추정치를 제공한다.
관측교통량의 현실성과 추정교통량의 공간적 포괄성을 결합함으로써, 본 연구는 궤적데이터 기반 교통량 확장·보정 과정에서 이를 기준 참값으로 활용하였다.
2. GPS 궤적데이터
본 연구는 2023년 10월 16~17일 이틀간 수집된 내비게이션(T-MAP)과 디지털운행기록장치(DTG) 기반의 전국 GPS 궤적데이터를 활용하였다. T-MAP은 승용차와 소형 화물차의 주행 궤적을 포함하나, 일부 차량 유 형 구분이 불명확하고 유종은 휘발유 비중이 과대 추정되는 한계가 있어 차량등록지 차종·유종·규모별 VKT 통계를 활용한 확률적 배정이 필요하다. DTG는 중·대형 사업용에 해당하는 승합차 및 화물차의 전수 자료 로, 승합차(마을·시내·시외·고속·전세 버스)와 화물차(중형·대형) 구분이 가능해 대표성이 높으나 유종 정보 는 제공되지 않아 동일하게 VKT 기반 배정이 요구된다.
본 연구는 차량 유형별 특성을 고려해 두 자료를 상호 보완적으로 활용하였다. 승용차는 T-MAP 데이터를 중·대형 사업용에 해당하는 승합차 및 화물차는 DTG, 비사업용에 해당하는 승합차 및 화물차 전체와 및 소 형 사업용에 해당하는 승합차와 화물차는 T-MAP과 DTG를 병행 적용하였다. 이후 궤적 수가 링크별 관측· 추정 교통량 참값과 합치되도록 샘플링하여, 표본 궤적데이터를 모집단 수준 교통량으로 확장하였다. 마지막 으로, 국가 온실가스 배출계수 모형 기준의 VKT, 관측교통량, T-MAP, DTG 간 차종·규모 대응 관계를 아래 <Table 1>과 같이 정리하여 데이터 출처별 분류체계 차이를 확인하였다.
<Table 1>
Correspondence of Vehicle Type and Size Categories among the National Greenhouse Gas Emission Factor Model, VKT, Observed Traffic Volume, T-MAP, and DTG Data
| National Greenhouse Gas Emission Factor Model | VKT | Observed Traffic Volume | T-MAP | DTG | ||||
|---|---|---|---|---|---|---|---|---|
| Type | Size | P(Type, Size) | Remarks | Type | P(Type, Size) | Type | P(Type, Size) | |
| Passenger Car | Compact | 5.4% | TCS, KICT, Sejong, Busan: by type/size; Seoul, Incheon, Daejeon, Daegu, Gwangju, Ulsan: only observed. |
Compact Car | 3.9% | |||
| Small | 0.5% | Passenger Car | 91.2% | |||||
| Medium | 46.0% | |||||||
| Large | 24.3% | |||||||
| Passenger Bus | Small | 0.2% | ||||||
| Medium | 0.2% | Middle Car | 3.0% | Rural/Community Bus | 12.2% | |||
| Large | Express | 2.4% | Large Car | 1.2% | Intercity/Express/Charter Bus | 18.8% | ||
| City | 1.7% | City Bus | 38.7% | |||||
| Truck | Small | 12.8% | Light Truck | 0.7% | ||||
| Medium | 2.4% | General/Individual Truck | 30.3% | |||||
Ⅳ. 방법론
본 연구는 T-MAP과 DTG 차량 궤적 데이터를 활용해 상세도로망(Level 6) 단위에서 링크별 차종·유종·규 모별 교통량을 추정한다. 국내 교통자료는 수집 주체와 분류체계가 상이하므로, 모든 데이터를 자동차주행거 리(VKT) 통계의 분류체계 및 구성비에 맞추어 변환하였다. 각 궤적에는 VKT 기반 확률 배정을 통해 차종· 유종·규모를 할당한다. 단순 궤적 확장만으로는 대표성 한계가 있으므로, 관측교통량과 추정교통량을 결합한 ‘목표 교통량’을 설정하여 최적화 기준으로 삼았다. 관측교통량은 현실성을, 추정교통량은 전 구간 제약을 제공해 해의 탐색 범위를 규정한다.
최적화 과정은 링크별 교통량이 목표 교통량과의 오차를 최소화하도록 T-MAP과 DTG를 결합한다. 전수 자료인 DTG에는 가중치 1을, 표본편향이 있는 T-MAP에는 보정계수를 부여하여 추정한다. 산출된 계수는 T-MAP 기반 교통량을 현실적으로 조정하며, 이후 단계에서 VKT 통계를 활용해 차종·유종·규모별로 확률적 분해를 수행한다. 최종적으로 본 연구는 목표 교통량과 정합성을 확보하면서도 실제 주행 특성을 반영한 링 크 단위 차종·유종·규모별 교통량 분포를 추정한다.
1. 궤적-링크 관계 행렬 구축
궤적 데이터를 국가교통DB(KTDB) 상세도로망(Level 6) 링크 시퀀스로 변환하기 위해 맵매칭(map-matching) 전처리를 수행하였다. 최적화 입력의 신뢰성을 확보하기 위해 T-MAP 표본이 충분한 링크만을 분석 대상으로 선정하였다. 구체적으로, 승용차를 기준으로 2일간 평균 표본율이 5% 이상인 링크를 보존하고, 교통량 데이터가 없거나 평균 표본 비율을 충족하지 못하는 링크는 제외하였다.
<Table 2>는 필터링 결과를 도로 등급별로 요약한 것이다. 고속도로(Rank 101)는 91.8%가 보존된 반면, 시 군도(Rank 107)는 10.3%만 남아 전체적으로 원자료의 약 76.6%가 제거되었다. 최종적으로 약 27만 개 링크가 분석 대상에 포함되었으며, 이는 국가 간선망과 지역 주요 도로를 중심으로 정제된 네트워크를 의미한다.
<Table 2>
Number of Road Links by Road Class Before and After Filtering
| Road Rank | Road Class | No. of Links (Original) | No. of Links (Filtered) | Survival Rate (%) |
|---|---|---|---|---|
| 101 | National Expressway | 15,695 | 14,403 | 91.8% |
| 102 | Urban Expressway | 1,964 | 1,819 | 92.6% |
| 103 | General National Highway | 115,740 | 86,372 | 74.6% |
| 104 | (Special) Metropolitan City roads | 201,549 | 45,017 | 22.3% |
| 105 | State-funded local highways | 27,947 | 16,851 | 60.3% |
| 106 | Local Highway | 81,398 | 28,773 | 35.3% |
| 107 | Si roads, Gun roads | 718,947 | 73,709 | 10.3% |
| 108 | Expressway Ramp | 8,388 | 7,798 | 93.0% |
| Total | Total | 1,171,628 | 274,742 | 23.4% |
본 연구는 모든 T-MAP 궤적과 필터링을 통과한 신뢰도 높은 링크를 대상으로 궤적–링크 관계 행렬을 구 축하였다. 이 행렬은 행(row)이 개별 궤적을, 열(column)이 도로 링크를 나타내며, 원소는 해당 궤적이 해당 링크를 통과한 횟수로 정의된다. 신뢰도 부족으로 제외된 링크를 통과한 궤적이라도, 다른 신뢰도 높은 링크 에 대한 기록은 그대로 반영된다.
DTG 데이터는 중·대형 사업용에 해당하는 승합차 및 화물차의 전수 주행 기록으로, 궤적 1개가 곧바로 링크당 1대의 교통량으로 집계되며 별도의 행렬 구축 없이 가중치 1이 적용된다. 반면 T-MAP 데이터는 목 표 교통량과의 정합을 위해 행렬 기반 추정치를 최적화 모형으로 산출하며, 최종적으로 두 자료가 합산되어 전체 링크별 교통량을 구성한다.
2. 궤적 가중치 최적화 모형
1) 최적화 목표 변수 정의
본 모형은 데이터 성격에 따라 교통량을 분리해 접근한다. 본 연구에서 최적화의 목표가 되는 교통량 데 이터는 승용·승합·화물차 차종별로 구분되어 제공되므로, 본 모형 역시 이러한 데이터 구조에 맞춰 각 차종 의 교통량을 개별적으로 추정하는 것을 목표로 한다. DTG는 중·대형 사업용에 해당하는 승합차 및 화물차의 전수 자료이므로 확정값으로 간주해 전체 교통량에 일괄 반영한다. T-MAP의 경우, 승용차와 화물차처럼 차 종이 명확한 궤적에는 최소 1회의 주행량을 기본값으로 할당한다. 반면 중형·대형차처럼 차종이 혼재된 궤 적은 사전 할당에서 제외하고, 최적화 과정을 통해 교통량을 추정한다. 따라서 최종적으로 각 차종에 대해 모형에서 산출된 링크별 교통량 Ej 는 DTG 데이터를 기반으로 사전에 할당된 교통량(Vj,DTG,base ), T-MAP 데 이터를 기반으로 사전에 할당된 교통량(Vj,TMAP,base ), T-MAP 데이터를 활용해 추가로 할당된 교통량 (Vj,TMAP,add)의 선형조합으로 구성되며, 식(1)과 같이 표현할 수 있다.
-
Ej : 각 차종별 모형에서 산출된 링크 j의 교통량
-
ai,j : 각 차종별 궤적 i의 링크 j 방문 횟수
-
wi : 각 차종별 궤적 i의 가중치이며 DTG,base에서는 1; TMAP,base에서는 중형차와 대형차인 경우에는 0, 나머지는 1; TMAP,add에서는 추가 샘플링 횟수임
-
Vj,DTG,base : 각 차종별 링크 j에 사전 할당된 DTG 교통량
-
Vj,TMAP,base : 각 차종별 링크 j에 사전 할당된 T-MAP 교통량
-
Vj,TMAP,add : 각 차종별 링크 j에 추가 할당된 T-MAP 교통량
즉, 3가지 차종(승용·승합·화물차)에 대해 각각 목표 잔여 교통량 Oj 을 개별 T-MAP 궤적에 추가 가중치 wi 를 적용하여 산출한 추가 교통량(Vj,TMAP,add )으로 가장 잘 설명하는 것이 본 최적화의 핵심이다. 안정적인 해를 도출하기 위해 본 연구에서는 2일간의 궤적 데이터를 통합하여 사용하였으며, 이에 따라 목표 잔여 교 통량 Oj 역시 동일한 배율로 조정하여 데이터 스케일을 일치시켰다.
2) 최적화 방법론
추가 가중치 벡터 를 추정하기 위한 최적화 모형은 데이터 적합성을 높이는 오차 항과 정규화 항의 가 중합으로 구성된 목적 함수를 최소화하는 것을 목표로 한다. 즉, 식 (2)을 최소화하는 것으로 다음과 같이 정 의된다.
-
wi : 궤적 i에 부여되는 추가 가중치
-
Oj : 각 차종별 링크 j의 목표 잔여 교통량
-
Vj,TMAP,add : 각 차종별 링크 j에 추가 할당된 T-MAP 교통량
-
Nlink , Ntraj : 해당 분석 단위에 포함된 총 궤적 수 및 총 링크 수
-
λ : 정규화 강도를 조절하는 하이퍼파라미터
식 (2)을 구성하는 첫 번째 항은 모델이 추정한 추가 교통량(Vj,TMAP,add )과 실제 목표 잔여 교통량 Oj 간의 평균제곱오차(MSE)를 나타낸다. 목표 잔여 교통량은 앞서 정의한 바와 같이, 관측교통량이 있는 링크에서는 해당 값을, 관측치가 없는 링크에서는 추정교통량을 활용하여 구성한 목표 교통량에서 사전 배정된 교통량 을 제외한 값으로 정의된다. 이 항을 최소화하는 것은 모델의 추정치가 실제 데이터와 최대한 정합되도록 만 들어 데이터 적합성을 높이는 역할을 한다.
두 번째 항은 가중치 벡터의 L2-norm 제곱을 최소화하여 과적합을 방지하는 항이다. 만약 정규화가 없다 면, 최적화 과정에서 전체 교통량을 충족시키기 위해 소수의 특정 궤적에만 큰 가중치가 부여되는 해가 도출 될 수 있으며, 이는 수학적으로는 유효하더라도 실제 통행 패턴과는 괴리될 수 있다. 정규화 항은 가중치 크 기 자체에 페널티를 부여하여 모든 궤적이 균형 있게 기여하도록 유도함으로써, 최종 가중치 분포가 실제 통 행 분포와 보다 유사해지도록 한다. 해당 항은 차량 궤적자료의 상세 운행 패턴을 유지하게 하는 본 최적화 모형의 핵심 항이다.
따라서 손실 함수는 오차 항과 정규화 항이 각기 다른 역할을 수행하며, 두 항의 균형을 조절하는 계수 λ 의 설정이 매우 중요하다. 오차 항의 규모는 링크 수와 평균 교통량에, 정규화 항의 규모는 궤적 수와 평균 가중치에 의존하므로, 고정된 λ값은 분석 단위에 따라 불균형한 규제를 유발할 수 있다. 이에 본 연구는 데 이터의 구조적 특성을 반영하여 식 (3)와 같이 λ를 동적으로 설정하였다.
-
C: 전체 정규화 강도를 조절하는 보정 상수 (본 연구에서는 C = 10 적용)
-
Vsample : 해당 분석 단위에 포함된 T-MAP 관측 총 통행량
-
Nlink , Ntraj : 해당 분석 단위에 포함된 전체 궤적 수 및 전체 링크 수
-
TRT: 총 잔여 교통량(Total Residual Traffic)으로 분석 링크의 목표 잔여 교통량( Oj )의 총합
본 연구의 목표는 식 (2)로 정의된 손실 함수를 최소화하는 추가 가중치 wi 를 추정하는 것이다. 이때 궤적 의 가중치는 음수 값을 가질 수 없으므로, 모든 가중치가 0 이상이어야 한다는 비음수 제약 조건(Nonnegativity constraint)을 부과하였다. 이 제약은 모델 결과가 실제 상황과 부합하도록 하는 실질적인 역할을 한 다. 특히 사전 처리 과정에서 ‘최소 1회 주행’이 보장된 궤적 그룹의 경우, 최종 가중치 Wi 는 추가 가중치 wi 에 1을 더한 값( Wi = wi + 1)으로 계산된다. 따라서 wi ≥ 0이라는 제약은 해당 궤적들의 최종 가중치 Wi 가 항 상 1 이상이 되도록 하여, 모델이 현실적인 가정을 위배하지 않도록 보장한다.
이와 같이 목적 함수가 변수에 대한 이차식으로 표현되고 선형 제약 조건이 포함된 문제는 일반적인 이차 계획법(QP: Quadratic Programming) 문제로 정식화된다. 그러나 본 연구에서 다루는 궤적 데이터는 규모가 매 우 크기 때문에 범용 QP 솔버(Solver)를 적용할 경우 메모리 오류 등 계산상의 한계가 발생하였다. 이에 따 라, 대규모 볼록 최적화(Large-Scale Convex Optimization)에 특화된 CLARABEL1) 솔버를 활용하여 안정적으 로 최적 가중치를 도출하였다.
3. 차종·유종·규모별 교통량 구성비 계산
차종·유종·규모 교통량은 각 궤적의 최종 가중치( Wi )와 차종·유종·규모 변환 확률 P 을 결합하여 산출된 다. 여기서, 궤적 i의 최종 가중치 Wi 는 해당 궤적이 실제 교통량에서 몇 대의 차량을 대표하는지를 의미하 며, 데이터의 종류에 따라 차별적으로 결정된다. 구체적으로, 중·대형 사업용에 해당하는 승합차 및 화물차 의 DTG 궤적은 전수 데이터로 간주되므로 가중치를 1로 고정한다. 반면, 추가 샘플링이 이루어진 T-MAP 궤 적은 중형·대형차를 제외한 모든 궤적이 1회 사전 배정되었으므로, 최종 가중치는 산출된 추가 가중치에 1을 더하여 확정한다.
즉, 각 궤적은 기존 차종 정보 ki 와 출발지 ri 를 보유하고 있으며, 이를 기반으로 출발지의 VKT를 활용하 여 특정 차종·유종·규모(s, 예: 승용차-중형-경유)으로 변환될 확률 P (s∣ki,ri) 을 산출한다. 최종적으로 특정 링크 j를 통행하는 특정 차종·유종·규모(s)의 교통량 Vs,j은 해당 링크를 통과한 모든 궤적에 대해 최종 가중 치와 변환 확률의 곱을 합산하여 계산하며, 이는 식 (4)과 같이 정의된다.
앞서 산출된 링크별 차종·유종·규모 교통량 Vs,j을 기반으로, 각 링크의 전체 교통량 대비 차종·유종·규모별 구성 비율 Rs,j을 도출할 수 있다. 이를 위해 먼저 링크 j를 통과하는 전체 교통량 전체 교통량 Vj을 구하며, 이는 해당 링크를 통행하는 모든 차종·유종·규모(s)의 교통량을 합산하여 계산된다. 이후 특정 차종·유종·규모 (s)의 비율은 해당 차종의 교통량 Vs,j을 전체 교통량 Vj 로 나눈 값으로 산출되며, 이는 식 (5)와 같다.
4. 평가 지표 정의
모형 성능은 편향, 예측 정확도, 설명력, 안정성을 종합적으로 평가하였다. 편향성은 평균오차(ME), 예측 정확도는 평균절대오차(MAE)와 평균절대비율오차(MAPE)로 측정하였다(식 6). 설명력은 결정계수(R²)를 활 용했으며, 해의 과적합 여부와 안정성 검증을 위해 추가 샘플링 횟수의 변동계수(CV)를 도입하였다(식 7).
-
Aj : 링크 j의 실제 차종별 교통량
-
Fj : 각 차종별(승용·승합·화물차)로 모형에서 산출된 링크 j의 교통량
-
A: 실제 교통량의 전체 평균값
-
Nlink : 해당 분석 단위에 포함된 전체 링크 수
-
σ, μ: 해의 안정성 분석에 사용된 추가 샘플링 횟수의 표준편차와 평균
Ⅴ. 모형 검증 및 연구 결과
본 연구는 지역 단위 접근법을 적용하여 해당 지역을 실제로 통과한 궤적만을 활용해 교통량을 최적화하 였다. 이는 전국 모든 궤적과 링크를 단일 문제로 다룰 때 발생하는 메모리 부담과 연산 비효율을 줄이고, 불필요한 계산을 방지하기 위함이다. 전국 모든 궤적과 링크를 하나의 문제로 구성할 경우 행렬 규모가 지나 치게 커져 자원 소모가 과도해지며, 특정 지역(예: 서울) 교통량 추정에 해당 지역과 무관한 궤적(예: 부산 내 궤적)까지 포함되는 것은 불필요한 계산 낭비를 초래한다. 따라서 본 연구는 분석 단위를 ‘해당 지역을 실제 로 통과한 궤적’으로 한정하여 각 최적화 문제의 규모를 현실적으로 축소하였다.
이 장에서는 최적화 결과를 세 단계로 검증한다. 첫째, 지역별 결과를 통합하여 전국 규모에서 차종별·도 로 등급별 예측 정확도를 평가한다. 둘째, 지역 단위로 세분화하여 지역별 정확도를 검증한다. 셋째, 개별 링 크를 사례로 들어 상세 차종 구성비 산출 과정을 구체적으로 제시한다.
1. 모형 성능 평가 결과
1) 차종별 분석
전국 단위 차종별 예측 성능과 해의 안정성을 <Table 3>에 정리하였다. 모든 차종에서 ME가 음수로 나타 나, 모델이 교통량을 전반적으로 과소추정하는 경향을 보였다. 이는 궤적 정규화 항을 도입해 과도한 샘플링 을 억제하고 일반화 성능을 확보하는 과정에서 발생한 결과로 해석된다.
<Table 3>
Model Performance Results by Vehicle Type
| Vehicle Type | ME | MAE | MAPE | R2 | CV of Sampling Weights |
|---|---|---|---|---|---|
| Passenger Car | -218.19 | 640.71 | 9.98% | 0.99 | 1.26 |
| Passenger Bus | -26.61 | 51.69 | 23.07% | 0.95 | 1.91 |
| Truck | -298.46 | 401.33 | 25.47% | 0.93 | 0.98 |
| Total | -543.14 | 978.30 | 12.34% | 0.98 | X |
승용차는 R² 0.99, MAPE 9.98%로 가장 높은 정확도를 보였다. 승합차와 화물차는 각각 R² 0.95, 0.93으로 유사했으나, 안정성에서는 차이가 컸다. 화물차의 CV는 0.98로 안정적이었으나, 승합차는 1.91로 약 2배 높 아 일부 링크에서 가중치 조정이 과도하게 이루어졌음을 시사한다.
2) 도로 등급별 분석
도로 등급별 최적화 결과는 <Table 4>에 제시하였다. 모든 등급에서 ME가 음수로 나타나 과소추정 경향이 확인되었으며, 고속국도(101)의 -108.97에서 시군도(107)의 -942.67까지 등급이 낮을수록 과소추정이 심화되었 다. 이는 T-MAP 데이터의 샘플링 편향이 하위 도로망 표본의 대표성 저하로 이어졌기 때문이다. 결과적으로 최적화의 입력값인 링크 방문 빈도가 실제보다 과소 산정되어 과소추정 경향이 심화된 것으로 해석된다.
<Table 4>
Model Performance Results by Road Rank
| Road Rank | Road Class | ME | MAE | MAPE | R2 |
|---|---|---|---|---|---|
| 101 | National Expressway | -108.97 | 1119.58 | 5.68% | 0.99 |
| 102 | Urban Expressway | -286.25 | 2784.47 | 7.18% | 0.98 |
| 103 | General National Highway | -289.10 | 754.49 | 9.42% | 0.99 |
| 104 | (Special) Metropolitan City roads | -654.14 | 1092.92 | 8.40% | 0.97 |
| 105 | State-funded local highways | -409.68 | 796.44 | 13.19% | 0.98 |
| 106 | Local Highway | -517.31 | 744.58 | 17.49% | 0.97 |
| 107 | Si roads, Gun roads | -942.67 | 1158.62 | 16.43% | 0.95 |
| 108 | Expressway Ramp | -185.11 | 1664.32 | 21.46% | 0.93 |
| Total | Total | -543.14 | 978.30 | 12.34% | 0.98 |
오차 특성은 도로 유형별로 차이를 보였다. 도시고속도로(102)는 MAPE 7.18%로 낮았으나, 교통량이 많아 MAE가 2,784.47로 가장 크게 나타났다. 반대로 지방도(106), 시군도(107), 고속도로 램프(108)는 절대 교통량 은 적지만 변동성이 커 MAPE가 각각 17.49%, 16.43%, 21.46%로 높게 나타났다.
앞서 언급한 차종별 분석과 달리 도로 등급별 분석에서는 CV를 산출하지 않았다. 이는 추가 가중치(wi )가 특정 도로 위계에만 귀속되지 않고, 하나의 궤적이 고속국도·지방도·시군도 등 여러 등급에 동시에 매칭되기 때문이다. 따라서 특정 위계에 한정해 가중치의 평균과 표준편차를 계산하면 통계적 왜곡이 발생할 수 있어, 본 연구에서는 CV 분석을 제외하였다.
3) 지역별 분석
17개 광역지자체별 최적화 결과는 <Table 5>와 같다. 모든 지역에서 ME가 음수로 나타나 지역 단위에서 도 과소추정 경향이 일관되게 확인되었다.
<Table 5>
Model Performance Results by Region
| CityCode | Region | ME | MAE | MAPE | R2 | CV of Sampling Weights (Passenger Car) |
|---|---|---|---|---|---|---|
| 11 | Seoul | -693.70 | 1317.05 | 8.66% | 0.98 | 1.27 |
| 21 | Busan | -572.87 | 1134.86 | 7.01% | 0.97 | 1.43 |
| 22 | Deagu | -555.25 | 1105.20 | 8.03% | 0.98 | 1.02 |
| 23 | Incheon | -544.02 | 991.33 | 9.48% | 0.98 | 1.02 |
| 24 | Gwangju | -438.79 | 1126.31 | 6.31% | 0.98 | 1.40 |
| 25 | Daejeon | -525.00 | 1165.26 | 6.52% | 0.96 | 0.89 |
| 26 | Ulsan | -493.37 | 1067.63 | 9.43% | 0.97 | 1.15 |
| 29 | Sejong | -533.47 | 965.368 | 11.96% | 0.96 | 1.07 |
| 31 | Gyeonggi | -679.44 | 1188.50 | 12.66% | 0.98 | 1.18 |
| 32 | Gangwon | -347.91 | 568.15 | 16.25% | 0.97 | 1.36 |
| 33 | Chungbuk | -419.46 | 741.51 | 15.55% | 0.97 | 1.03 |
| 34 | Chungnam | -461.30 | 812.68 | 14.40% | 0.98 | 1.13 |
| 35 | Jeonbuk | -377.79 | 671.37 | 13.26% | 0.97 | 1.18 |
| 36 | Jeonnam | -392.99 | 685.29 | 14.03% | 0.96 | 0.98 |
| 37 | Gyeongbuk | -416.68 | 742.53 | 12.91% | 0.98 | 0.93 |
| 38 | Gyeongnam | -465.23 | 845.04 | 12.58% | 0.98 | 1.00 |
| 39 | Jeju | -389.55 | 645.16 | 12.73% | 0.97 | 1.02 |
| Total | Total | -543.14 | 978.30 | 12.34% | 0.98 | 0.90 |
지역별 차이는 절대 오차(MAE)와 상대 오차(MAPE)의 관계에서 뚜렷했다. 서울·부산 등 대도시는 MAE가 1,100 이상으로 절대 오차는 크지만, MAPE는 6~9%로 낮아 교통량 규모 대비 예측 정확도가 높았다.
예측 정확도와 안정성(CV)을 종합하면 대전이 가장 우수했다(MAPE 6.52%, CV 0.89). 반면 부산(MAPE 7.01%, CV 1.43)과 광주(MAPE 6.31%, CV 1.40)는 낮은 MAPE에도 불구하고 CV가 높아 안정성이 떨어졌다. 경북(MAPE 12.91%, CV 0.93)과 경남(MAPE 12.58%, CV 1.00)은 안정성은 확보했으나 정확도는 낮았으며, 강 원도는 MAPE(16.25%)와 CV(1.36)가 모두 높아 가장 저조한 성능을 보였다.
종합적으로, 광역시는 도 단위 지역에 비해 상대적으로 높은 예측 정확도를 보이는 경향이 나타났다.
2. 주요 링크의 세부 차종 구성비 예시
앞선 분석을 통해 제안 모형의 전반적인 성능을 검증하였으며, 이어서 실제 도로 링크에 적용하여 세부 차종 구성비를 산출한 결과를 제시한다.
본 모형의 적용 사례를 제시하기 위해 5개 지역에 대해 대표 분석 링크(서울의 ‘57164811201’, 경기의 ‘57166041401’, 울산의 ‘74371570802’, 세종의 ‘56330927201’, 제주의 ‘41561035702’)를 선정하였다. 대표 링크 는 승합차 교통량이 다른 차종에 비해 상대적으로 적은 특성을 고려하여, 각 지역에서 승합차의 목표 관측· 추정 교통량이 가장 높은 지점을 기준으로 결정하였다. <Table 6>은 이렇게 선정된 5개 대표 링크에 본 연구 의 방법론을 적용하여 산출한 최종 상세 차종·규모·유종별 교통량 구성비를 보여준다. 이 구성비는 국가 온 실가스 배출·흡수 계수 분류체계를 기준으로 하되, 실제 교통량 분석이라는 연구 목적에 맞게 전기차를 포함 하여 확장한 상세 차종·규모·유종 분류 기준에 따라 산출되었다.
<Table 6>
Detailed Traffic Composition by Vehicle Type, Fuel Type, and Size on Representative Links in Five Regions (Seoul, Gyeonggi, Ulsan, Sejong, and Jeju)
| Type | Size | Fuel | Seoul | Gyeonggi | Ulsan | Sejong | Jeju | |
|---|---|---|---|---|---|---|---|---|
| Passenger Car | Compact | Gasoline | 1.9% | 2.1% | 5.1% | 2.4% | 4.5% | |
| LPG | 0.1% | 0.1% | 0.2% | 0.1% | 0.2% | |||
| Small | Gasoline | 0.6% | 0.5% | 0.7% | 0.8% | 1.2% | ||
| Diesel | 0.1% | 0.1% | 0.0% | 0.1% | 0.1% | |||
| LPG | 0.0% | 0.0% | 0.0% | 0.0% | 0.0% | |||
| Medium | Gasoline | 25.1% | 25.3% | 27.3% | 24.7% | 22.0% | ||
| Diesel | 16.9% | 18.7% | 19.4% | 18.7% | 19.3% | |||
| LPG | 3.5% | 4.3% | 4.5% | 4.5% | 5.0% | |||
| HEV | 4.4% | 4.4% | 3.2% | 3.4% | 3.7% | |||
| Electric | 0.9% | 0.9% | 0.6% | 1.1% | 13.5% | |||
| Large | Gasoline | 18.1% | 13.4% | 15.5% | 13.9% | 9.0% | ||
| Diesel | 10.1% | 10.1% | 10.9% | 10.1% | 7.8% | |||
| LPG | 0.9% | 1.1% | 1.4% | 1.2% | 1.0% | |||
| HEV | 0.0% | 0.0% | 0.0% | 0.0% | 0.0% | |||
| Passenger Bus | Small | Diesel | 0.0% | 0.0% | 0.0% | 0.0% | 0.0% | |
| LPG | 0.3% | 0.2% | 0.2% | 0.1% | 0.5% | |||
| Medium | Diesel | 3.7% | 4.4% | 1.8% | 0.8% | 1.0% | ||
| Large | Express | Diesel | 0.3% | 0.8% | 0.5% | 0.6% | 0.3% | |
| CNG | 0.2% | 0.1% | 0.0% | 0.1% | 0.0% | |||
| City | CNG | 0.7% | 0.8% | 0.6% | 4.8% | 2.3% | ||
| Electric | 0.2% | 0.3% | 0.1% | 0.1% | 0.0% | |||
| Truck | Small | Diesel | 2.3% | 2.5% | 1.6% | 1.5% | 1.4% | |
| Electric | 0.2% | 0.2% | 0.1% | 0.1% | 0.4% | |||
| Medium | Diesel | 6.4% | 5.9% | 4.6% | 5.0% | 4.6% | ||
| Large | Diesel | 3.3% | 3.8% | 1.7% | 6.0% | 2.2% | ||
Ⅵ. 결 론
1. 결론 및 의의
본 연구는 집계 통계에 의존하는 기존 국내 온실가스 배출량 산정 체계의 한계를 보완하기 위해, T-MAP 및 DTG 궤적데이터를 최적화 기법과 결합하여 도로 링크 수준의 종·유종·규모별 교통량을 추정하였다.
모형 성능 검증 결과, 모든 분석 단위(차종, 도로 등급, 지역)에서 실제 교통량 대비 과소추정 경향이 일관 되게 나타났다. 이는 최적화 과정에서 과적합을 억제하고 해의 안정성을 확보하기 위해 도입한 규제항의 영 향으로 해석된다. 이러한 공통적 특성 속에서 차종별로는 승용차가 가장 높은 예측 정확도를 보였고, 도로 등급별로는 하위 도로망에서 과소추정 편향이 심화되었으며, 지역별로는 대도시권에서 절대 오차가, 비도시 지역에서는 상대 오차가 크게 나타나는 등 데이터 특성에 따른 차이가 확인되었다. 그러나 전반적으로 오차 수준은 지역별 (6%~16%), 도로등급별 (5%~21%)로 낮게 유지되어, 제안된 방법론이 다양한 분석 단위에서 준수한 성능과 실용성을 확보했음을 확인할 수 있었다.
본 연구의 의의는 실제 차량 궤적데이터와 최적화 기법을 결합해 링크 수준에서 차종·유종·규모별 교통 활동자료를 구축한 데 있다. 이는 COPERT, MOVES 등 국외 배출량 산정 모형이 요구하는 핵심 입력자료와 직접적으로 대응될 수 있으며, 향후 국내 배출량 산정체계의 정밀도를 제고하고 교통·환경정책 효과 검증을 뒷받침할 수 있는 실증적 기반을 제공한다.
2. 한계점 및 향후 연구방향
본 연구는 국내 데이터 환경에 적합한 상세 교통량 산출 방법론을 제시했으나, 몇 가지 한계가 존재한다. 첫째, 산출된 차종·유종·규모별 교통량에 대한 실측 검증자료가 부재하여 결과의 정확성을 직접적으로 검증 하기 어렵다. 둘째, 전반적으로 교통량 과소추정 편향이 관찰되었으며, 이는 최적화 과정의 궤적 정규화 항 도입과 관련이 있다. 셋째, T-MAP 궤적데이터 자체의 품질 문제 가능성이 존재하며, 원천 데이터 오류는 최 종 산출물 정확도에 직접적인 영향을 미친다. 넷째, 지역별 차량 구성 및 운행 특성을 반영하기 위해 차량 등록지를 자동차주행거리 통계의 기준점으로 활용하였으나, 실제 운행 출발지가 등록지와 항상 일치하지 않 는다는 점에서 실제 차량 구성 및 운행 패턴과 괴리가 발생할 수 있다.
이러한 한계를 보완하기 위한 향후 연구 방향은 다음과 같다. 첫째, 샘플링 기반 접근법의 한계를 극복하 기 위해 생성형 AI 모델을 도입할 필요가 있다. 현재 방법론은 관측 궤적이 없는 신설 도로에는 교통량을 할 당할 수 없으나, 생성형 AI를 활용해 시공간 교통 패턴을 학습하고 실제와 유사한 가상 궤적(synthetic trajectory)을 생성한다면 신설 도로를 포함한 전체 네트워크 교통량 추정이 가능해질 것이다. 둘째, 과소추정 편향을 완화하기 위해 보다 강건한 목적함수를 설계할 필요가 있다. 본 연구에서 확인된 편향은 현행 목적함 수의 개선 여지가 있음을 시사한다. 실제값과 추정값 간 오차뿐 아니라 전반적 분포 차이를 최소화하는 방향 으로 목적함수를 정교화하면, 보다 현실성을 높인 교통량 추정이 가능할 것이다.


