Ⅰ. 서 론
1. 개요
도시 내 도로 네트워크에서 발생하는 자유 흐름(free flow), 교통 혼잡(traffic congestion)과 같은 교통현상을 이론적으로 해석하기 위한 수학적 모델들이 제시되어왔다. 대표적으로 교통량(flow)과 평균 속도(mean speed), 차량 밀도(density) 지표를 활용하여 도로 용량(road capacity), 주행 시간과 속도 관계, 추월 빈도(frequency of overtaking), 대기열(queue) 생성 등에 대한 분석을 수행하거나(Wardrop, 1952), 교통 흐름의 변화에 대한 시공 간 분석(e.g. shock wave)과 같은 수학적 모델들이 있으며(Richards, 1956), 이는 현재까지도 수많은 교통공학 연구의 기초 모델로 꾸준히 응용되거나 발전되고 있다. 대표적으로, flow-density diagram은 교통환경에 따른 차량의 거시적인 속도행태를 기술하는 수학적 모델이다. flow-density diagram은 교통환경 내 차량 간의 이질 성(heterogeneity)이 존재유무에 따라 이상적인 모형(fundamental diagram)과 경험적 모형(flow-density diagram) 으로 나누어진다(Treiber and Kesting, 2013). 지능형 교통 시스템(intelligent transportation system, ITS)의 등장으 로 인해 교통 데이터의 수집이 가능해짐에 따라 네트워크에서 발생하는 교통현상을 분석하고자 경험적 교통 류 모형(flow-density diagram)에 대한 연구들이 꾸준히 진행되고 있다(Boamah, 2010;Cassidy et al., 2011;Clairais et al., 2016;Kerner and Lieu, 2005;Shim et al., 2019;Xu, 2016).
기존 교통류 연구에서는 복잡한 교통현상들을 분석하기 위해 루프 검지기(loop detector)와 같은 교통관리 시스템(traffic management system)에서 수집된 대규모 교통정보로부터 교통류 모형을 추정해왔다 (Kerner and Lieu, 2005, Boamah, 2010). 더 나아가 최근에는 개별 차량(probe vehicle)에서 수집한 주행 궤적(trajectory) 데 이터를 활용하여 단일 링크에서의 교통류 모형을 추정하거나, 기존 루프 검지기(loop detector) 데이터와 연계 하여 모형을 보정하는 연구들도 진행되어왔다 (Anuar et al., 2015;Clairais et al., 2016;Seo et al., 2019). 단일 링크에 대한 교통류 모형뿐만 아니라 근거리 전용 통신(Dedicated Short Range Communication)과 같은 V2I 데 이터를 활용하여 교통 네트워크 전체에 대한 거시 교통류 모형을 추정하는 연구들도 등장하였다 (Xu, 2016;Shim et al., 2017;Shim et al., 2019).
flow-density diagram에서 차량 밀도는 본래 공간적 범위 내에서 표현되는 물리량으로 항공사진으로 네트워 크를 포착한 순간의 밀도로 정의된다. Treiber and Kesting(2013)에 따르면, loop detector 데이터로 flow-density diagram을 구하는 과정에서 차량 밀도를 단위시간 교통량, 평균속도 그리고 차두시간과 차량속도의 공분산으 로 구하고 있으며, 교통 혼잡이 많은 상황일수록 공분산 영향이 커져 실제 차량 밀도의 추정이 어려워진다. 그러나 도로 네트워크 내 차량의 차두시간을 알고 있을 경우, 공간적 범위 내 물리량으로 차량 밀도를 추정 하는 것이 가능해진다. 이에 따라 본 연구에서는 기존 연구들에서 활용되지 않았던 개별 차량의 차두 시간 (time headway) 데이터를 기반으로 ‘경험적 교통류 모형(empirical flow-density diagram, EFD)’을 도출하는 방법 론을 제안하고자 한다. 또한, 연구에서 제시된 교통류 모형 방법론은 지능형 교통 인프라에서 수집되는 차량 검지기 기반의 대규모 교통 데이터를 활용한 교통류 모형과의 비교를 통해 검증 평가 및 분석을 수행한다. 해당 연구를 수행하기 위해 실험 차량의 운행 지역과 대규모 교통 데이터 수집이 가능한 지역을 고려하여 대구광역시 외곽에 위치한 경부고속도로(장기교~금호2교, 12km)를 연구의 공간적 범위로 설정하였다. 본 논 문의 2장에서는 각 데이터의 전처리 및 분석 과정을 설명하고, 3장에서 데이터 수집방식에 따른 교통류 모형 (Flow-density Diagram)의 추정 방법론 및 검증 결과를 제시한다. 마지막 4장에서는 본 연구를 통해 도출된 결 과 및 추정 모형의 오차 개선을 위한 방법론에 대해 논의한다.
Ⅱ. 개별 차량 데이터 수집·처리 및 분석 데이터 가공
1. 데이터 개요
본 연구에서 활용하는 데이터는 2020년 10월부터 2021년 6월까지 대구광역시에서 운영 중인 약 300여 대 의 택시 운행기록 데이터와 대구광역시 첨단교통관리시스템(Advanced Traffic Management System, ATMS)에 서 수집된 데이터를 기반으로 한다. 택시 운행기록 데이터는 사전에 설치된 차량용 비전 센서로부터 취득된 수집 시각, 차량 속도, 차두 시간 등의 자료들을 통신을 거쳐 서버에 저장하는 방식으로 수집되었다. 연구에 사용된 차량용 비전 센서는 2009년 출시된 모빌아이 2.7 버전으로 원본 데이터는 16진법 형태로 저장되어 있 으며, 전체기간에 해당하는 데이터는 압축된 파일 형태로 총 685,593건 확보되었으며, 전체 용량은 142.8 GB 이고 저장 항목은 <Table 1>에 명시된 바와 같다.
한편 고속도로 공공데이터 포털에서는 고속도로에 설치된 VDS(Vehicle Detection System)에서 수집된 5분 간격 차량 평균 속도와 교통량 정보들을 제공하고 있으며, 본 연구에서는 차량용 비전센서 기반의 운행기록 데이터 기간에 상응하는 기간(2020. 10 ~ 2021. 06)에 대한 VDS 데이터를 확보하였다. VDS에서 수집된 교통 데이터는 1차 가공을 거쳐 연구자에게 제공되고 있으며, 데이터 목록은 집계 일자(연/월/일), 집계 시간, VDS_ID, 지점 이정, 콘존 ID, 차로유형 구분코드, 교통량/평균 속도를 포함하고 있다. 저장 데이터는 총 278 일에 해당하는 월 단위로 가공된 5분 간격 교통량/평균 속도 데이터들이며, 총 53.4 GB의 저장공간을 차지하 고 있다. 선정된 연구 영역 내의 운행기록 데이터와 VDS 데이터를 추출하기 위해 국가교통정보센터에서 제 공하는 표준노드링크를 활용한 맵 매칭 기법 기반의 데이터 전처리 과정이 수행되었다.
2. 데이터 전처리
1) 운행기록 데이터 병합 및 파싱
택시 운행기록 데이터 내 GPS 정보를 제외한 나머지 비전 센서의 데이터들은 <Fig. 1>와 같이 16진법 형 태의 데이터로 수집되고 있다. 해당 데이터는 11 bit의 헤더 포맷을 기준으로 CAN 메시지를 전송하는 구조 이며, 전송된 CAN 메시지는 정의된 헤더 코드에 따라 데이터 종류가 분류되며, <Table 1>의 포맷으로 차량 마다 운행 시작 시점부터 종료 시점까지의 운행기록 데이터가 생성된다. 본 연구에서는 python 프로그래밍 언어 기반으로 약 70만 건에 해당하는 주행 데이터의 전처리와 분석 데이터 생성에 대한 일련의 과정들을 수행하였다. 전처리 초기 단계에서는 각 차량 ID에 대해서 모든 운행기록 데이터들을 하나로 병합한 후, 모 빌아이 CAN 프로토콜 자료를 기반으로 <Fig. 2>와 같이 데이터 해석 및 파싱 작업을 수행하였다.
2) 차량 운행기록과 표준 노드 링크의 맵 매칭 기법
대구 경부고속도로에서 주행한 운행기록 데이터를 추출하기 위해 GPS 정보와 표준노드링크의 맵 매칭 알 고리즘을 활용하였다. 대상 환경에 존재하는 표준노드링크 ID를 기준으로 운행기록 데이터를 확보하고자 하 였으며, 해당 과정을 위해서 운행기록 데이터에 표준노드링크 ID의 맵 매칭 작업이 선행된다. 연구에서 활용 된 표준노드링크는 ITS 국가교통정보센터에서 주기적으로 갱신 및 공개되고 있으며, 도로 등급을 시작으로 링크 ID, 노드 ID, 링크 길이, 차선 수 등 도로의 교통 관련 속성 정보들을 제공하고 있다. 해당 연구에서는 2021년 2월에 제공된 데이터를 활용하였다.
실험 차량에서 수집된 대용량 운행기록 데이터의 전처리 효율을 높이기 위해, <Fig. 3>에서 보이는 바와 같이 먼저 대구광역시 부근의 경부고속도로(장기교~금호2교, 12km) 구간에 존재하는 노드 간의 거리를 반지 름으로 하는 가상의 원을 생성하였다. <Fig. 4>에서는 생성된 영역에서 벗어나는 GPS 운행기록들은 필터링 수행 결과 예시를 보여주고 있으며, 해당 과정 이후에 연구환경에 해당하는 장기교에서 금호2교 방향, 금호2 교에서 장기교 방향으로 진행된 운행기록들을 추출하기 위한 맵 매칭 작업을 수행하였다. 맵 매칭을 수행하 기 위해, 본 연구에서는 i) 표준 노드의 연결성, ii) 데이터 간의 주행 시간 간격 두 가지 조건을 활용하였다. 사전에 수집한 표준노드링크 파일에서 QGIS 및 ArcGIS 지리정보시스템 프로그램을 활용하여 대구광역시 부 근의 경부고속도로 표준노드링크 ID 정보만을 포함하는 shp 파일을 생성하였다. 해당 shp 파일 내 벡터 형태 의 표준노드링크 ID와 차량의 GPS 정보를 결합하는 과정에서 거리 기반 맵 매칭 알고리즘을 사용할 경우, GPS의 오차에 따라서 매칭된 결과의 고속도로 내 진행 방향 오류가 발생할 수 있다.
따라서 본 연구에서는 기존 맵 매칭 기법의 문제를 해결하고자 표준노드링크 연결성 논리 기반의 맵 매칭 알고리즘을 개발하여 전처리를 수행하였다. 먼저, 국토지리정보원에서 제공하는 수치표고모델(DEM)의 레스 터파일을 벡터맵으로 변환 후, 생성해둔 경부고속도로 shp 파일과 공간결합(spatial join)을 수행한다. 결합이 될 수 없는 파일을 제거하면, <Fig. 5>에 나타난 바와 같이 대구·경부고속도로의 표준노드링크 ID 정보를 포 함하는 영역이 생성된다. <Fig. 5>에서 추출된 영역과 운행기록 데이터의 공간결합(Spatial join)을 수행하면 위치에 따른 표준노드링크 ID가 부여된 GPS 운행기록이 출력된다. 해당 결과에서 데이터를 시간순으로 정 렬 후, 고속도로 영역 상에 존재하는 노드와 링크의 연결 정보를 활용하여 각 GPS 위치에 대해 유효한 링크 ID를 부여한다. 최종적으로, <Fig. 6>에서 보이는 바와 같이 경부고속도로 상의 링크 ID가 부여된 GPS 주행 기록 결과 데이터를 얻게 된다.
3) VDS ID와 표준노드링크 ID의 맵핑 테이블 생성
전처리 마지막 단계로, 한국도로공사(Korea Expressway Corporation)에서 운영하는 VDS 수집체계로부터 집 계주기 5분 단위의 지점 평균속도와 지점 교통량 정보들을 표준노드링크 ID 기준으로 변환이 필요하다. <Table 2>은 VDS 지점 교통량과 지점 평균속도 데이터의 자료구조를 제시하고 있다. 해당 데이터는 표준노 드링크 ID나 GPS 좌표가 아닌 각 VDS의 ID와 지점 이정(Post-kilometer)을 기준으로 교통정보를 제공하고 있 어, 표준노드링크 ID과의 맵핑 혹은 GIS 공간상에서 위치에 따른 결합에 한계가 있다. 본 과정에서는 VDS 데이터와 표준노드링크 ID 맵핑을 위해 다음과 같이 i) 좌표계 기반 VDS 위치 정보수집, ii) VDS 위치 정보 와 표준노드링크 ID 정보의 공간 결합, iii) VDS ID와 표준노드링크 ID 맵핑 테이블 작성 과정을 수행하였다.
먼저, 한국도로공사에서 제공하는 VDS 설치정보 조회 서비스 API로부터 실험영역에 설치된 VDS ID별 GRS80 좌표계 기반의 VDS 위치정보를 획득하였다. QGIS 상에서 <Fig. 5>의 표준 노드 링크 파일과 VDS 위 치정보의 공간 결합을 수행하여 <Fig. 7>의 결과를 얻게 된다. <Fig. 7>로부터 생성된 VDS ID와 표준노드링 크 ID 맵핑 테이블에서 <Table 3>을 취득한다. <Table 3>에서 VDS ID는 동일한 지점 이정에서 기점 방향에 따라 VDS와 VDE 두 가지로 분류되고 있으며, 방향에 따라 표준노드링크 ID 정보를 맵핑한다. 해당 테이블 을 이용해서 연구 대상 지역의 표준노드링크 ID를 기준으로 교통류 모형에 대한 비교·분석을 수행하였다.
Ⅲ. 데이터 수집방식에 따른 교통류 모형(Fundamental Diagram) 추정 및 분석
1. 교통류 모형 추정 개요
단일 링크 내 교통류 모형은 차량 밀도에 대한 단위 시간 교통량으로 정의된다. 본 연구에서는 동일 도로 영역에서 다른 측정 경로를 통해 얻은 교통 변수 데이터들을 활용하여 교통류 모형을 도출한 후, 각 결과를 비교하여 분석을 수행한다. 차량 밀도에 대한 교통류 모형은 도로 네트워크에서 단위시간의 교통량과 평균 속도 파라미터를 기반으로 제시되는데, 아래 식 (1)과 같이 차량 밀도(ρ)는 단위시간 교통량(Q )을 공간상에 서의 차량 평균속도(Vs )로 나눈 값으로 정의된다. 그러나, 공간상의 차량 평균속도(Vs )를 측정 및 수집하는 것은 어렵기때문에, 아래 식 (2)를 통해서 시간상에서의 차량 평균속도(Vt )와 단위시간 교통량(Q )으로 차량 밀도를 산출한다(Wardrop, 1952). 이때, 단위시간 교통량(Q )은 집계 주기 Δt 동안 집계된 차량 대수 ΔN 를 집계 주기 시간으로 나눈 값이다(식 (3)). 차량 평균속도(Vt )는 집계 주기 Δt 동안 집계된 개별 차량 속도 υk 의 합을 집계 차량 대수 ΔN 로 나눈 평균값으로 구해진다(식 (4)).
한국도로공사에서는 <Fig. 8(a)>에서 제시된 바와 같이, VDS를 통해 5분 단위 교통량 데이터와 평균속도 에 대한 정보를 제공하고 있으나, 식 (2)에서 차량 밀도 계산에 필요한 차량 k의 차두 시간(time headway, hk )과 차량 속도(υk )에 대한 공분산 에 대한 데이터는 전무하다. 그러나, 자유류(free flow) 환경 에서 모든 운전자가 주행속도를 임의로 결정할 수 있어, 차두 시간과 차량 속도의 공분산은 0에 수렴하게 된 다(Treiber and Kesting, 2013). 따라서, 자유류(free flow) 환경이 상대적으로 오랜 기간 지속되는 고속도로 구 간에서의 교통류 모형은 VDS에서 수집된 데이터로 식 (2)를 활용하여 실제 차량 밀도 추정이 가능하다.
2. Loop detection data-based Flow-density Diagram 도출 방법
식 (2)를 활용하여 VDS i의 5분 단위 교통량(number of vehicles, ni )과 평균속도(arithmetic mean speed, Vt,i ) 정보를 기반으로 지점별 교통류 모형을 생성할 수 있다. 수집된 데이터 기간 내 VDS i의 단위시간 교 통량 Qi (veh/hr)은 VDS i로부터 측정된 차량 대수 ni 를 Tυds (VDS 집계 주기)로 나눈 값이며(식 (5)), 차량 밀도 ρi는 계산된 교통량 Qi 에서 평균속도 Vt,i (VDS i의 Tυds 분 단위 평균속도)를 나눈 값이다(식 (6)). 그 결과, <Fig. 9>에서 보이는 바와 같이 각 VDS ID 별 교통류 모형들을 얻었으며, 개별 차량 데이터 기반의 교 통류 모형 결과와 비교·분석을 위한 기준으로 사용되었다.
3. 개별 차량 데이터 기반 Empirical Flow-density Diagram 추정 방법
본 연구에서는 <Fig. 8(b)>에서 보이는 바와 같이, 실험 차량들은 차량 내 설치된 비전 센서 기반으로 차량 의 차두시간(time headway)를 포함한 주행기록을 수집하였다. 대상 차량들은 실험 기간 내 어떠한 실험 조건 이나 제약 없이 주행 데이터를 수집하였으며, 본 연구에서 활용한 데이터는 전체 차량 300여 대에서 실험 기 간 내 VDS가 설치된 대구·경부고속도로(장기교~금호2교, 12km) 내 표준 노드 링크 영역(i, link index)의 주 행 이력이 존재하는 127대로부터 약 150만 건의 데이터들을 획득하였다.
기존의 교통류 이론에 따르면, 개별 차량 데이터로부터 단위시간 교통량( Qi )은 집계 주기 내 링크 내 존재 하는 차량의 평균 차두 시간(hi)의 역수(식 (9))로 구할 수 있으며, 차량 밀도는 평균 차두 거리(di )의 역수(식 (10))로 계산할 수 있다(Edie, 1965). 개별 차량의 차두시간 데이터를 활용할 경우, VDS 데이터와는 달리 공간 상에서의 차량 밀도를 직접적으로 산출가능하다. 따라서, 본 연구에서는 수집된 차두시간 데이터를 식 (9)와 식 (10)에 적용하여 경험적 교통류 모형(Empirical Flow-density diagram)을 제시하고자 한다.
개별 차량에서 수집되는 차두시간 데이터는 비전센서 기반으로 센서 차량의 전면과 선두 차량의 후면의 거리를 현재 속도로 나누어 구해진다. 앞차와의 거리를 최대 9.9초 범위에서 인지할 수 있으며, 2.5초 내에서 는 차두시간을 산출하게 된다. 앞차의 인지는 <Table 1>의 Headway valid 변수를 통해 표출되며, 산출된 차두 시간은 Headway measurement에서 표출되어진다. 본 연구에서는 자유류 환경에서 인지범위를 벗어나는 데이 터는 10초의 차두시간으로 설정하였고, 인지는 했으나 차두시간이 표출이 되지 않는 경우는 인지 범위의 중 간값인 6초로 설정하였다. 교통공학에서 차두 시간(Δtα )은 <Fig. 10>와 같이 차량의 전면 사이 간격을 기준 으로 정의하고 있으며, 연구에서 수집된 차두 시간(Tα )과는 차이가 있다. 그러므로 식 (10)을 활용하여 수집 된 차두시간 데이터에 차량 길이(lα )를 차량 속도(υα )로 나눈 값을 더하여 기존 정의에 맞게 차두시간을 보 정하였다(Treiber and Kesting, 2013). 이 때, 보정값은 4~5인승 택시 규격에 해당하는 4.5에서 5m 이내로 랜덤 생성된 차량 길이와 실제 차량의 속도를 활용하여 산출되었다.
보정된 차두 시간이 반영된 전체 차량 데이터에서 공휴일을 제외한 주중 데이터만을 추출하고 시간 순서 로 정렬하였다. 그 후, 주행 시간에 대해서 24~03, 03~06, ..., 21~24 총 8 구간의 주행 시간대를 나누어 각 데 이터마다 색인을 생성하였다. 맵핑된 표준노드링크의 ID(i)별로 flow-density diagram을 산출하기 위해 주행 시간대별(τ)로 데이터 분할 후, 동일 시간대에서 3시간 이내 주행 이력이 존재하는 차량의 데이터들끼리 그 룹화하여 단위시간 교통량()와 차량 밀도()를 추정하였다. 식 (12)는 식 (9)에서 주행 시간대(τ)가 추가된 형태이며, 시간 단위의 교통량을 산출하게 된다. 식 (13)은 식 (10)에서 주행 시간대(τ)가 추가된 형태이며, km 단위의 차량 밀도를 산출하게 된다. 상기 식에서 동 시간대 프로브 차량의 주행 이력이 많을수록 단위시 간 교통량과 차량 밀도의 추정값은 참값에 가까워진다. 상기 식을 활용한 결과 <Fig. 11>에서 보이는 바와 같이 표준노드링크 ID 별 교통류 모형들을 도출할 수 있다.
4. 데이터별 교통류 모형 비교 및 분석
기존 교통류 이론을 기반으로 산출된 프로브 차량 데이터 기반의 교통류 모형과 VDS 수집 데이터 기반의 교통류 모형의 비교 및 분석을 수행하였다. 대구·경부고속도로에 존재하는 표준 노드 링크 중에 VDS가 설치 된 링크에 대해서만 추정 모형 비교를 수행하였으며, 하나의 링크에 여러 개의 VDS가 설치된 경우는 VDS에 서 수집된 데이터들을 합해서 산출된 교통류 모형으로 대신하였다. 대구·경부고속도로(장기교~금호2교, 12km) 영역의 상행선과 하행선 링크 2개씩 선정하여 교통류 모형을 비교하였다. <Fig. 12>에서 제시된 바와 같이 VDS 데이터에서 도출된 flow-density diagram과 차량의 차두 시간 데이터에서 도출된 flow-density diagram은 다소 차이가 나타나고 있다. 제시된 flow-density diagram 비교 결과에서는 차량 밀도(0~20 veh/km) 와 단위시간 교통량(0~2000 veh/hr)이 적은 자유 흐름 구간에 대해서는 LFD 모형과 동일하게 추정되나, 차량 밀도가 20 veh/km를 초과하게 될 경우, 단위시간 교통량에 대한 분산이 증가하는 것을 볼 수 있다.
기존 교통류 모형에 따르면 단위시간 교통량(flow)는 평균 차두 시간(average time headway)의 역수이고, 차 량 밀도(density)는 평균 차두 거리(average distance headway)의 역수로 나타나고 있다. 차두 시간 데이터 기반 의 교통류 모형이 교통 밀도가 20 veh/km를 넘어서는 범위에서 차이가 나타나는 것을 분석하고자, 차두 시간 과 차두 거리에 대한 분포를 비교하였다. 기존의 차두 시간 분포 관련 문헌(Zhang et al., 2007;Ha et al., 2012;Li and Chen, 2017;Zhang and Wang, 2014;Dong et al., 2015)에 따르면, 고속도로 환경에서의 전체 차량 에 대한 차두 시간 분포(time headway distribution)는 지수 분포, Gamma 분포, Log-normal 분포, Poisson 분포 등으로 제시되어 왔고, 그 형태는 <Fig. 13>에 제시된 VDS의 차두 시간 분포와 동일하게 나타나고 있다. 반 면, 프로브 차량으로 수집된 차두 시간 분포는 기존의 분포와 다소 다른 형태를 가지고 있는데, 이는 제한된 차두 시간의 수집 범위와 더불어 대부분 자유류 환경에서 주행하였기 때문에 차두 시간이 긴 영역에서 분포 가 가장 크게 나타나고 있다. 상기 분석을 통해 연구에서 수집된 차두 시간 정보에서는 교통 혼잡상황에서의 데이터가 매우 적었음을 알 수 있다. 그리고 이는 단위시간 교통량(flow)은 산출하는 과정에서 상당 오차의 원인이 되고 있다. <Fig. 14>에서는 차두 거리 분포를 제시하고 있으며, 프로브 차량의 차두 거리 분포 역시 지수분포 형태와는 다른 분포를 가지는 것을 확인할 수 있다. 이에 따라, 차량 밀도 역시 VDS 데이터의 값 과 오차가 발생하는 원인으로 작용하고 있다.
차두 시간과 차두 거리에 대한 분포 외에도 수집된 데이터양에 따라서 VDS 기반 교통류 모형과의 오차가 달라지고 있다. 차두 시간 기반의 교통류 모형은 VDS 기반 교통류 모형에 비해 산포도가 넓게 표출되고 있 으며, 이는 단위시간 교통량와 차량 밀도에 대한 표준편차 분석을 통해 오차 정도를 비교할 수 있다. <Table 4>에서 제시된 바와 같이, flow-density diagram 도출에 사용된 전체 데이터양이 상대적으로 적은 경우 추정 변수에 대한 편차가 VDS 데이터의 동일 변수 편차에서 크게 벗어나는 것을 볼 수 있다. 반면, 데이터양이 증가함에 따라 VDS 데이터로 추출한 차량 밀도와 단위시간 교통량의 표준편차에 가까워지는 경향을 볼 수 있다. 해당 경향으로부터 데이터 샘플 수가 교통류 모형의 추정 오차 개선에 기여하고 있음을 알 수 있다.
위의 분석으로부터 프로브 차량의 차두 시간(time headway) 데이터 기반 교통류 모형 도출 및 추정 오차를 개선하기 위해서는 크게 두 가지 조건이 존재한다. 첫 번째 조건은 프로브 차량의 전체 샘플 수 증가이다. 도로 네트워크 내 존재하는 차량 대수가 증가할수록 프로브 차량의 차두 시간과 차두 거리 데이터는 전체 차량에 대한 평균을 대표하기 어려우며, 그에 따라 단위시간 교통량(flow)와 차량 밀도에 대한 추정 오차가 발생하게 된다. 또한, <Table 4>에서 제시된 바와 같이 상대적으로 데이터양이 많을수록 단위시간 교통량 (flow)와 차량 밀도(density)의 표준편차가 정상범위 내에 들어오는 것을 볼 수 있다. 위의 두 사실을 통해, 프 로브 차량의 전체 샘플 수를 늘리게 되면 차두 시간 기반 교통류 모형의 오차를 개선할 수 있다.
두 번째 요인으로는 프로브 차량의 다원화이다. 본 논문에서는 택시에서 수집된 데이터를 기반으로 교통 류 모형 연구가 진행되었다. 택시 차량의 주행 경로 선택 기준은 주행시간에 반비례하며(Zhu and Ye, 2018), 장거리 운행에 대해서 우회로나 교통 혼잡을 피하고자 고속도로를 선택하는 경향이 있다(Deng et al., 2020). <Fig. 13>, <Fig. 14>에서 제시된 바와 같이 택시 데이터는 대부분 고속도로 내 자유류 환경에서 주행 이력이 존재하는 것을 확인할 수 있으며, 이는 프로브 차량으로부터 교통 혼잡 상태의 고속도로 주행 데이터가 적어 차량 밀도가 높은 구간의 교통류 모형 도출 및 정확도가 낮아지는 한계를 가지고 있다. 특히, 차량 밀도는 식 (2)에서 고찰한 바와 같이 차량 속도와 차두 시간에 대한 공분산( )의 영향을 받고 있다. 속도 와 차두 시간의 공분산은 자유류 환경에서는 0에 수렴하기 때문에, 시간상에서의 차량 평균속도(Vt )로도 실 제 차량 밀도에 가깝게 추정할 수 있으나, 교통 혼잡상황에서 공분산을 고려하지 않으면 실제 밀도보다 작게 추정하는 한계를 가지고 있다(Treiber and Kesting, 2013). 따라서, 자유류 환경에 편향된 차두 시간 데이터로 는 교통 혼잡에 대한 flow-density 모형 도출에 한계가 존재하며, 택시 이외에 다양한 차종 데이터 확보를 통 해 특정 주행환경에 대한 편향성을 줄여야 한다. 이를 통해, 본문에서 활용한 평균 차두거리를 활용한 차량 밀도 추정 대신 링크에 존재하는 차량 속도와 차두 시간의 공분산을 추정하여 식 (2)를 통해 교통류 모형의 정확도를 개선할 수 있다.
Ⅳ. 결 론
본 연구에서는 다수 차량의 차두 시간 데이터를 이용하여 대구광역시 외곽의 경부고속도로에서 차량 밀 도에 대한 교통류 모형을 추정하는 방법론에 대해 분석 및 검증을 수행하였다. 실험영역 내 주행 데이터 추 출을 위해 16진법 차량 데이터의 파싱부터 표준 노드 링크의 맵 매칭 등 데이터 전처리 방법을 제시하였고, 전처리 결과로부터 단일 링크 내 개별 차량 데이터로부터 교통량과 밀도(EFD)를 추정하는 방법론에 대해 연 구하였다. 본 연구에서 제시한 방법론을 검증하기 위해 실험대상이 되는 경부고속도로 영역에 설치된 VDS 교통량 및 평균속도 데이터를 수집하고, 기존 교통류 모형에 대한 정의에 따라 교통류 모형을 도출하였다. 이때, 표준 노드 링크 ID와 VDS ID 매핑을 통해 링크 ID 단위의 교통류 모형을 구하였으며, 해당 결과로부 터 개별 차량 기반의 교통류 모형 검증 및 분석을 실시하였다.
기존의 단일 링크 내 교통류 모형은 차량 밀도에 대한 단위시간 교통량으로 산출되며, 차량 밀도는 교통 량에서 공간상에서의 평균속도를 나눈 물리량으로 정의되어 있다. 실제 환경에서는 공간상 평균속도 혹은 차량 밀도의 측정이 어렵기 때문에 측정된 단위시간 교통량에서 시간상의 차량 평균속도를 나누어 차량 밀 도를 산출하게 된다. 반면, 기존 교통류 모델에 따르면 개별 차량의 차두 시간 정보로부터 공간상 차량 밀도 의 추정이 가능하여, 단위시간 교통량에 대한 속도 데이터의 연산없이 교통류 모형(flow-density diagram)을 직접적으로 도출할 수 있다. 본 연구에서는 차량의 차두 시간 정보를 활용해 교통류 모형을 도출 및 VDS 데 이터 기반의 교통류 모형과 비교·분석을 수행하였다.
대구·경부고속도로의 상행선 2곳, 하행선 2곳에 대해 프로브 차량 데이터 기반의 교통류 추정 모형을 분 석 결과는 다음과 같다; 1) 차량 밀도(0~20 veh/km)와 단위시간 교통량(0~2000 veh/hr)이 적은 자유 흐름 구간 에 대해서는 LFD 모형과 동일 추정, 2) 차량 밀도가 20 veh/km를 초과할 경우, 추정 단위시간 교통량(flow)의 분산 증가. 추정 단위시간 교통량(flow)의 분산 증가에 대한 요인은 크게 두 가지로, 차량 밀도 추정에 대한 차량 속도와 차두 시간에 대한 공분산( )의 영향과 샘플 차량의 특성에 기인한 주행 환경 영향이 존재하고 있다. 추정 교통량의 분산 증가에 따른 오차를 줄이기 위해서는 링크 내 존재하는 차량 데이터 샘 플률 증가와 다양한 차종의 확보가 필요하다.
본 연구에서 제시된 방법론에서 시사하는 바는 크게 두 가지이다. 첫 번째는 국내의 공공 인프라 데이터 를 활용한 교통류 모형 추정 외에도 차두시간 데이터를 활용한 교통류 모형 추정 가능성을 제시한다는 점과 두 번째는 차두시간 기반 교통류 모형(Empirical flow-density diagram)의 추정 오차 개선에 대한 분석 및 방안 을 제시한다는 점이다. 향후 연구에서는 차량 밀도 높은 구간에서의 교통류 모형 오차를 개선하기 위한 방안 으로 개별 차량 속도와 차두 시간 데이터를 활용한 전체 평균속도(Vt )와 공분산( )의 추정 및 적 용 모델 연구나 시간대에 따른 링크의 전체 평균 차두 시간(hl) 추정을 위한 차두 시간 분포 모델 연구를 진 행하고자 한다.