Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.22 No.6 pp.141-156
DOI : https://doi.org/10.12815/kits.2023.22.6.141

A Study on the Visiting Areas Classification of Cargo Vehicles Using Dynamic Clustering Method

Bum Chul Cho*, Eun A Cho**
*Senior Research Fellow, Dept. of Transport Big Data, The Korea Transport Institute
**Researcher, Dept. of Transport Big Data, The Korea Transport Institute
Corresponding author : Eun A Cho, choea123@koti.re.kr
20 November 2023 │ 28 November 2023 │ 15 December 2023

Abstract


This study aims to improve understanding of freight movement, crucial for logistics facility investment and policy making. It addresses the limitations of traditional freight truck traffic data, aggregated only at city and county levels, by developing a new methodology. This method uses trip chain data for more detailed, facility-level analysis of freight truck movements. It employs DTG (Digital Tachograph) data to identify individual truck visit locations and creates H3 system-based polygons to represent these visits spatially. The study also involves an algorithm to dynamically determine the optimal spatial resolution of these polygons. Tested nationally, the approach resulted in polygons with 81.26% spatial fit and 14.8% error rate, offering insights into freight characteristics and enabling clustering based on traffic chain characteristics of freight trucks and visited facility types.



화물차량의 방문시설 공간설정 방법론 연구

조 범 철*, 조 은 아**
*주저자 : 한국교통연구원 교통빅데이터연구본부 선임연구위원
**교신저자 : 한국교통연구원 교통빅데이터연구본부 연구원

초록


화물의 흐름은 물류시설 투자 및 물류관련 정책 수립에 필요한 핵심적인 기초자료이다. 국 가승인통계인 화물자동차의 기종점 통행량은 분석의 공간적 해상도가 시군구 단위로 집계되 고 있다. 이는 물류시설 방문 및 이용에 관한 상세한 정보로 활용하는데 한계가 있다. 본 연구 에서는 화물차의 이동 정보를 분석함에 있어 공간적 해상도를 시설단위로 식별 추출할 수 있 는 방법론을 트립체인 정보를 활용하여 개발하고자 하였다. 먼저, DTG를 활용하여 개별 화물 차량의 방문지 위치정보를 식별하고, 화물차의 통행 순서정보를 이용하여 화물차량의 방문한 공간적 범위를 H3 기반의 폴리곤으로 생성하였다. 생성된 트립체인 폴리곤 간의 연계성을 전 국 단위로 분석함으로 폴리곤의 H3 해상도를 결정하였으며, 최적의 해상도를 동적으로 도출하 기 위한 파라미터의 결정 알고리즘을 개발하였다. 전국을 대상으로 실증하여 폴리곤을 생성하 고 최적 해상도 결정 결과 공간 적합도는 81.26% 수준으로 확보되고 오차율은 14.8% 수준으로 검증되었다. 본 연구에서 개발한 방법론으로 화물차량의 통행체인 특성과 방문 시설의 특성에 따라 군집화함으로 물류 거점을 기준으로 화물의 특성을 파악할 수 있는 기반을 마련하였다.



    Ⅰ. 서 론

    1. 연구의 배경 및 목적

    화물자동차 O/D는 향후 5년간 국가기간교통망계획, 국가물류기본계획, 지역교통물류계획 등 각종 물류계 획을 수립하고 정책마련의 기초자료로 활용되는 중요한 자료이다. 전국 화물 O/D조사는 1996년 전국물류현 황조사를 시작으로 5년마다 표본을 할당하여 면접조사 방식으로 이루어지고 있다.(The Korea Transport Institute, 2022)

    그동안 화물통행실태조사로부터 도출되는 화물 기종점 통행량 O/D자료는 시군구 행정구역 단위로 구축되 었다. 그러나, 최근 주요 이슈가 되는 도시 내 택배 운송, 소화물 운송, 유통 행태 등에 대하여 시군구 단위로 구축되는 자료로 파악하는 것은 한계가 있어, 화물자동차 운행기록계와 같은 데이터 기반의 화물 수송 관련 연구의 확대가 필요하다.(The Korea Transport Institute, 2023a)

    전통적인 조사 방식을 통해 도출된 화물 O/D는 시군구 단위로 자료를 수집하기 때문에 자료를 통계화할 수 있고, 패턴을 도출할 수 있으나 시사점을 도출하기에는 공간적 해상도가 넓다는 문제점이 있다. 전수화 과정에서 발생하는 오차가 발생하는 표본의 한계점이 있어 빅데이터 기반의 연구가 필요하다.

    빅데이터 기반의 기종점 통행량을 산정할 때, 화물 부문의 빅데이터는 여객 부문의 빅데이터와 비교했을 때보다 활용가능한 자료가 적어 화물 교통수요 빅데이터를 어떤 관점에서 활용할 것인지 가장 먼저 결정해 야한다.(Kim et al., 2018b) 화물의 이동을 파악할 수 있는 대표 자료인 화물자동차 운행기록계(DTG1))자료는 1초 단위로 위치정보를 수집하여 화물차의 이동을 상세하게 확인할 수 있으나, 통계화가 어렵고, 이동 패턴 이 나타나지 않는 문제점이 있어 적정 구역을 설정하여 설문으로 도출되지 않는 상세한 통행을 식별할 필요 가 있다.

    본 연구에서는 DTG 기반으로 화물차가 방문한 시설 및 지역을 적정수준으로 군집화하는 것을 목적으로 한다. 이는 데이터 기반의 분석 방식으로 기존 표본조사의 한계점을 극복하고, 시군구 단위로 구축되는 화물 O/D보다 더 상세화된 공간 범위를 설정함으로 상세화된 화물 통계 및 패턴을 연구하는 데 기여한다.

    본 연구는 제2장에서 선행 연구를 검토하였고, 제3장에서 동적 클러스터링을 통해 화물차 방문시설을 식 별하는 방법론을 제시하였다. 제4장에서는 제3장의 방법론을 이용하여 최적의 파라미터를 결정하는 방법과 결과를 제시하였으며, 제5장에서 결론 및 시사점을 제시하였다.

    Ⅱ. 선행 연구 고찰

    1. 화물자동차 통행실태 분석

    한국교통연구원에서 수행하는 KTDB2) 사업에서는 조사를 통해 화물에 대한 기초 자료를 수집하고 교통 수요 분석을 통해 교통정책을 수립하는 기초자료를 제공한다.(The Korea Transport Institute, 2023b) 이 중에서 화물통행실태조사는 5년마다 한 번 이루어지며, 화물자동차 기종점 통행량 및 물동량 등과 같은 지표를 표 본 전수화를 통해 생산하며, 전수화 과정에서 표본설계에 사용된 모집단의 기준 시점과 실제 조사시점이 상 이하여 조사 시점에 대한 전수화 결과를 도출하는데 한계가 있다.(The Korea Transport Institute, 2017)

    Kim et al.(2018a)은 전수화 과정에서 발생할 수 있는 오차의 한계점을 극복하기 위해 다양한 층화 변수를 고려하여 표본을 설계하고, 오류를 최소화하기 위한 조사 설계 방안을 제시하여 조사 방법을 개선하였다.

    미국에서는 CFS3)를 기반으로 화물 O/D를 추정하는데, 표본조사를 진행하는 과정에서 조사 거절, 물동량 관련 무응답, 조사 결과의 큰 편차로 인해 CFS는 미국 내륙 화물 운송량의 70%가량만 조사되어, FAF4 분석 을 통해 약 30% 재추정하는 과정을 거쳐야 한다. 이는 면접조사 방식이 내수 물류를 파악하는 데 한계점이 있음을 보여준다.(Hwang et al., 2016)

    이러한 면접조사의 한계를 극복하기 위해, 빅데이터 기반의 화물자동차 이동 특성에 대한 연구가 진행되고 있다. 국내에서는 1톤 초과의 영업용 화물자동차에 의무적으로 부착되는 화물자동차 운행기록계(DTG) 자료를 통해 국가공간정보포털의 물류시설정보 등을 활용하여 물류 거점 폴리곤을 구축하고 물류 거점 별 통행 특성을 분석하였다. 분석 결과, 화물자동차의 통행 수는 기존 면접조사보다 더 높게 나타났다.(Kim and Bae, 2021)

    DTG가 보유한 위치정보의 정확성의 문제점을 보정하여 특성적인 한계점을 극복하기 위해 Kim et al.(2019) 연구에서는 화물차량이 주로 통행하는 목적 시설을 식별하기 위해서 슬라이딩 윈도우(Sliding Window) 기법을 이용하여 이동과 정차를 구분하였다. 슬라이딩 윈도우 방법은 고정된 크기의 범위를 설정하 고, 창(window)이 순차적으로 이동하며 창의 위치에 해당하는 데이터를 순차적으로 연산 작업을 수행한다. (Aggarwal, 2007)

    해외에서는 GPS 위치정보와 토지 이용 데이터를 결합하여 이동 목적을 도출하였다. 차량이 정차하는 산 업별, 시간대별, 토지 이용 정보에 따라 정차 패턴을 파악하였다. 토지이용 유형은 차량의 정차 목적에 영향 을 미치는데, 상업지역이나 쇼핑 센터에 인접한 지역에서 출발하는 차량은 배달이나 상품 운송과 같은 특정 목적으로 정차할 가능성이 있는 것으로 나타났다.(Kuppam et al., 2014) 또한, 모바일 센싱 데이터 기반으로 화물차량의 이동 특성을 다룬 연구에서는 K-means를 통하여 이동 패턴을 군집화하고, 날씨 조건에 따른 트 럭의 통행 패턴을 분석하였으며, 교통 계획 및 유지 보수 운영에 대한 해결책을 제시할 수 있음을 시사했 다.(Akter, 2019)

    2. 교통존 설정 및 클러스터링

    차량 센싱 데이터가 비교적 적을 때는 실시간 처리가 가능하나, 데이터 양이 방대해질 경우 처리시간이 방대해 지는 문제가 있어 공간 인덱스 연구를 할 필요가 있다. 실시간 DTG가 도입 및 보편화되면서 데이터 처리시간이 더 소요되어 공간분석에 대한 연구 니즈가 증대되고 있다. 선행연구에서는 전국 지도를 구글 좌표계 기준으로 균등 분할하여 그리드 인덱스를 개발하였다. 그리드 ID를 분할 DTG 자료에 그리드 인덱스 기법을 적용하였을 때, 기존 링크 단위 데이터 처리 방식과 비교했을 때보다 처리 속도가 더 우수하다는 것을 확인하였으며, 유형별 그리드 셀의 최적화 크기 산출에 대한 추가 연구가 필요함을 제시했다.(Chong and Sung, 2020)

    동적 클러스터링은 최적의 군집을 자동화하여 만들어주는 것을 의미한다. 선행연구에서는 전통적인 K-means 클러스터링 방법을 개선하여 동적으로 클러스터 수를 결정하는 알고리즘 연구에서는 집단 간 거리가 더 멀고, 집단 내 거리가 가깝게 하여 동적 클러스터링이 일반 표준 모델보다 더 향상된 결과를 도출했다.(Shafeeq and Hareesha, 2012)

    교통 분야에서는 도로 교통상황의 시공간적 변화 특성을 종합적으로 고려하고, 스펙트럼 클러스터링 방법 을 사용하여 도로 네트워크 경계를 동적으로 구성하였다.(Xing et al., 2022)

    Chandra et al.(2020)은 동적 공간 설계 방법론을 활용하여 공간을 재그룹화 하였다. 화물 수요와 관련한 적 합한 공간정보를 얻기 위해서는 화물 이동의 다양성을 고려한 공간 특성을 포함하여 공간 단위를 클러스터 링하여 화물교통분석구역을 정의하였다. 동질성과 연속성을 고려하여 군집화한 결과 산업 및 토지이용 특성 을 기반으로 한 화물교통분석구역이 다른 시스템에 비해 더 동질성이 있음을 나타났다. 이는 화물의 이동 특 성을 고려한 공간을 설계하는 것이 필요함을 의미한다.

    3. 본 연구의 차별성

    화물에 대한 연구는 그동안 국가교통조사 화물통행실태조사 자료 중심으로 이를 고도화하는 연구가 진행 되어왔다. 그러나, 기존 화물 O/D 자료는 표본 조사 방법을 활용하여 조사 오차 및 표본 오차가 발생하는 한 계점이 존재한다. 또한, 시군구 행정구역 단위로 조사하기 때문에 보다 더 상세화된 화물의 흐름을 파악하는 것은 정책을 수립하는 입장에서 중요하게 고려되어야 한다.

    따라서, 본 연구에서는 공간적 해상도를 신뢰성 있게 설정하는 방법론을 제시하였다. DTG 자료를 기반으로 화물자동차가 방문하는 시설 및 지역을 동질적인 특성을 가질 수 있도록하는 방법론을 개발 및 검증하였다. 화물차가 방문한 위치정보 O/D pair를 기준으로 H3 해상도를 자동으로 결정하고 군집화하였다. 화물자동차가 방문하는 위치정보를 적정 수준으로 군집화하게 하여 기존 시군구 단위의 화물 O/D자료보다 상세화된 O/D를 도출할 수 있는 기반을 마련하였다. 이를 통해 물류 산업의 효율성과 정책 결정에 기여할 수 있을 것으로 기대한다.

    Ⅲ. 분석방법론

    1. 연구의 흐름

    본 연구에서는 <Fig. 1>과 같은 절차에 따라 연구를 수행하였다.

    <Fig. 1>

    Research process

    KITS-22-6-141_F1.gif

    2. 방문시설 지리공간의 인덱싱 개념 정립

    본 연구에서는 화물차량이 방문하는 물류 시설의 식별을 위해 지리공간 인덱싱 개념을 이용하였다. 비정 형화된 물류시설과의 효과적인 공간 매칭을 위해 정사각형 방식의 인덱싱이 가진 단점을 극복하기 위하여 본 연구에서는 Uber사에서 개발한 H3 인덱스를 사용하였다.

    <Fig. 2>에서 나타나듯이 H3인덱스는 삼각형 혹은 사각형으로 이루어진 격자와 다르게 동일한 해상도를 가지는 인접한 노드 사이에서는 동일한 거리를 갖는다. 이는 지구상의 공간을 2D 공간으로 표현함에 있어 왜곡의 정도를 감소시키는 효과가 있다. <Fig. 3>에서 확인 가능하듯이 H3 인덱싱을 활용하면 모든 통행의 기점과 종점을 색인하여 각 위치에 해당하는 육각형 노드를 즉각적으로 검색 가능하다.

    <Fig. 2>

    Distances from a polygon to its neighbors

    KITS-22-6-141_F2.gif
    <Fig. 3>

    H3 index application example

    KITS-22-6-141_F3.gif

    <Fig. 4>에서와 같이 H3은 그리드 시스템으로 전세계를 개별 셀로 분할하여 개별 고유ID를 부여한다. 셀 의 해상도는 0단계에서 16개 단계까지 계층적으로 세분화하여 생성되어 있기 때문에, 상위 해상도 셀에는 여러 개의 하위 해상도 셀이 중첩 설정되어 있다.

    <Fig. 4>

    Hierarchical hexagonal grid

    KITS-22-6-141_F4.gif

    <Fig. 5>, <Fig. 6>에서 본 연구에서는 화물차가 방문한 시설들의 지리적 공간을 H3에 기반하여 인덱싱함 에 있어서, 탄력적인 해상도의 설정이 가능한 개념을 정립하였다. 예를 들어, 부산신항의 경계를 나타낸 <Fig. 5>의 공간을 본 연구에서 정립한 개념에 따라 H3 인덱스를 적용하였을 때, 다양한 해상도의 육각형 격 자가 인덱싱된 것을 확인할 수 있다. 또한 본 연구에서는 시설의 규모와 통행성격에 따라 해상도를 차등화하 여 적용하도록 하면서 다양한 시설에 포함된 공간 인덱스의 정보량에 따라 탄력적으로 식별함으로 분석을 효과적으로 수행 가능하도록 하였다.

    <Fig. 5>

    Busan new port boundary

    KITS-22-6-141_F5.gif
    <Fig. 6>

    Concept of flexible resolutions setting

    KITS-22-6-141_F6.gif

    3. 트립체인 기반 폴리곤의 인덱싱

    1) DTG의 방문지 위치정보 특성 분석

    본 연구에서 정립한 지리공간의 탄력적인 인덱싱 개념을 활용하되, 화물차량 방문지에 대한 지리공간을 타당성 있게 식별하여 인덱싱하고자 화물차의 통행순서(트립체인)의 정보를 활용하였다. 이를 위해서 운행 궤적, 위험 운전 행동 등 분석 목적으로 수집된 DTG 데이터의 지난 2021년 1월부터 6월까지 전국 대상으로 분석하였다. DTG 자료에는 1초 단위의 위치 정보, 차대번호, 자동차 유형, 주행거리, 차량 속도, 브레이크 신 호 등을 포함한다. Kim and Bae(2021)에서 제시된 방법론을 활용하여 DTG 데이터 기반으로 화물차량의 정 차 및 출발 위치정보를 수집하였는데, 이렇게 수집되는 위치정보는 화물차량 통행 특성 상 한계점이 존재한 다. 아래 <Fig. 7>에 나타나있듯이 화물자동차가 도로 주행 중에는 GPS 송수신이 원활하게 이루어져 정확도 높은 위치정보 수집이 가능하지만, 화물차량이 하역 및 적재를 위해 창고, 터미널 등과 같은 시설에 방문하 는 경우에 건물, 주차장 등으로 GPS 송수신 제약에 의한 위치정보가 끊기거나 오류 값을 저장할 수도 있다.

    <Fig. 7>

    GPS reception errors during freight truck transportation process

    KITS-22-6-141_F7.gif

    2) 통행체인을 고려한 폴리곤 인덱싱

    <Fig. 8>과 <Fig. 9>에서와 같이 화물차량이 t 시점의 도착한 지점 위치와 t+1 시점에 출발한 지점 간 거리 가 이격되어 있을 가능성이 존재하여, 이중 어느 지점을 방문지로 선정해야 하는지에 대한 고려가 필요하다. 본 연구에서는 단절된 위치정보를 화물차의 방문정보를 기반으로 연계하여 분석하고자 하였다.

    <Fig. 8>

    Trip chain of freight truck during GPS reception errors(1)

    KITS-22-6-141_F8.gif
    <Fig. 9>

    Trip chain of freight truck during GPS reception errors(2)

    KITS-22-6-141_F9.gif

    트립체인 폴리곤 화물의 흐름 예측 정확도를 제고하기 위해서는 화물차의 출발 및 도착 정보에서 방문시 설 폴리곤을 정의할 수 있는 특성을 찾아 제한된 데이터의 한계를 극복하고자 하였다.

    3) 트립체인 폴리곤 생성

    본 연구에서는 화물 차량의 통행 목적지에서 유의미한 지리공간을 식별하기 위해 트립체인 폴리곤을 구 축하는 방법론을 제시하였다.

    트립체인 폴리곤은 H3 공간 인덱스 방법의 육각형 그리드 위에 존재하는 폴리곤으로, 통행지 혹은 도착지 와 같은 목적 지점을 의미하는 폴리곤이다. 즉, 화물자동차가 방문하는 방문지를 폴리곤으로 형성한다. 트립 체인 폴리곤을 생성하는 방법을 도식화하는 그림은 <Fig. 10>과 같다. 화물차의 통행 체인 자료를 기반으로 차량이 통행을 종료한 지점(Dt)과 이후 통행이 시작된 지점(Ot + 1)을 직선으로 잇고, 선의 길이가 이동 가능 한 거리를 초과하는 경우에는 제외하였다. 그리고 해당 선의 전체 또는 일부를 포함하는 H3 인덱스 폴리곤 을 검출한다. 그리고 교차하는 멀티 폴리곤을 병합하고 식별자를 부여한다. 그 결과는 <Fig. 11>과 같다.

    <Fig. 10>

    Trip chain polygon algorithm flowchart

    KITS-22-6-141_F10.gif
    <Fig. 11>

    Example of trip chain polygon creation

    KITS-22-6-141_F11.gif

    <Fig. 11>에서와 같이 의왕 ICD 인근의 트립체인 폴리곤이 생성된 샘플 보면 H3 index 해상도가 9일 때와 해상도 11일 때의 폴리곤이 다르게 형성되는 것을 알 수 있다. 해상도를 어떻게 설정하는가에 따라 방문시설 의 지리공간 설정이 상이해지므로 합리적인 기준 설정이 필요하다.

    설명한 트립체인 폴리곤 생성 방법론을 정리한 수식은 다음과 같다. 공간의 해상도에 따라 클러스터링의 수가 다르게 형성될 수 있음을 나타낸다.

    (1) H3 인덱스 기법을 이용한 공간 정의

    특정 해상도(k)의 육각형 격자( H i k )로 이루어져 있는 공간(Hk)을 상정하였다.

    l e t H k = H 1 k H 2 k H N 1 k H N k
    (1)

    s . t . f o r i Z , j Z , H i k H j k = ϕ
    (2)

    (2) D-O 폴리곤 검출

    특정 차량의 특정 통행(tX)에서 이전 통행 도착지점과 현재 통행 출발지점을 이은 직선( O D ¯ t X )과 교차하는 육각형 격자들을 결합(Union)하여 하나의 D-O 폴리곤 ( p t X k )을 만들었다. D-O 폴리곤은 검출된 H3 육각형 격 자의 합집합으로 한 개의 폴리곤 생성한 것을 의미한다.

    l e t p t X k = H 1 k H 2 k
    (3)

    i . e . p t X k = i H i k
    (4)

    s . t . for i Z , H i k O D ¯ t X ϕ
    (5)

    (3) 클러스터링 폴리곤 생성

    모든 통행에 대해 D-O 폴리곤을 생성한 후 교차 여부를 기준으로 D-O 폴리곤( p t k ) 중 서로 겹치는 폴리곤 을 하나로 결합(Union)하여 군집화(Clustering) 폴리곤( P c k )을 생성하였다.

    l e t P c k = p t 1 k p t 2 k
    (6)

    i . e . P c k = i C p t i k
    (7)

    s . t . { i , j } C , f o r i Z , j Z , p t i k p t j k = ϕ
    (8)

    P c k = { P c 1 k , P c 2 k , }
    (9)

    4. 트립체인 폴리곤 기반 통행 연계성 분석

    해상도(k)가 낮을 경우 H3 폴리곤의 크기가 크기 때문에, 트립체인 폴리곤은 더 넓은 영역을 차지하게 된 다. 반면, 해상도가 높을 경우에는 H3 폴리곤의 크기가 작기 때문에 트립체인 폴리곤은 더 좁은 영역을 차지 하게 된다. 주요 대형 물류 거점이나 방문지에 대한 특성이 일관화되어 있는 경우 해상도가 낮아도 물류 시 설을 하나로 군집화할 수 있으나, 규모가 작은 물류 시설의 경우에 동일하게 낮은 해상도를 선택할 경우에 주거와 같은 다른 용도의 시설이 함께 군집화될 수 있어 지역 및 시설의 규모 및 특성에 따라 해상도를 다 르게 설정할 필요가 있다.

    트립체인 폴리곤에 적용할 H3의 해상도는 방문시설의 규모와 통행특성에 따라 크기와 범위가 다르게 탄 력적으로 적용되어야 한다. 이에 본 연구에서는 해상도의 설정을 위해서 방문시설의 통행특성 정보를 도출 하고 트립체인 폴리곤 간의 통행 연계성을 분석하였다.

    트립체인 폴리곤 해상도는 특정 위치에 해당하는 특정 해상도(k)의 트립체인 폴리곤과 다음 단계의 해상 도(k+1)의 트립체인 폴리곤의 하위 집합을 의미한다. <Fig. 12>는 부산신항이라는 특정 트립체인 폴리곤과 그외 전국의 트립체인 폴리곤 간의 화물차량의 이동을 그래프로 나타낸 것이다. 즉, 화물차량이 통행을 출발 한 트립체인 폴리곤과 도착한 트립체인 폴리곤을 연결하여 방향 그래프로 나타낸 것이다. 통행 그래프의 노 드는 트립체인 폴리곤을 의미하며, 엣지는 통행의 방향을 의미한다. <Fig. 13>에서는 트립체인 폴리곤을 k.x (해상도.식별자)형식으로 나타내었다. H3 해상도가 12인 트립체인 폴리곤 중 553번째 트립체인 폴리곤(12.533 노드)에서 출발한 통행이 12.705와 12.987 노드로 도착하는 것을 확인할 수 있다.

    <Fig. 12>

    Tripchain polygon pass graph

    KITS-22-6-141_F12.gif
    <Fig. 13>

    Tripchain polygon pass graph example

    KITS-22-6-141_F13.gif

    이러한 방식으로 전국의 트립체인 폴리곤을 연결하였고, H3 해상도 9, 10, 11, 12 등 4단계에 대해서 모두 연결성을 구축하였다.

    5. 트립체인 폴리곤 최적 해상도 결정 방법론

    본 연구에서는 화물차 방문 시설을 동적으로 클러스터링 하기 위해 해상도 동적으로 해상도를 결정하는 방법론을 제안한다. 화물 자동차의 경우 물류 시설에서 상하역이 일어나고, 고정 물량 이동인 경우가 많아 이동 패턴이 존재한다고 가정하였다. 지역 및 시설의 특성에 따라 해상도를 결정하기 위해 TNtriυial, TRmajority변수를 통해 파라미터를 결정하였다.

    여기서 T N ( P x i k + 1 ) 는 전국의 모든 폴리곤에서 k+1 해상도 트립체인 폴리곤( P x i k + 1 )을 도착지점으로 하는 통 행량이다. TNtriυial T N ( P x i k + 1 ) 을 유지하는 최소통행량으로 정의할 수 있다.

    T R ( P x i k + 1 ) 는 k+1 해상도 트립체인 폴리곤( P x i k + 1 )과 연결된 전체 출발지점수 중 각 통행량이 TNtriυial이 이상 인 출발지점 수의 비율로 정의한다. TRmajority T R ( P x i k + 1 ) 중 해상도 선택을 위한 경계값이 된다. 즉, TNtriυial 은 통행 수가 기준 파라미터보다 적은 경우에 고려하지 않는 기준이다. TRmajority는 비율 값으로 0에서 1사이 의 값을 가지며 해상도를 낮추기 위한 조건을 만족시키는 트립체인 폴리곤의 비율을 의미한다. k+1 해상도 의 트립체인 폴리곤들 중 특정 조건을 만족하는 것들의 비율이 TRmajority보다 클 경우 k 해상도를 선택하게 된다.

    <Table 1>

    Variable Description

    Variable Meaning
    TNtrivial (Trivial Trip Number)
    • * T N ( P x i k + 1 ) T N t r i v i a l

    • * Trip Number is less than TRIVIAL TRIP NUMBER, then exclude from analysis

    TRMajority (Trip Majority Ratio)
    • * T R ( P x i k + 1 ) : proportion of trip chain polygons that meet the conditions for reducing resolution ( 0 T R ( P x i k + 1 ) 1 )

    • * T R ( P x i k + 1 ) T R m a j o r i t y

    • * This ration is less than Trip Majority Ratio, then select k resolution of H3

    트립체인 폴리곤의 개념을 수식으로 나타내면 아래와 같으며, 이때 xxi는 트립체인 폴리곤을 구별하 기 위한 식별자(identifier)로 동일하거나 유사한 지리적 위치에 해당하는 것을 가정한다. 임의의 값 i 에 대해 p x k p x i k + 1 를 내포하여, 시설의 경계를 세밀하게 구분하였다.

    P x k = P x 1 k + 1 P x 2 k + 1
    (10)

    k+1 해상도 트립체인 폴리곤( P x i k + 1 )을 도착지점으로 하는 통행을 추출하고, P x i k + 1 중 통행이 도착하지 않은 폴리곤의 경우 k+1 해상도를 선택한다. 각 P x i k + 1 에 대해 연결된 통행 출발 지점들의 수를 계산하였고, TNtriυial 미만인 통행들은 제외한다. 연결된 통행 출발 지점 수가 TNtriυial 이상인 P x i k + 1 들의 수가 n일 때, n N TRmajority를 만족하면 k 해상도를 선택하고 그렇지 못할 경우 k+1 해상도를 선택한다.

    즉, 동일한 출발 지점을 갖는 통행의 k+1 해상도인 트립체인 폴리곤 중 다른 트립체인 폴리곤에서 도착하 는 경향이 뚜렷할 경우 전 단계인 k 해상도의 트립체인 폴리곤을 선택한다.

    제안한 알고리즘을 예시로 설명하면 <Fig. 14>에서와 같이 해상도 11의 트립체인 폴리곤 11.259의 하위 집 합으로 속한 해상도 12 트립체인 폴리곤 12.533, 12.705, 12.987, 12.602 등 4개의 폴리곤들은 전국의 여타 트 립체인 폴리곤과 연결성 기준(TNtriυial 미만인 통행이 없고, TRmajority 이상)의 만족을 보여주고 있으므로, 상 위 해상도 11의 트립체인 폴리곤이 대표한다고 가정한다. 따라서 11.259의 하위 집합으로 속한 해상도 12 트 립체인 폴리곤 12.533, 12.705, 12.987, 12.602 등 4개의 폴리곤들 대신 11 해상도를 선택하게 된다. 따라서, 12.533, 12.705, 12.987, 12.602 등 4개의 폴리곤은 삭제되고 이들을 내포하는 상위 11 해상도 11.259 트립체인 폴리곤에 여타 통행을 연결시키게 된다.

    <Fig. 14>

    Trip chain Polygon Example

    KITS-22-6-141_F14.gif

    이후 동일한 검토를 다른 폴리곤을 대상으로 시행한다. <Fig. 15>에서 나타내듯이 11.758에 속한 하위 12 해상도 12.303, 12.405, 12.477, 12.583, 12.784 등에 대한 연결성 검토 결과 이들 또한 여타 트립체인 폴리곤과 의 연결성 기준의 만족을 보여주므로, 이들 또한 삭제되어 상위 해상도 트립체인 폴리곤인 11.758으로 통합 되게 된다. 알고리즘을 반복 수행하면 <Fig. 16>과 같은 결과를 도출한다.

    <Fig. 15>

    Redircted of Trip to 11.259 Plolygon

    KITS-22-6-141_F15.gif
    <Fig. 16>

    Redircted of Trip to 11.758 Plolygon

    KITS-22-6-141_F16.gif

    Ⅳ. 분석 결과

    1. 파라미터 결정

    앞서 기술한 트립체인 폴리곤 생성 방법론에 따라 화물차 주요 방문시설을 군집화하였다. 이후 동적으로 구분하는 해상도를 결정하였다. 폴리곤의 수를 결정하는 TNtriυial, TRmajority의 파라미터는 분석 결과에 주요 한 영향을 주는 것으로 나타났다. 최소 파라미터만큼 통행한 경우 분석에서 제외하는 기준 변수인 TNtriυial은 파라미터 값이 클수록 많은 통행이 고려되지 않기 때문에, 트립체인 폴리곤 간 통행으로 연결되는 경우가 적 어지고 작은 크기의 트립체인 폴리곤이 많이 생성된다. 또한, TRmajority는 해상도를 낮추기 위한 조건을 만족 시키는 트립체인 폴리곤들의 비율로 값이 클수록 해상도를 낮추기가 어려워져 작은 크기의 트립체인 폴리곤 이 많이 생성된다. 따라서 대형 물류시설일수록 TNtriυialTRmajority의 크기를 작게 파라미터 값을 조정하여 하나의 목적지로 인식하도록 하였다.

    파라미터별 트립체인 폴리곤을 구성하고 해상도를 선택하는 알고리즘을 반복 수행한 결과는 다음과 같다. 범례 부분에 TNtriυial은 통행 수, TRmajority는 비율로 표기하였다.

    <Fig. 17>에서 나타나듯이 반복적인 알고리즘을 수행하면 폴리곤 수를 결정하는 값이 하나의 값으로 수렴 한다. 파라미터 값에 관계없이 첫 번째 알고리즘 수행에서 해상도 감소 효과가 가장 큰 것으로 나타났다. 이 후, 이어진 반복 수행에 대해서는 파라미터 값에 따라 다소 차이는 있었으나, 해상도 감소 효과가 있는 것으 로 나타났다. 그리고 일정 횟수 이후의 시행에서는 트립체인 폴리곤 수의 감소가 나타나지 않았다. 파라미터 크기에 따라 트립체인 폴리곤 수가 유의미하게 차이 난다는 특성을 확인할 수 있다.

    <Fig. 17>

    Change in the Number of Trip Chain Polygons with the Number of Algorithm Executions

    KITS-22-6-141_F17.gif
    <Table 2>

    Parameter Value

    Name TNtrivial TRMajority
    Parameter 1 100 0.5
    Parameter 2 10 0.5
    Parameter 3 10 0.4
    Parameter 4 5 0.3
    Parameter 5 3 0.1
    Parameter 6 1 0.1
    Parameter 7 1 0.09
    Parameter 8 1 0.07
    Parameter 9 1 0.05
    Parameter 10 1 0.03

    2. 해상도 결정 방법론 적용

    제시한 10개의 파라미터의 조합으로 트립체인 폴리곤 분석을 수행한 결과 파라미터에 부여한 번호가 높 을수록 트립체인 폴리곤 해상도가 낮아지기 쉬워 큰 트립체인 폴리곤으로 형성되었다. <Fig. 18>과 <Fig. 19> 에서 의왕 ICD 인근에 대해 파라미터 1과 파라미터 10으로 지도 위에서 표시한 결과이며, 파라미터에 따라 시설 클러스터링 수에 대해 유의한 차이가 있음을 확인할 수 있다.

    <Fig. 18>

    Trip Chain Polygons at Parameter 1

    KITS-22-6-141_F18.gif
    <Fig. 19>

    Trip Chain Polygons at Parameter 10

    KITS-22-6-141_F19.gif

    본 연구에서는 가능한 큰 폴리곤 정보를 이용하여 지역 및 시설의 특성에 맞게 군집화하여 파라미터를 선 택한다. 다만, 무조건적으로 파라미터 크기를 크게 하여 큰 공간을 확보하는 것은 다른 용도로 사용하는 공 간을 포함하기 때문에 대표성을 저해할 수 있어 특성에 맞춰 파라미터를 설정해야 한다.

    항만배후단지는 항만의 활성화를 위하여 항만과 연계한 가공, 조립기능, 보관, 저장 등의 물류활동을 수행 하여 부가가치를 창출하는 공간이라고 정의한다.(Lee et al., 2009) 따라서, 배후단지는 주로 항만, 공항 등과 같은 수출입 물류 거점과 근접하게 위치한다. 항만배후단지에서 가공되는 생산품은 가공 후 재수출이 이루 어지기도 하며, 내륙 물류와의 연계가 되기도 한다. 항만 배후단지는 항만과는 다른 기능을 수행하는 물류시 설의 기능을 수행하기 때문에 방문지의 특성을 반영하여 트립체인 폴리곤이 항만과 구분되어 군집화되어야 한다.

    <Fig. 20>에서는 부산신항과 배후단지의 트립체인 폴리곤이 구분되지만, <Fig. 21>부터는 부산신항과 인근 배후단지가 동일한 트립체인 폴리곤으로 통합되는 것을 확인할 수 있다. 본 연구에서는 시설에 대한 특성을 반영하는 파라미터 중 가장 큰 트립체인 폴리곤으로 구성된 파라미터 3을 선택하여 공간 정보 폴리곤을 구 성하였다.

    <Fig. 20>

    Trip Chain Polygons at Parameter 3 (Busan New Port)

    KITS-22-6-141_F20.gif
    <Fig. 21>

    Trip Chain Polygons at Parameter 4 (Busan New Port)

    KITS-22-6-141_F21.gif
    <Table 3>

    Final Determined Usage Parameters

    Parameter TNtrivial TRMajority
    Parameter 3 10 0.4

    3. 최적 해상도 결정 검증

    본 연구에서는 지리 공간적 측면에서의 트립체인 폴리곤이 얼마나 해당 물류시설을 적절하게 커버하는지 클러스터렁 해상도 최적수준을 검증하기 위해서 파라미터 조합 단위로 비교하고자 하였다. 판단기준으로 TP, TN, NP, Break 등 4가지의 지표를 제시하였다.

    TP(True positive)는 실제 의왕ICD인데, 트립체인 폴리곤이 공간적으로 의왕ICD 내에 위치한 경우이 다. TN(True negative)는 트립체인 폴리곤이 의왕ICD를 공간적으로 커버하지 못하는 경우이다. FP(False positive) 는 트립체인 폴리곤이 의왕ICD이 아닌 다른 공간에 위치한 경우이다.

    <Table 4>는 의왕ICD을 대상으로 트립체인 폴리곤의 클러스터링 해상도를 최적화하기 위한 검증을 수행 한 결과이다. 분석 결과 파라미터 조합 1에서 10으로 갈수록 True Positive는 증가하는데 Negative Positive 또 한 증가하는 것으로 나타났다. 방문지로 식별한 시설의 모든 공간에 화물차가 방문할 수 있는 곳은 아니기 때문에 True Positive는 100%로 산출될 수는 없다. 따라서 방문시설의 특징을 고려하여 True Positive와 Negative Positive 사이에서 적정 수준을 채택하는 것이 바람직하다. 의왕ICD는 도로를 경계로 2개의 단지로 구분되어 있으며, 파라미터 set이 증가하면서 통합되는데, 파라미터 set 5에서부터 통합되는 결과가 도출되었 다. 트립체인 폴리곤의 해상도가 12에서 11로 통합 확장되면서 정확도가 낮아진 것으로 판단된다. 따라서, 동 알고리즘에 의한 의왕ICD의 최적해상도는 파라미터 조합 4로 결정하는 것이 바람직한 것으로 판단된다.

    <Table 4>

    Verification of Parameter Set

    Parameter Accuracy Performance
    N_Iteration TP TN NP Break Level 9 Level 10 Level 11 Level 12
    Set 1 2 81.26 18.74 14.80 Y 0 0 0 3039
    Set 2 5 81.26 18.74 14.80 Y 0 0 0 3039
    Set 3 6 81.26 18.74 14.80 Y 0 0 0 3039
    Set 4 7 81.26 18.74 14.80 Y 0 0 0 3039
    Set 5 8 95.98 4.02 29.10 N 0 0 616 1
    Set 6 8 95.98 4.02 29.10 N 0 0 616 1
    Set 7 8 95.98 4.02 29.10 N 0 0 616 1
    Set 8 8 95.98 4.02 29.10 N 0 0 616 1
    Set 9 8 95.98 4.02 29.10 N 0 0 616 1
    Set 10 8 95.98 4.02 29.10 N 0 0 616 1

    Ⅴ. 결 론

    본 연구에서는 국가 차원의 물류 흐름을 파악하고자 화물차의 방문시설을 동적으로 식별하는 방법론을 정립하였다.

    첫째, 화물자동차의 통행을 추출하고, H3 인덱싱 기법을 활용하여 방문시설을 클러스터링 할 수 있는 방 법론을 제시하였다. 기존 물류시설이라고 명시된 공공데이터 및 면접 조사 자료를 이용하여 화물의 흐름을 파악하고자 한 선행 연구의 한계점을 극복한다. DTG 자료를 활용하여 기존 식별되지 않은 화물자동차의 방 문지를 파악하고 끊임없는 물류의 흐름을 파악하고자 하였다.

    둘째, 통행 수 및 비율에 따라 변화하는 방문시설의 트립 체인을 구성하고 시설 간 연계성을 고려하여 트 립체인 폴리곤을 도출하였다. 또한 트립체인 폴리곤이 동일한 특성을 가지는 하나의 시설 군집으로 클러스 터링될 수 있도록 최적화된 해상도를 결정하였다. 그 결과 공간 적합도는 81.26% 수준으로 확보되고 오차율 을 14.8% 수준으로 검증되었다.

    연구결과를 기반으로 다음과 같은 정책활용 시사점을 도출할 수 있다.

    첫째, 허가제로 운영하고 있는 물류시설 이외에도 화물차량의 방문정보를 통하여 자가 물류시설에 대한 공간 정보를 수집할 수 있다.

    둘째, 특징적인 물류 거점을 기준으로 화물의 특성이 차이가 있는지 파악할 수 있다. 산업단지나 공항, 항 만 간 화물차의 이동 패턴에 대한 분석이 가능할 수 있음을 확인하였다.

    화물자동차 방문 시설 식별과 클러스터링을 통해 물류 산업의 효율성을 위한 정책 결정에 기여할 것으로 기대한다. 기존보다 향상된 물동량 분석이 가능하고, 효율적인 물류 이동 경로를 최적화함으로 물류 비용을 절감할 수 있다. 물류 흐름의 파악은 본질적으로 물류 산업의 전반적인 투명성과 효율성을 제고할 것으로 기 대한다.

    다만, 화물자동차 운행기록계 자료의 경우 1톤 초과의 영업용 화물자동차에만 부착되어, 생활물류 중 자 가물류로 운송되는 화물의 흐름 및 패턴은 파악할 수 없는 한계점이 존재한다. 향후 화물차량의 전체적인 통 행 흐름 정보를 파악하기 위해서는 화물차량의 용도나 톤급 등에 따라 고도화된 연구를 진행할 필요가 있다. 특히 장거리 및 단거리인지에 따라 화물자동차 주행 패턴의 변화를 고려한 추가 연구가 필요하다.

    ACKNOWLEDGEMENTS

    이 논문은 국토교통과학기술진흥원의 지원을 받아 수행된 국가연구개발사업(RS-2023-00142845)입니다.

    본 논문은 한국ITS학회의 2023년 추계학술대회에 게재되었던 “데이터 결합 연계를 통한 화물 모빌리티 분 석 방법론 개발” 논문(포스터)을 수정·보완하여 작성하였습니다.

    Figure

    KITS-22-6-141_F1.gif

    Research process

    KITS-22-6-141_F2.gif

    Distances from a polygon to its neighbors

    KITS-22-6-141_F3.gif

    H3 index application example

    KITS-22-6-141_F4.gif

    Hierarchical hexagonal grid

    KITS-22-6-141_F5.gif

    Busan new port boundary

    KITS-22-6-141_F6.gif

    Concept of flexible resolutions setting

    KITS-22-6-141_F7.gif

    GPS reception errors during freight truck transportation process

    KITS-22-6-141_F8.gif

    Trip chain of freight truck during GPS reception errors(1)

    KITS-22-6-141_F9.gif

    Trip chain of freight truck during GPS reception errors(2)

    KITS-22-6-141_F10.gif

    Trip chain polygon algorithm flowchart

    KITS-22-6-141_F11.gif

    Example of trip chain polygon creation

    KITS-22-6-141_F12.gif

    Tripchain polygon pass graph

    KITS-22-6-141_F13.gif

    Tripchain polygon pass graph example

    KITS-22-6-141_F14.gif

    Trip chain Polygon Example

    KITS-22-6-141_F15.gif

    Redircted of Trip to 11.259 Plolygon

    KITS-22-6-141_F16.gif

    Redircted of Trip to 11.758 Plolygon

    KITS-22-6-141_F17.gif

    Change in the Number of Trip Chain Polygons with the Number of Algorithm Executions

    KITS-22-6-141_F18.gif

    Trip Chain Polygons at Parameter 1

    KITS-22-6-141_F19.gif

    Trip Chain Polygons at Parameter 10

    KITS-22-6-141_F20.gif

    Trip Chain Polygons at Parameter 3 (Busan New Port)

    KITS-22-6-141_F21.gif

    Trip Chain Polygons at Parameter 4 (Busan New Port)

    Table

    Variable Description

    Parameter Value

    Final Determined Usage Parameters

    Verification of Parameter Set

    Reference

    1. Aggarwal, C. C. (2007), Data streams: Models and algorithms (vol. 31), Springer, pp.129-131.
    2. Akter, T. (2019), Truck Activity Pattern Classification Using Anonymous Mobile Sensor Data, University of Arkansas, pp.8-16.
    3. Chandra, A. , Pani, A. and Sahu, P. K. (2020), “Designing zoning systems for freight transportation planning: A GIS-based approach for automated zone design using public data sources”, Transportation Research Procedia, vol. 48, pp.605-619.
    4. Chong, K. S. and Sung, H. K. (2020), “A Study on Traffic Big Data Mapping Using the Grid Index Method”, The Journal of The Korea Institute of Intelligent Transportation Systems, vol. 19, no. 6, pp.107-117.
    5. Hwang, H. L. , Hargrove, S. , Chin, S. M. , Wilson, D. , Lim, H. S. , Chen, J. , Taylor, R. , Peterson, B. and Davidson, D. (2016), “The Freight Analysis Framework Version 4 (FAF4)-Building the FAF4 Regional Database: Data Sources and Estimation Methodologies”, Technical Report, Oak Ridge National Lab., pp.3-13.
    6. Kim, J. E. and Bae, B. J. (2021), “Analysis of truck trip behavior using big data: Focused on major logistics facilities”, Proceedings of the KOR-KST(Korean Society of Transportation) Conference, vol. 2021, pp.360-361.
    7. Kim, J. E. , Sung, H. M. , Jo, Y. H. , Lee, Y. C. , Park, I. K. and Woo, W. H. (2018), “Study on Improving the Survey Methods of Freight Transportation in Korea”, Journal of Transport Research, vol. 25, no. 1, pp.41-55.
    8. Kim, J. Y. , Kim, D. H. , Kim, B. K. and Seong, H. M. (2019), Upgrading Reliability of Estimating Big Data-Driven Transport Demand, The Korea Transport Institute, pp.241-251.
    9. Kim, J. Y. , Kim, D. H. , Seong, H. M. and Song, T. J. (2018), A Study on the Reliability of Traffic Demand Prediction Based on Big Data, The Korea Transport Institute, pp.115-134.
    10. Koziol, T. (n.d.), https://t1nak.github.io/blog/2020/h3intro/, 2023.12.01.
    11. Kuppam, A. , Lemp, J. , Beagan, D. , Livshits, V. , Vallabhaneni, L. and Nippani, S. (2014), “Development of a Tour-Based Truck Travel Demand Model using Truck GPS Data”, TRB 93rd Annual Meeting Compendium of Papers, No. 14-4293.
    12. Lee, E. K. , Jang, J. S. and Kil, K. S. (2009), “A Study on selecting Value Added Products in Port Hinterland: A Case of Incheon Port”, Asian Journal of Shipping and Logistics, vol. 25, no. 3, pp.639-663.
    13. National Spatial Data Infrastructure Portal,http://www.nsdi.go.kr/lxportal/?menuno=2679, 2023.06. 08.
    14. Shafeeq, B. M. A. and Hareesha, K. S. (2012), “Dynamic clustering of data with modified k-means algorithm”, 2012 International Conference on Information and Computer Networks, vol. 27, pp.221-225.
    15. The Korea Transport Institute (2017), National Freight Transportation Survey, pp.289-296.
    16. The Korea Transport Institute (2022), National Transport Survey 2022: National Freight O/D Main Survey, pp.3-287.
    17. The Korea Transport Institute (2023), National Transport Survey Long-Term Strategy Formulation Study, pp.23-28.
    18. The Korea Transport Institute,https://www.ktdb.go.kr/www/index.do, 2023.09.26.
    19. Uber,https://www.uber.com/en-KR/blog/h3/, 2023.10.25.
    20. Xing, Y. , Li, W. , Liu, W. , Li, Y. and Zhang, Z. (2022), “A Dynamic Regional Partitioning Method for Active Traffic Control”, Sustainability, vol. 14, no. 16, p.9802.

    저자소개

    Footnote

    • DTG : Digital Tachograph, 차량 운행기록계
    • KTDB : Korea Transport Database, 국가교통데이터베이스
    • CFS : Commodity Flow Survey, 물류현황조사