Ⅰ. 서 론
전 세계의 국가들은 온실가스 배출량을 제로로 하는 탄소중립 계획을 실행하고 있으며, 우리나라도 세계 적인 추세에 맞춰 점진적으로 온실가스 배출량을 감축하여 순배출량을 제로로 하는 탄소중립 계획을 발표하 였다. 환경부 발표에 따르면 2021년 기준 국내 수송부문의 온실가스 배출량은 14.4%로 높은 수준이다. 수송 부문의 탄소중립을 위해서는 자전거와 같은 무동력 수단의 이용 활성화가 필요하다. 유럽 주요국들은 자전 거를 탄소중립의 주요 대안으로 판단하여 자전거 이용 활성화 정책을 추진하고 있다(Nieuwenhuijsen, 2020). 자전거 통행행태를 이해하고 자전거 이용 활성화를 위한 효율적인 정책을 수립하기 위해서는 정확한 자전거 통행발생량의 추정이 필요하다(Min, 2020).
통행의 기종점은 집, 직장 등과 같이 개인의 주요 활동 위치를 나타낸다(Xu et al., 2016). 공유자전거의 기종 점은 대여소로, 기존 연구에서는 자전거 이용자의 이용행태를 분석하기 위해 대여소를 기준으로 분석하였다. 하지만 자전거는 타 교통수단에 비해 이용자가 통행 중에 여러 번 정차하는 유연한 통행이 가능하며(Zhang et al., 2018), 공유자전거 이용자들은 자전거를 이용하여 1일 동안 다양한 목적통행을 하는 경향이 있다(Zhao et al., 2015). 즉, 자전거는 다른 수단에 비해 최종 목적지(반납 대여소)에 도착하기 전에 다양한 지점에서 일정 시간 머무르는 경유지가 쉽게 발생할 수 있다. 중간 경유지인 체류 지점(Stay point, SP)은 이용자가 특정 목적 을 가지고 활동을 하는 의미있는 장소이며(Montoliu et al., 2013;Zheng, 2015), 체류 통행행태는 도시시설의 공 간구성과 연계된 구체적인 활동 유형을 반영하고 있다(Zhao et al., 2020). 따라서 자전거 이용자의 구체적인 통행행태를 이해하기 위해서는 기종점과 마찬가지로 체류 지점에 대한 고려가 필요하다. 통행행태를 파악하기 위해 통행발생량을 추정하나 공유자전거 이용에 대한 이전 연구에서는 GPS(Global Positioning System) 기반의 주행궤적 데이터의 부재로 인해 체류 지점에 대한 고려 없이 통행발생량을 분석하였다(Kim and Lim, 2022;Kim et al., 2020;Lim and Chung, 2019;Mix et al., 2022;Noland et al., 2016;Jang et al., 2016). 그러나 체류시간 (Dwell time) 개념을 도입하여 한 지점에서 일정 시간 이상 머무르는 체류 지점에서의 통행은 다른 통행사슬로 구분하므로(Choo et al., 2008;McGuckin and Nakamoto, 2004), 기존의 대여소만을 이용한 통행발생량 추정은 과소 추정될 수 있어 체류 지점에 대한 고려가 필요하다.
본 연구에서는 서울에서 수집된 GPS 기반의 공공자전거 주행궤적 데이터를 이용하여 공공자전거 이용자 의 체류 지점을 고려한 통행발생량 모형을 추정하고자 한다. 하나의 통행에서 여러 체류 지점이 나타나는 경 우 체류 지점에서 통행이 발생한 것으로 집계하여 새로운 기종점을 생성하였으며, 이러한 체류 지점을 기종 점으로 하여 통행이 발생하는 것으로 가정하였다. 체류 지점을 고려하기 위해 육각격자 기반의 분석단위를 기준으로 설정하였으며, 체류 지점이 주로 발생하는 공간을 파악하였다. 또한 자전거 이용자의 체류 지점과 대여소를 기종점으로 발생하는 통행량에 영향을 미치는 요인을 영과잉 음이항 회귀분석(Zero-Inflated Negative Binomial, ZINB) 모형을 이용하여 파악하고 통행발생량 추정 방법론을 제시하였다. 이러한 통행발생 량 추정 방법론을 통해 보다 정확하고 효율적인 통행발생량 추정이 가능해져 지방정부 및 교통 계획가가 공 공자전거 관련 정책을 수립하는데 기여할 수 있을 것으로 기대한다.
이 논문의 나머지 부분은 다음과 같이 구성된다. 섹션 2는 공유자전거 통행발생량과 이용특성과 관련된 선행연구를 검토하였다. 섹션 3에서는 분석방법론으로 맵매칭과 체류 지점 탐지 알고리즘의 분석과정을 제 시하였으며, 영과잉 음이항 회귀분석 모형을 소개하였다. 섹션 4에서는 데이터에 대한 자세한 정보 및 체류 지점을 시각화하였다. 섹션 5에서는 체류 지점을 고려한 공공자전거 통행발생량을 추정한 결과를 제공하였 다. 마지막으로 섹션 6에서는 결론 및 한계점을 제시하였다.
Ⅱ. 선행연구 고찰
1. 통행발생량에 관한 연구
국내에서는 가구통행실태조사를 이용하여 공간 및 시간 특성을 반영한 차량의 통행발생량 추정모형 개발 이 주로 이루어졌으며(Kim et al., 2012b;Kim et al., 2011;Jin et al., 2012), 자전거 통행발생량에 관한 연구는 일부 있으나 체류 지점을 고려한 연구는 전무하였다. Lee et al.(2011)은 2006년 수도권 가구통행실태조사를 이용하여 수도권 66개 시군구 지자체의 자전거 통행발생량을 종속변수로 설정한 다중회귀분석 모형을 정립 하였다. 해당 모형에서 인구밀도, 초등학생을 제외한 학생 수, 월평균소득의 합, 승용차 대수, 자전거도로 연 장을 이용하여 자전거 수요를 예측하는 방법론을 제시하였다.
해외에서는 대여소를 기반으로 한 자전거 통행발생량 연구가 주로 이뤄졌으며, 대여·반납 대여소가 없는 도크리스(dockless) 공유자전거에 대한 연구도 일부 수행되었다. Mix et al.(2022)은 칠레의 Bike Santiago 공공 자전거 통행발생량을 다중회귀모형을 활용하여 추정하였다. 분석단위는 공공자전거 대여소를 기반으로 Thiessen 폴리곤으로 설정하였으며, 2016년 3월 한 달 동안의 일일 통행발생량을 종속변수로 이용하였다. 분 석결과, 자전거도로 길이가 길수록 통행발생량이 높으며, 주거 및 업무 토지이용 변수가 중요한 영향요인으 로 나타났다. 추정된 통행발생량 모형을 활용하여 한 변의 길이가 550m(육각형 중심 사이의 거리 약 953m) 인 육각격자의 중심에 공공자전거 대여소를 재배치하는 최적화 모델을 제시하였다. 분석결과, 최적화된 대여 소는 고소득 커뮤니티에 집중적으로 위치하는 것으로 나타났다. Noland et al.(2016)은 뉴욕시의 Citi Bike 공 유자전거 데이터를 이용하여 자전거 대여소에서의 통행발생량을 추정하였다. 분석단위는 자전거 대여소를 기준으로 Thiessen 폴리곤으로 정의하였으며, 지하철 접근변수, 인구 및 고용인구, 토지이용 변수를 고려한 베이지안 회귀모델을 구축하였다. 분석결과, 지하철역과의 접근성이 높을수록, 주거 인구가 많을수록, 고용 인구가 많을수록(주중), 주거용도의 토지이용이 높을수록(주말) 통행발생량이 높은 것으로 나타났다. Morton et al.(2021)은 공간지연모델(Spatial Lagged Model, SLM)을 이용하여 2016년 런던 공유자전거(London Bicycle Sharing Scheme, LBSS)에 대한 공간적 통행발생량을 추정하였다. 분석단위는 대여소 기준 Thiessen 폴리곤으 로 설정하였으며, 시간대를 하루 종일·오전 첨두시(6~11시)·낮(11~16시)·오후 첨두시(16~21시)·밤(21~6시) 5가 지로 구분하여 분석하였다. 종속변수는 공공자전거 대여·반납지점의 이용량을 사용하였다. 분석결과, 자전거 기반시설·공원·관광명소·기차역·대학과 거리가 짧을수록, 남성 또는 백인이 많이 거주하는 지역일수록, 거치 대가 많을수록 통행발생량이 높은 것으로 나타났다. Gehrke et al.(2021)은 2018년 4월부터 2019년 9월까지 Boston 교외 지역에서 도크리스 공유자전거에 대해 250m의 사각격자를 기준으로 통행발생량을 분석하였다. Zero-Inflated Poisson(ZIP) 모델 분석결과, 세입자가 거주하는 주택과 아프리카계 미국인 거주자의 비율이 높 은 지역에서 도크리스 공유자전거에 대한 통행발생량 비율이 낮은 것으로 나타났다. 가구당 보유 차량이 없 거나 면적당 인구 수, 고용밀도가 높은 지역은 통행발생량 비율이 높은 것으로 나타났다.
2. 공유자전거 이용특성 및 수요예측에 관한 연구
국내에는 2008년에 공유자전거가 도입되어 국내의 공유자전거에 관한 연구는 상대적으로 해외보다 더디 게 진행되어왔다(Sa et al., 2020). Jang et al.(2016)는 여의도와 상암지구를 대상지로 하여 따릉이 도입 초기 단계의 대여이력 자료를 활용해 시간대별 대여에 대한 이용특성을 분석하였다. 오전 첨두시에는 업무지역 대비 주거지역에서 이용량이 크며, 오후 첨두시에는 지하철역과 거리가 짧을수록 이용량이 큰 것으로 나타 났다. 비첨두시에는 공원이 있을수록, 유동인구가 많을수록 이용량이 크게 나타났다. 하지만 모형의 설명력 이 낮아 종속변수인 시간대별 대여에 유의한 변수를 찾는 수준에 그쳤다. Sa et al.(2020)는 주중 출근 시간대 공유자전거 이용특성을 음이항 회귀분석을 통해 분석하였다. 분석결과, 자전거전용도로와 보행자겸용도로 비율이 높은 곳에서 공유자전거 이용이 많은 것으로 나타났다. 또한 소규모 필지가 밀집한 주거지역의 대여 소와 지하철 출입구까지 거리가 먼 대여소에서 자전거 통행이 빈번하게 발생하였다. Kim et al.(2020)는 2019 년 서울시 공공자전거 대여이력을 이용하여 대여소 반경 200m 내의 유동인구가 많을수록, 지하철과 버스 이 용량이 클수록 공공자전거의 이용량이 큰 것으로 나타났으며, 하천과의 거리가 멀수록 이용량이 높은 것으 로 나타났다. 또한 랜덤 포레스트 모형을 통해 높은 수요량이 예측되는 신규 대여소 후보지를 분석하였다.
공유자전거 이용특성에 관한 해외 연구에 따르면, 남성은 여성에 비해 공유자전거를 더 많이 이용하였다 (Fishman, 2015;Goel et al., 2022;Guo et al., 2017). 여성은 남성보다 상대적으로 통근 이외의 목적으로 자전 거를 이용하며(Krizek et al., 2005;Tin Tin et al., 2009), 남성보다 자전거 통행이 더 짧은 것으로 나타났다 (Garraed et al., 2008;Krizek et al., 2005). 연령 측면에서 젊은 사람은 다른 연령대보다 공유자전거를 더 많이 이용하는 것으로 나타났다(Eren and Uz, 2020). 날씨와 관련된 연구(Kim et al., 2012a;Lee et al., 2016;Hosseinzadeh et al., 2021;Saneinejad et al., 2012)를 종합해 보면, 강수와 온도가 모든 연구에서 영향을 미치는 것으로 나타났다. 이는 상식적으로도 이해할 수 있는 것으로 강수량이 많아질수록 자전거 이용이 낮아졌으 며, 고온과 저온에서도 자전거 이용이 낮아지는 것으로 나타났다.
Lim and Chung(2019)은 2015년 10월부터 2017년 4월까지 서울시 공공자전거 대여이력을 이용하여 마포구와 영등포구를 대상으로 일별 자전거 수요를 예측하였다. 시계열 수요예측 기법인 지수 평활법에 기반한 Double Seasonal Holt-Winters 방법을 사용하여 수준(수요의 평균), 추세(시간에 따른 증감의 경향), 두 개의 계절성(사 계절, 요일)을 고려하였다. Kim and Lim(2022)은 2015년 9월부터 2020년 6월까지 서울시 공공자전거 대여이력 을 이용하여 마포구, 서대문구, 영등포구, 동대문구, 종로구 5개의 자치구를 대상으로 자전거 수요를 예측하였 다. 시계열 수요예측 기법인 ARIMA(Auto-Regressive Integrated Moving Average) 모형 기반의 기온과 강수량을 외생변수로 반영한 ARIMAX 모형의 예측력이 가장 높은 것으로 나타났다. 이외에도 머신러닝을 이용한 자전 거 수요를 예측한 연구가 다수 있다(Yang et al., 2016;Rudloff and Lackner, 2014;Kim et al., 2020).
3. 기존 연구와의 차별성
공유자전거에 관련된 연구는 이용특성 및 수요예측에 관한 연구가 주로 진행되었다. 기존의 연구에서는 자전거 이용자의 체류 지점에 대한 관심이 없었으며, 체류 지점에서 발생하는 통행을 체계적으로 분석하기 위한 노력은 거의 이루어지지 않았다. 이는 체류 지점을 식별하기 위한 GPS 기반의 공공자전거 주행궤적 데 이터 부재의 문제인 것으로 판단된다. 기존 대부분의 연구에서는 기종점만을 알고 있는 O/D 데이터를 이용 하여 대여소를 기준으로 공유자전거의 이용행태를 분석하고 있다. 하지만 기존의 대여소 중심의 분석 방법 은 체류 지점을 무시하는 한계를 지니고 있다. 본 연구에서는 GPS 주행궤적 데이터를 이용하여 체류 지점을 식별하고, 도크리스 공유자전거 발생량 추정에 사용되는 격자모양의 분석단위를 이용하여 체류 지점을 고려 한 통행발생량을 분석하였다.
선행연구에 따르면 자전거 이용은 크게 인구특성, 토지이용 특성, 물리적 특성에 영향을 받는 것으로 나타 났으며, 자전거도로가 자전거 이용에 많은 영향을 미치는 것으로 나타났다. Sa et al.(2020)에 따르면 자전거 도로 유형별로 자전거 이용행태가 달라지는 것으로 나타났다. 따라서 본 연구에서는 서울특별시와 국토교통 부에서 배포하는 「자전거 이용시설 설치 및 관리 지침」에 따라 자전거도로 유형을 세분화하여 자전거도로 특성을 분석에 고려하였다.
Ⅲ. 방법론
1. 맵매칭
원시 GPS 데이터는 불량 신호로 발생하는 노이즈 등 여러 문제를 가지고 있다. 이러한 문제는 GPS 데이 터의 직접적인 분석을 어렵게 만든다. 따라서 GPS 데이터를 이용한 네트워크 분석을 위해서는 맵매칭이 필 요하다. 맵매칭 알고리즘의 기본 개념은 GPS 포인트에서 반경을 생성하고, 반경 안에 위치한 네트워트의 링 크에 수선의 발까지의 거리를 계산하여 가장 가까운 선분을 선택하는 것이다(Yang and Jeon, 2020). 하지만 이러한 기존의 맵매칭 방법은 단순히 포인트와 링크 간의 최단 거리를 고려하였기 때문에 실제 이용하지 않 은 네트워크에 매칭되는 문제를 가진다. 따라서 본 연구에서는 기존의 맵매칭 문제로 지적된 이동궤적을 고 려하기 위해 Newson and Krumm(2009)에서 제시한 Emission Scores 및 Transition Scores를 이용한 맵매칭 방법 을 이용하되 자전거 특성에 맞도록 파라미터 값을 수정하였다. 해당 방법은 다음과 같다. 먼저, GPS 포인트 에 50m 반경1)을 생성하고, 반경 안에 위치한 네트워크 링크에 수선의 발을 내린 지점들을 후보군으로 설정 하였다. 설정된 후보군과 GPS 포인트 사이의 최단 거리(Emission Scores)를 산출한다. 이동궤적을 고려하기 위해 측정된 기준점의 후보군과 그 후속 측정된 후보군 사이의 대권거리(great-circle distance)와 경로거리의 차이를 통한 최단 거리(Transition scores)를 산출한다. 산출된 Emission Scores와 Transition scores를 이용하여 전체 경로의 최단 경로 산출을 위한 최단 경로 산정 알고리즘이 필요하다. 기존 연구에서는 비터비 알고리즘 (viterbi algorithm)을 이용하였으나 본 연구에서는 다익스트라 알고리즘(dijikstra algorithm)을 이용하여 Emission Scores와 Transition scores의 곱을 최대화하는 전체 경로의 최단 경로를 찾아 맵매칭을 수행하였다. 다익스트라 알고리즘은 범용성이 높고 구현이 가장 용이하면서 자동차 네비게이션과 같은 일상 생활에서 활 용되는 대표적인 최단 경로 알고리즘이다(Kim et al., 2017). Emission Scores와 Transition scores값은 정확도의 개념과 유사하여 값이 클수록 최단거리를 의미한다.
2. 체류 지점 탐지
체류 지점은 이용자가 활동을 하는 의미있는 장소 로 자전거 이용자의 이용행태를 이해할 수 있는 중요 한 요소이다. 자전거 이용에서 체류가 나타나는 원인 은 3가지로 생각할 수 있다. 첫 번째는 교차로에서 신 호를 기다리는 체류이다. 일반적으로 신호대기를 위 한 정차는 짧고 의미가 없다. 두 번째는 핸드폰 탐색 이나 자세 정비를 위한 체류이다. 이러한 일시적인 체 류는 앞서 신호대기의 시간과 같이 짧고 의미가 없다. 세 번째는 쇼핑이나 휴식 등 활동을 위한 체류이다. 본 연구에서는 세 번째에서 제시한 활동을 위한 체류 에 중점을 두고 분석하고자 한다.
본 연구에서는 Li et al.(2008)에서 제시한 택시 체 류 지점 탐지 알고리즘을 자전거 특성에 맞도록 수정 하여 체류 지점을 추정하였다. 해당 알고리즘은 먼저 경로의 기준점과 그 후속 지점 사이의 거리가 임계값 을 초과하는지 여부를 확인한 후 기준점과 거리 임계 값 내의 마지막 지점 사이의 시간대를 측정한다. 체류 시간대가 일정 시간 이상 초과하는 경우 체류 지점으 로 탐지한다. 알고리즘은 마지막 체류 지점에서부터 후속 체류 지점 탐지를 다시 시작한다.
체류 지점을 식별하는 임계값은 체류 지점 탐지의 결과에 큰 영향을 미치며, 임계값의 설정은 실험적 경험 (empirical experience)에 크게 의존한다(Zhang and Lin, 2019). 즉, 공공자전거 체류 지점 식별의 핵심은 공공자전 거 특성에 맞는 임계값을 설정하는 것이다. 자전거의 체류 지점을 식별하는 이전 연구(Cheng et al., 2019;Karite et al., 2022;Olmos,e al., 2020)에서는 임계 거리는 최소 15m부터 최대 200m로 나타났으며, 체류시간의 임계값 은 최소 4분에서 최대 20분으로 나타났다. 적절한 임계값을 설정하기 위해 1분의 GPS 수신 간격을 고려하여 임계 거리를 50m, 100m, 150m, 200m, 체류시간을 5분, 10분, 15분, 20분으로 구분하여 비교하였다. 체류 지점의 임계값별 지점의 군집 수준을 분석한 결과, 거리의 임계값은 50m, 체류시간은 10분 이상일 때 체류 지점을 가장 적절하게 파악하는 것으로 나타났다. 이러한 임계값의 결과는 일반적인 공유자전거의 이용자들의 이용시 간이 10분이며(Li et al., 2019), 개선된 GPS 수신 오차범위 때문인 것으로 판단된다. 따라서 본 연구에서 체류 지점은 최초 체류 지점과 그 후속 지점 사이의 거리가 50m 범위의 가상공간에 10분 이상 머무르는 지점으로 정의하였으며, 하나의 통행이 여러 체류통행으로 구분된다면 체류 지점에서 체류통행이 발생한 것으로 가정하 였다. <Fig. 1>은 체류 지점 탐지의 이해를 돕기 위해 모식화하였다.
3. 영과잉 음이항 회귀모형(Zero-Inflated Negative Binomial, ZINB)
통행발생량은 각 자전거 대여소에서 가져온 대여건수를 육각격자를 이용하여 통합한 횟수로 구성된다. 즉, 같은 격자 내에 있는 대여소는 다른 대여소이지만 거리가 가까워 같은 대여소로 가정해야만 한다. 이러 한 일부 분석단위에서는 다른 분석단위보다 많은 대여소가 관측되고, 대여소가 없는 분석단위들에서는 0인 통행발생량이 과대하게 발생하였다. 이러한 문제로 데이터가 정규 분포를 따르지 않아 일반 최소 제곱 회귀 를 사용하여 모형을 추정할 수 없는 것으로 나타났다.
종속변수가 가산 유형이거나 이산분포를 따르면 포아송 모형 또는 음이항 모형을 활용할 수 있다. 포아송 모형은 변수의 평균과 분산이 같다고 가정하여 과분산(overdispersion)현상을 보이는 자료에는 적용하기 힘들 다는 한계를 가진다. 이러한 과대산포 자료를 분석하기 위해 포아송 모형에 오차항을 추가한 음이항 모형을 사용한다. 우도함수를 적용한 최우추정법에 의해 예측된 과분산 계수(α)값이 0일 경우 평균과 분산 값이 같 아 포아송 모형이 더 적합하며, 0 이외의 값일 경우 음이항 모형을 사용하는 것이 더 적합하다. 본 연구에서 구축된 과분산 계수(α) 값은 211.15(Model 1), 192.88(Model 2), 24.10(Model 3)로 신뢰수준 95%에서 통계적으 로 유의함을 보여(α≠0) 포아송 모형보다는 음이항 모형이 적합한 것으로 나타났다.
종속변수의 하한값인 0이 과다하게 많은 경우에 일반적인 포아송 모형과 음이항 모형은 적합도가 낮은 것 으로 알려져 있다. 음이항 분포에 의해 생성되는 0의 비율보다 전체적으로 0이 과잉인 경우에 영과잉 음이항 모형(Zero-Inflated Negative Binomial model)을 이용할 수 있다. 영과잉 음이항 모형과 음이항 모형의 Vuong 검정 결과, 95% 통계검증에서 통계치가 8.83(Model 1), 3.37(Model 2), 4.76(Model 3)으로 모두 1.96보다 커 영 과잉 음이항 모형을 최종 모형으로 선정하였다2). ZINB모형에 앞서 로그 우도함수를 구축하기 위해 필요한 모수(pi, m)은 다음과 같이 정의한다.
여기서,
관측집단(yi)을 영인 그룹과 양수 그룹으로 나누어 우도함수 기여분을 계산한 후 합산한다.
여기서,
기대횟수 E (yi ) 는 λi이기 때문에 다음과 같다..
예측값은 음이항분포의 확률밀도함수(Probability Density Function, PDF)를 이용하여 계산한다.
여기서,
Ⅳ. 분석자료 및 분석방법
1. 데이터
따릉이는 2015년 2,000대의 공공자전거와 150개의 대여소로 서비스를 시작하여 2021년 기준 약 40,500대 의 자전거와 약 2,600개의 대여소를 보유한 시스템으로 성장하였다. 본 연구에서는 서울시설공단에서 운영 중인 공공자전거 대여 서비스인 ‘따릉이’를 대상으로 하였으며, 따릉이의 GPS 기반의 주행궤적 데이터를 이 용하였다. 공간적 범위는 서울시 송파구이며, 시간적 범위는 2021년 10월 20일~22일(수요일~금요일)인 주중 3일로 설정하였다. 2021년 10월 셋째 주 주중 데이터를 모두 수집하였으나 자전거 이용은 날씨에 큰 영향을 받기 때문에 비가 내린 월요일과 화요일은 분석에서 제외하였다. GPS 주행궤적 데이터는 서울시설공단으로 부터 수집된 개별 이용자료로서 개인정보를 암호화하여 추출된 자료이다. GPS 로그는 따릉이 서비스 이용자 가 기기를 대여하여 1분 간격으로 기록되었다. 데이터에는 대여번호, 대여일시, 대여 대여소명, 반납일시, 반 납 대여소명, 자전거번호, 회원번호(암호화), 성별, 연령대, 이용시간, 이용거리, 이동순서, 위도, 경도를 포함 하고 있다. 다만, 성별과 연령대는 회원가입 시 기입하는 필수항목이 아니여서 40%가 미기입되어 있었으며, 일부 단말기 자전거에서 이용거리의 값이 누락되는 오류(Cho and Baik, 2021)가 나타났다. 이에 제공되는 성 별, 연령대, 이용거리 정보는 사용할 수 없었으며, 이용거리는 맵매칭 이후 이동 궤적을 이용하여 재산출하 고 체류 지점 탐지에 이용하였다. 선행연구에 따르면 원시 대여이력 자료는 운행에 대한 오류값을 가지는 것 으로 나타났다. 이러한 오류를 제거하기 위하여 본 연구에서는 선행연구의 기준을 이용하여 다음과 같은 전 처리 과정을 거쳤다. 기종점이 같고 이용거리가 없거나 이용시간이 2분 미만이거나 3시간 이상으로 기록된 데이터를 제거하였다(Cheng et al., 2019;Gehrke et al., 2021;Teixeira and Lopes, 2020;Zhang et al., 2018;Zhao et al., 2015). 따릉이는 운영정책 상 대여와 반납 대여소가 동일하고 이용시간이 2분 미만이면 미운행으로 간 주한다. 또한 GPS 수신 간격이 1분으로 2분 미만의 데이터는 분석에 유의하지 않았다. 3시간 이상으로 기록 된 데이터는 전체의 약 1% 미만으로 나타났다. 또한 평균 주행속도 30km/h를 초과하거나(Olmos et al., 2020;Xu et al., 2016) 한 개의 회원번호로 다수의 따릉이를 대여하는 데이터 및 정비소로 이동하는 데이터를 재배 치 및 정비를 위한 운반차량의 이동으로 간주하여 이상치로 분류하였다.
2. 체류 지점
정확한 체류 지점을 추정하기 위해서 맵매칭 이후 체류 탐지 알고리즘을 이용하여 체류 지점을 추정하였 다. <Table 1>은 서울시 공공자전거 이용현황이다. 3일간 총 대여건수는 21,567건이였으며, 일평균 약 7,189 회의 이용이 발생하였다. 평균 이동거리는 약 2.4km, 평균 이용시간은 약 20분으로 나타났다. 전체 통행의 약 12.1%에서 체류 지점이 나타났으며, 체류가 발생하지 않은 통행에 비해 체류가 발생한 통행에서는 평균 이 용거리가 약 1.4배(3.3km/2.3km), 평균 이용시간이 약 4.1배(60.4분/14.7분) 큰 것으로 나타났다. 또한 채류 지 점에서 발생한 통행 중 대여지점과 반납지점이 같은 순환통행은 약 51%(764회/1,502회)로 크게 나타났다.
<Fig. 2>는 체류 지점과 비체류 지점이 발생하는 시간대별 이용집중률이다. 오전 첨두시와 오후 첨두시에 는 출퇴근의 영향으로 체류 지점이 나타나는 비율이 작으며, 오전 10시부터 오후 4시까지의 비첨두 시간은 체류 지점이 높은 비중을 차지하는 것으로 보인다.
<Table 2>의 체류 지점 빈도를 살펴보면, 한 통행당 체류 지점은 최대 7개까지 나타났다. 그러나 한 번의 체류가 발생하는 비중이 약 81%로 통행 중 대부분의 체류는 주로 한 번만 일어나는 것으로 보인다. 체류 지 점을 하나의 새로운 기종점으로 가정하여 추가적인 통행으로 환산하면 기존 체류가 발생하던 통행의 약 2.4 배인 6,300 통행으로 나타났다. 이를 체류가 나타나지 않은 통행과 합하여 전체 통행량을 재계산하면 25,258 통행(18,958+6,300)으로 나타났다.
<Fig. 3(a)>은 O/D 통행의 시각적 분석이다. ‘롯데월드타워(잠실역2번출구 쪽) 대여소’는 대여와 반납이 송 파구에서 압도적으로 가장 많은 대여소로 나타났으며, 롯데월드타워와 석촌호수 주변의 대여소 모두 상위에 위치하였다. 다음으로 올림픽공원과 문정 법조단지(서울동부 지방법원 및 검찰청) 인근에서도 대여와 반납이 많이 이용되었다. 통행관점에서 롯데월드와 석촌호수 주변 내에서의 이동거리가 1.5km 미만의 짧은 통행이 많이 이루어졌으며, 올림픽공원 주변의 대여소에서는 이동거리가 1.5km 이상의 긴 통행을 보였다.
QGIS의 Natural breaks 기능을 이용하여 체류 지점의 영역을 그룹화하였다. 이 중 격자별 체류 지점을 카 운트한 최상위 그룹은 <Table 3>과 같다. 올림픽공원 내에서 가장 많은 체류 지점이 발생하였으며, 그 외에 도 롯데월드타워와 송파구청 주변, 한강변이 상위 체류 영역으로 나타났다. 송파구청 영역을 제외한 상위 체 류 영역에서는 공공자전거 대여소가 없는 것으로 나타났다. <Fig. 3(b)>는 체류 지점을 시각화하였다. 석촌역 인근과 석촌호수 주변, 문정 법조단지, 잠실운동장역과 잠실새내역 사이에서도 체류 지점이 다수 발생하였 다. 이러한 체류 지점의 지역을 살펴보면 여가 및 업무지역에서 주로 발생하는 것으로 나타났다.
3. 분석단위 및 분석 설정
대부분의 공유자전거 연구에서는 대여소를 기준으로 분석하였다. 하지만 기존 분석단위인 대여소를 이용 해서는 체류 지점에 대한 분석이 불가능하다. 또한 GPS 데이터의 특성상 이용자가 매일 정확히 같은 지점에 멈추더라도 동일한 좌표가 생성되지 않는다. 이러한 문제를 해결하기 위해서 지점이 아닌 영역의 개념 도입 하여 체류 지점을 파악할 필요가 있다(Montoliu et al., 2013). 이에 본 연구에서는 도크리스 공유자전거 방식 에서 주로 사용되었던 격자 형식을 이용하였다. Christaller의 중심지이론에 따라 원이나 사각격자에 비해 서 로 중첩되거나 배제되는 곳 없이 균등히 분담되는 육각격자를 이용하였다. 체류 지점을 고려한 공공자전거 통행발생량을 추정하기 위해서는 자전거 통행행태에 알맞은 분석단위의 크기 설정이 필요하다. 따릉이 대여 소별 간격은 평균 300~400m 이내이며(Shim and Lee, 2019), 대여소까지 도보로 이용하기 위한 접근거리는 약 100~200m 수준으로 나타났다(Sa et al., 2020). 송파구에 위치한 대여소는 188개이며, 대여소간의 평균 간격은 약 200m 정도로 서울시 전체 평균보다 짧은 것으로 나타났다. 최종적으로 대여소별 간격과 대여소로 접근하 기 위한 도보 이용 가능 거리를 반영하여 중심간 거리가 200m인 육각격자를 분석단위로 설정하였다. 본 연 구의 분석범위인 송파구를 200m의 육각격자로 구분하면 총 1,068개의 격자로 구성된다. 이 중 공공자전거 이용이 불가능한 하천과 산, 사유지를 제거하여 총 888개의 육각격자를 분석에 이용하였다.
분석자료는 ‘국가공간정보포털(2021)’, ‘서울열린데이터광장(2022)’, ‘통계지리정보서비스(2021)’, ‘주소기반 산업지원서비스(2019)’ 등으로부터 자료를 구득하여 활용하였다. 시설물 또는 집계구 기준으로 수집된 데이 터를 분석단위에 포함되는 면적에 비례하여 인구특성, 토지이용특성, 물리적 특성 변수를 구축하였다. 자전 거도로는 서울시에서 제공하는 자전거도로와 ‘국가공간정보포털’에서 제공된 보행로와 이면도로를 결합하여 연결된 세그먼트 네트워크를 구축하였다. 서울특별시와 국토교통부에서 배포하는 「자전거 이용시설 설치 및 관리 지침」 따르면 자전거도로는 크게 자전거전용도로, 자전거전용차로, 자전거·보행자 겸용도로, 자전 거 우선도로 4개로 구성되어있다. 세부적으로 자전거전용도로의 경우 공원, 하천, 둔치 등에 독립적으로 설 치된 자전거 전용도로(독립형)와 차도 및 보도와 구분하여 설치된 일반적인 자전거 전용도로(일반형)가 있다. 자전거·보행자 겸용도로 또한 보행자와 자전거를 분리한 자전거·보행자 겸용도로(분리형)과 보행자와 자전 거가 혼합되어 같이 이용하는 자전거·보행자 겸용도로(비분리형)이 있다. 자전거전용차로는 차도의 일정 부 분을 자전거만 통행하도록 안전표지나 노면표시로 구분한 차로이다. 송파구에는 자전거 우선도로가 없는 것 으로 나타나 본 연구에서는 최종적으로 자전거 전용도로(독립형), 자전거 전용도로(일반형), 자전거 전용차 로, 자전거·보행자 겸용도로(분리형), 자전거·보행자 겸용도로(비분리형), 5개의 자전거도로를 고려하였다. 송 파구의 자전거도로별 비중은 자전거 전용도로(독립형) 5.1% , 자전거 전용도로(일반형) 14.5%, 자전거 전용차 로 1.1%, 자전거·보행자 겸용도로(분리형) 51.8%, 자전거·보행자 겸용도로(비분리형) 27.4%이다.
통행특성에 따라 세 개의 모형을 구축하였다. 선행연구와 유사하게 대여소에서 발생한 통행발생량만을 고 려한 Model 1, Model 1에 체류 지점을 추가적으로 고려한 Model 2, 체류 지점만을 고려한 Model 3으로 설정 하였다. 종속변수와 독립변수에 대한 기술통계 분석 결과는 <Table 4>와 같으며, 평균, 표준편차, 최솟값, 최 댓값을 제시하였다. 종속변수인 통행발생량은 분석단위인 육각격자에서 통행빈도를 카운트하였다. 분산팽창 계수(Variance Inflation Factor, VIF) 산출결과, 독립변수간의 다중공선성이 큰 변수는 없는 것으로 나타났다.
Ⅴ. 분석 결과
본 연구에서는 체류 지점을 고려하기 위해 육각격자의 분석단위를 도입하면서 0인 통행발생량이 많이 발 생하여 ZINB 모형을 이용하였다. ZINB 모형에서는 최대우도법을 이용하여 음이항 회귀분석과 영과잉 부분 에 대한 로짓 회귀분석이 동시에 추정된다(Kim and Lee, 2018). 종속변수는 서울시 공공자전거 통행발생량으 로 가산변수이면서 과대산포를 따른다. 먼저 체류 지점을 고려하지 않은 대여소 기종점만 반영한 Model 1만 으로 모델을 추정한다. 그런 다음 기존 대여소 기반에 추가적으로 체류 지점을 고려한 Model 2를 추정하고, Model 3에서는 체류 지점만을 고려하여 추정하였다. 추정된 결과는 <Table 5>와 같으며, 추정된 계수의 통계 적 유의성과 방향에 대한 분석에 초점을 맞췄다.
먼저, 음이항 회귀분석(Count model) 결과를 살펴보면 다음과 같다. 인구특성 변수에서 고용밀도는 Model 1과 Model 3에서 정(+)의 영향을 주고 통계적으로 유의미한 것으로 나타났으며, 추정계수는 Model 3에서 더 커 고용밀도가 공공자전거 통행발생량에 미치는 영향은 체류 지점에서 더 유효한 효과가 있는 것으로 나타 났다. 이는 주중에 고용밀도가 높은 지역에서 더 많은 활동이 나타날 수 있으며, 고용밀도가 높은 곳에서 체 류 지점이 더 많이 발생할 수 있음을 의미한다. 이러한 결과는 이전 연구(Gehrke et al., 2021;Morton et al., 2021;Noland et al., 2016)의 결과와 유사하다. 인구밀도는 모든 모형에서 통계적으로 유의하지 않았다.
토지이용 특성 변수 중에서 상업 및 업무시설 연면적은 모든 모형에서 정(+)의 관계를 가지고 통계적으로 유의한 것으로 나타났다. 이는 생활 및 고용중심지에서 통행발생량이 많은 것을 의미한다. 또한 추정계수를 보면 Model 1에 비해 Model 2와 Model 3에서 계수가 더 커 상업 및 업무시설의 연면적이 큰 지역일수록 체 류가 발생할 가능성이 커짐을 알 수 있으며, 이는 상업 및 업무시설의 연면적이 클수록 사람들의 활동이 많 이 일어나 체류 또한 많이 발생할 수 있음을 의미한다. 이러한 결과를 통해 대여소의 추가적인 확충 계획 시 생활중심지나 고용중심지에 신규 대여소의 반영이 필요하며, 대여소 설치를 통해 공공자전거 이용 활성화를 도모할 수 있다. 하지만 따릉이의 도입취지는 서울시민들의 교통편의와 건강증진을 위한 교통복지사업이다. 따라서 도입취지에 맞도록 생활 및 고용중심지가 아닌 사회적·공간적으로 소외된 곳에 공공자전거 대여소의 추가적인 설치가 필요할 수도 있을 것이다. Model 1에서 녹지 면적은 부(-)의 영향을 주는 반면, Model 3에서 는 정(+)의 영향을 주는 것으로 나타났다. 앞선 시각적 분석의 체류 지점 결과에서 보았듯이 체류 지점은 올 림픽공원과 같은 녹지에서 많이 발생하는 것을 나타낸다. 이러한 결과는 통행 중 체류를 하는 공공자전거 이 용자들은 여가 활동을 위한 공공자전거 이용과 관련이 있을 수 있다. 이는 앞선 연구(Lee et al., 2016;Jang et al., 2016)와 같이 낮시간대 도시공원에 인접한 대여소에서 여가 활동을 위해 이용률이 높은 것과 유사하다. 하천의 유무는 모든 모형에서 부(-)의 영향을 주며, 체류 지점을 고려된 Model 2와 Model 3에서만 통계적으 로 유의하다. 이에 대한 해석을 위해서는 송파구의 지역적 특성을 함께 고려해야 할 필요가 있다. 송파구에 는 한강과 탄천이 위치하나, 롯데월드타워와 올림픽공원과 같은 교통을 유발하는 시설이 위치하여 하천에 대한 영향이 상대적으로 적은 것으로 판단된다. 하천 주변의 주행궤적을 살펴본 결과, 송파구의 한강변에는 한강자전거길이 있어 한강 주변에서 일부 체류지점이 나타나나 탄천자전거길의 상부(한강~가락시장)는 강남 구에 위치하고 있어 탄천 주변에서는 체류지점이 거의 나타나지 않았다. 또한 송파구의 한강변은 올림픽대 로와 같은 자동차전용도로로 인해 접근이 어렵다. 이러한 한강변의 입지적 특성은 하천 유무에 대한 변수의 결과를 뒷받침해준다. 따라서 수변에 대한 접근 시설의 확충을 통해 수변으로 접근할 수 있는 편리한 방법을 제공하여 공공자전거 이용을 활성화하고 사람들의 신체 활동을 촉진할 수 있을 것으로 기대한다.
자전거도로 연장 중 자전거전용도로(독립형), 자전거·보행자겸용도로(분리형), 자전거·보행자겸용도로(비분 리형)는 모든 모형에서 정(+)의 영향을 주고 통계적으로 유의한 것으로 나타났다. 자전거전용도로(독립형)은 전체 연장의 비중은 적으나 계수의 크기가 크게 나타났다. 자전거의 통행만을 위해 독립적으로 설치되는 자 전거전용도로가 통행발생량에 큰 영향을 미치기 때문에 나타나는 현상으로 판단된다. 또한 자전거·보행자겸 용도로에서는 보행자와 자전거가 분리된 자전거·보행자겸용도로(분리형)의 계수가 더 높은 것으로 나타났다. 자전거전용도로(일반형)은 체류 지점을 고려한 Model 2와 Model 3에서만 긍정적이고 통계적으로 유의한 것 으로 나타났으며, 자전거전용차로는 모든 모형에서 유의하지 않은 것으로 나타났다. 이러한 결과는 자전거도 로의 연장이 공공자전거 통행발생량에 긍정적인 영향을 미친다는 연구(Mix et al., 2022;Lee et al., 2011)와 유사하며, Sa et al.(2020)에서 자전거전용도로와 자전거·보행자겸용도로를 이용한 이용자의 이용이 많은 것 과 맥락을 같이한다. 계수의 부호 및 크기에 따르면 공공자전거 통행발생량을 증진하기 위해서는 이용자의 안전성 확보가 중요한 것으로 판단된다. 따라서 지자체는 자전거도로 네트워크 공급 시 분리시설을 이용하 여 자전거 이용자의 주행안전을 향상시킬 수 있는 자전거전용도로의 우선적인 도입을 고려해야한다. 자전 거·보행자겸용도로(비분리형) 중 폭원이 넓은 경우 보행자와 자전거 이용자를 공간적으로 분리하는 자전거· 보행자겸용도로(분리형)으로 전환이 필요하다. 또한 자전거전용차로를 자전거전용도로로 전환하는 자전거 인프라의 개선이 필요하다. 따라서 자전거와 보행자, 차량 모두 안전한 통행이 가능하도록 안전시설 및 공간 확보가 필요함을 시사한다.
물리적 특성 변수에서 지하철 출입구 유무는 모든 모형에서 정(+)의 방향으로 유의한 것으로 나타났다. 이 는 지하철 출입구가 있는 지역일수록 공유자전거의 통행발생량이 크다는 것을 의미한다. 버스정류장 유무는 체류 지점을 고려한 Model 2와 Model 3에서 정(+)의 영향을 주며 유의한 것으로 나타났다. 이러한 분석 결과 는 공유자전거가 버스에 비해 지하철과 서로 밀접하게 연결되어 이용되는 것으로 해석할 수 있으며, 공유자 전거가 퍼스트&라스트 마일수단으로 역할을 하고 있음을 유추해 볼 수 있다(Noland et al., 2016;Sa et al., 2020). 따라서 통합교통서비스(Mobility as a Service, MaaS) 등을 이용한 환승할인 서비스 또는 통합요금제를 구축하여 대중교통의 연계수단으로 활발하게 이용될 수 있도록 해야될 것이며, 정책적 지원 강화가 필요하 다. 대학교의 유무는 체류 지점만을 고려한 Model 3에서만 유의하고, 정(+)의 관계를 가지는 것으로 나타났 다. 이는 송파구에 위치한 한국체육대학교 인근에 위치한 대여소에서 자전거를 대여하여 학교 내에서 이용 하며 체류가 발생했기 때문인 것으로 보인다. 서울 소재의 대학교는 강북에 다수 위치하고 있어 대학교 변수 에 대한 엄밀한 분석을 위해서는 공간적 범위의 확장이 필요할 것으로 생각된다.
영과잉 로짓 회귀분석(Zero-inflation model) 결과는 다음과 같다. 인구특성 변수에서 인구밀도는 Model 2와 Model 3에서 부(-)의 영향을 주고 통계적으로 유의미한 것으로 나타났다. 즉, 인구밀도가 낮은 지역일수록 체 류가 발생하지 않을 가능성이 더 큰 것으로 나타났다. 고용밀도는 Model 3에서만 부(-)의 관계이고 통계적으 로 유의미한 것으로 나타났다. 토지이용 특성 변수 중에서 상업 및 업무시설 연면적, 녹지면적은 Model 2과 Model 3에서 부(-)의 영향을 주고 통계적으로 유의미한 것으로 나타났다. 자전거도로 연장 중 자전거전용도 로(독립형), 자전거·보행자겸용도로(분리형)는 모든 모형에서 부(-)의 영향을 주고 통계적으로 유의한 것으로 나타났다. 자전거전용도로(일반형)은 Model 1에서만 유의하고 부(-)의 영향을 주는 것으로 나타났다. 물리적 특성 변수에서 지하철 출입구 유무는 Model 1에서만 유의하고 부(-)의 영향을 주는 것으로 나타났다. 이는 송파구에 위치한 지하철 출입구에는 인근에 모두 자전거대여소가 위치하고 있으며, 이러한 현상을 서울시로 확대해도 유사할 것으로 추정된다. 버스정류장 유무는 Model 1에서만 유의하고 부(-)의 영향을 주는 것으로 나타났다. 대학교의 유무는 체류 지점을 고려한 Model 2와 Model 3에 정(+)의 영향을 주고 유의미한 것으로 나타났다. 이는 앞선 음이항 회귀분석(Count model)과 동일한 부호로 나타났다. 이러한 이유는 송파구 내에 소재한 대학교가 한국체육대학교가 유일하기 때문인 것으로 나타났다. 따라서 인구밀도가 낮을수록, 상업 및 업무시설 연면적이 적을수록, 녹지면적이 적을수록, 자전거전용도로(독립형) 연장이 짧을수록 자전거를 이용 할 수 있는 잠재적 수요가 적어 영과잉 확률이 증가하며, 공공자전거 이용자의 체류 또한 감소하는 것으로 보인다.
Ⅵ. 결 론
탄소중립을 위해서는 무동력 수단인 공공자전거 이용 활성화가 필요하며, 이용 활성화를 위한 효율적인 정책을 수립하기 위해서 자전거 이용자의 이용행태 파악 및 정확한 통행발생량의 추정이 필요하다. 체류 지 점은 이용자가 의미있는 활동을 하기위한 장소로 통행의 기종점과 같이 이용자의 주요 활동 위치이다. 따라 서 체류 지점을 고려하여 통행발생량을 추정한다면 자전거 이용자의 이용행태를 보다 정확하게 파악하고, 공공자전거의 잠재적인 수요가 높은 지역을 파악할 수 있다. 본 연구에서는 2021년 10월 20일~22일 주중 3 일간의 서울시 공공자전거의 GPS 주행궤적 데이터를 이용하여 체류 지점을 추정하고, 체류 지점에서 통행이 발생한 것으로 집계하여 통행발생량을 추정하였다. 체류 지점을 고려하기 위하여 육각격자의 분석단위를 도 입하였으며, 육각격자 도입으로 생성된 0인 통행발생량을 분석하기 위해 영과잉 음이항 회귀분석을 이용하 였다. 전체 통행의 약 12.1%에서 체류 지점이 나타났으며, 체류가 발생한 통행은 체류가 발생하지 않은 통행 에 비해 평균 이용거리와 이용시간이 더 긴 것으로 나타났다. 체류는 비첨두 시간에 발생률이 높은 것으로 나타났다. 체류 지점은 올림픽공원 내부, 롯데월드타워와 송파구청 주변, 문정 법조단지 등에서 다수 나타나 여가 및 업무지역에 주로 발생하는 것으로 나타났다. ZINB를 이용한 통행발생량 추정 결과, 고용밀도가 높 을수록 상업 및 업무시설 연면적이 클수록, 자전거전용도로(독립형), 자전거전용도로(독립형)과 자전거·보행 자겸용도로(분리형), 자전거·보행자겸용도로(비분리형) 연장이 길수록, 지하철 출입구가 있는 지역일수록 통 행발생량이 커지는 것으로 나타났다. 또한 녹지면적이 클수록, 자전거전용도로(일반형) 연장이 길수록, 버스 정류장이 있는 지역일수록 체류가 많이 발생하는 것으로 나타났다. 이를 바탕으로 도심지 내 체류가 많이 발 생하는 위치에는 신규 대여소를 공급하고, 공원과 같은 도심지 외 지역에는 자전거 이용시설을 설치하여 이 용자의 편의를 향상시킬 수 있기를 기대한다.
하지만 본 연구에서는 몇 가지 개선되어야 할 한계점이 존재한다. 첫 번째, 주행궤적 데이터의 짧은 기간 이다. 짧은 데이터 기간은 이용자의 이용이 편향될 수 있다. 두 번째, 체류 지점의 시각화 분석을 통해 체류 지점은 올림픽공원 같이 여가를 위한 통행에서 많이 나타나는 것으로 짐작할 수 있다. 따라서 주중이 아닌 주말 데이터를 이용한다면 또 다른 특성이 나타날 수 있을 것으로 판단된다. 마지막으로 연구에서 사용한 공 공자전거 주행궤적 데이터는 이용자의 통행목적을 알 수 없어 이용자의 통행목적별 공공자전거 수요에 대한 분석이 불가능하다. 따라서 장기간에 걸친 데이터를 이용하고, 시간대별 이용자의 반복되는 통행패턴을 통해 거주지 및 활동지를 산출하고 통행목적을 추정하여 체류 지점과 함께 공공자전거 통행발생량을 예측한다면 자전거 이용자의 통행행태를 파악하는데 향상된 결과를 도출할 수 있을 것으로 기대한다.