Ⅰ. 서 론
실시간 교통 데이터를 다루는 많은 센터 시스템 에서 단순히 주어진 집계간격과 데이터 형식에 따 라 데이터베이스를 저장하고 있다. 이로 인해 향후 대용량의 장기 시계열 데이터를 기반으로 하는 교 통운영분석, 교통계획, 운영전략 등의 특정 목적에 맞는 데이터를 추출하고자 할 때 큰 어려움이 있다. 또한, 교통 데이터는 차량검지기, social network service (SNS) 등을 통해 폭발적으로 증가하고 있지 만, 수집된 교통 데이터는 저장용량 한계로 일정기 간이 지나면 파기되거나 백업장치에 백업되어지더 라도 데이터의 무결성을 보장할 수 없는 실정이다. 특히, 폭우, 폭설, 태풍, 지역 축제 등과 같은 대형 이벤트가 발생할 경우 방대한 양의 데이터가 기관 별로 산재되어 있어 효율적인 정책수립 및 대국민 서비스가 어려운 실정이다. 따라서 교통자료와 대 형 이벤트 자료의 통합 분석이 가능한 분석 시스템 구축이 필요하다.
본 연구는 교통 데이터와 다양한 대형 이벤트 데 이터를 통합한 data warehouse (DW)를 개발하여 주 제별 data mart (DM)를 구축하고 사용자가 적시에 의사결정을 할 수 있도록 지원하는 business intelligence (BI)를 개발하고자 한다. 이를 통해 대형 이벤트 발생 시 신속하고 정확한 교통정책을 수립 할 수 있도록 대형 이벤트 대응형 통합교통분석 시 스템을 개발하는데 목적이 있다.
Ⅱ. 선행 연구 검토
1. 국내 사례
정은비 등(2003)은 도로 기상정보 시스템 자료와 검지기 자료를 이용하여 강우량에 따른 속도 감소 패턴을 분석하고, 강우량에 따른 속도감소량 산출 결과를 통해 강우수준을 분류하는 기준을 제시하였 다[1]. 손영태 등(2013)은 수도권 내 고속도로를 대 상으로 기상자료와 교통자료를 수집하여 시정거리 변화에 따른 고속도로 교통류 특성변화에 관한 연 구를 수행하였다[2]. 손현호 등(2012)은 UTIS의 실 시간 교통정보와 기상정보 수집 시스템을 활용한 가변속도제한 시스템 연계방안에 관한 연구를 하였 다. 본 시스템을 연계 운영하는 방안으로 기상정보 데이터를 이용하여 적정한 가변속도를 산출하는 방 법, UTIS 정보를 이용하여 산출하는 방법 그리고 기상정보와 UTIS의 소통정보에 기상에 따른 가중 치를 부여하여 감속도를 산출하는 3가지의 방법에 관하여 연구하였다[3].
국토교통부는 도로 교통량 통계연보를 통해 매 년 교통량 조사 분석결과를 도로 등급, 구간, 차종 별로 제공하고, 구간별 연평균 일교통량, 평균 일교 통량, 발간 연도 기준 과거 5년간 통계데이터 등을 제공하고 있다. 더불어 조사된 교통 데이터를 제공 하는 시스템인 traffic monitoring system (TMS) 홈페 이지를 통해 통계 데이터 분석 서비스, 도로 등급별 교통량, 상시조사 교통량 데이터, 교통량 검색서비 스, 등 기타 교통량 통계 데이터 서비스를 제공하고 있다[4-5]. 한국도로공사는 로드플러스를 통해 고속 국도의 실시간 교통 데이터나 교통 예상데이터를 제공하고 도로공사 홈페이지를 통해 과거 교통 통 계 데이터를 제공하고 있다[6]. 서울시 transport operation and information service (TOPIS)는 실시간 승용차 교통 데이터, 버스 운행 데이터, 주요도로 소통, 돌발 상황, 경로분석 등을 제공하고 있다[7]. 서울 도시 고속도로는 실시간 영상데이터와 VMS 데이터를 통해 통행속도, 통행시간, 돌발 상황 등을 제공하고 과거 교통 통계 데이터는 구간별 소통, 돌 발 통계 데이터, 사망사고 다발구간으로 나누어 제 공하고 있다[8]. 안산시 교통 데이터는 서울도시고 속도로와 같이 실시간으로 통행속도, 소통상황 등 을 제공하고, 주요도로의 과거 10년간의 기종점, 평 균속도, 소요시간, 평균 일교통량 데이터를 제공하 고 있다[9].
2. 국외 사례
캘리포니아 performance measurement system (PeMS)은 실시간 교통 데이터인 통행속도, 돌발 상 황 등을 제공하고 과거 교통통계 데이터를 시계열 및 표 형태로 제공한다[10-11]. 버지니아 archived data user service (ADMS)는 현장에서 수집된 원시 데이터를 여러 가지 형태(SML, CSV, PDF)로 데이 터를 제공하고, 수집된 데이터의 품질과 운영 상태 및 사고데이터를 제공하고 있다. 그리고 현재 도로 의 서비스 수준과 교통량을 통해 예측 교통량 및 서비스 수준을 제공하고 데이터를 분석할 수 있다 [10-11]. 워싱턴 transportation research center (TRAC) 는 워싱턴 주 인근의 항공지도 데이터와 CCTV 위 치 및 화면데이터를 제공하고 있으며, 이용자는 원 하는 검지기의 시간대별 원시 데이터 검색이 가능 하다[12]. 뉴욕 My511NY는 뉴욕시 인근의 실시간 영상데이터, 경로분석, 주요도로 소통데이터, VMS 데이터를 제공하고 1개월 이전의 돌발 상황 데이터 및 장래 10개월 이내의 공사, 이벤트 계획 데이터를 제공하고 있다[13]. 그 밖에도 economic and social commission for asia and the pacific (ESCAP)은 전 세 계 국가에 대해 교통 통계 데이터를 제공하고 있다 [14]. united nations economics communication for europe (UNECE)은 유럽 국가별로 주행거리 등의 교 통 통계 데이터를 제공하고 PDF 형식으로 다운로 드 할 수 있다[15]. north america transportation statistics (NATS)는 미국, 캐나다, 멕시코 세 국가의 교통 통계 데이터를 제공하고 있다[16].
3. 본 연구의 차별성
기존 사례를 살펴보면 실시간 교통 데이터 위주 로 제공하고 있다. 과거 시계열 데이터를 제공하는 경우에는 도로의 범위가 제한적이거나 기간이 몇 개월 또는 며칠간으로 짧은 경우가 많다. 이용자가 원하는 데이터를 찾기 힘들고, 찾더라도 파일 다운 로드 후 직접 원시 데이터를 가공해야하는 어려움 이 있다. 또한, 평균이나 합계 등과 같은 1차원적인 분석 형태의 데이터만 제공하여 교통량과 다른 외 부요소 관계에 대한 통합 데이터를 얻기가 어려운 경우가 많다.
본 연구에서는 장기간의 교통 데이터와 대형 이 벤트 관련 데이터를 통합한 DW를 구축하여 다양하 고 고차원적인 교통분석이 가능한 시스템을 개발하 고자 한다. 교통정책 수립 시 정책 결정자에게 필요 한 요약되고 정제된 교통 분석 자료를 제공하고자 하며, 신속하고 정확한 교통정책을 수립할 수 있는 BI 시스템을 개발하고자 한다.
Ⅲ. 통합교통분석 시스템 개발
1. 데이터웨어하우스 개발
1) 데이터 웨어하우스 개발 방향
교통 분석 시스템은 이용자 관점에서 교통 데이 터와 대형 이벤트 데이터를 통합한 데이터를 보다 쉽고 편리하게 요약된 데이터로 제공되어야 한다.
대형 이벤트는 지역 축제, 기상, 재해·재난, 유가 상승으로 정의한다. DW의 구성 목록으로 먼저 교 통 데이터는 교통량, 차종비율, 주행거리, 보정계수 등 국토교통부에서 운영하고 있는 TMS 교통 데이 터를 활용한다. 지역 축제 데이터는 국내 주요 지역 축제를 선정하여 축제 이력과 축제 영향 도로 데이 터를 사용한다. 기상 데이터는 강우량, 적설량, 태 풍, 기상관측 지점 데이터 등을 기상청과 국가태풍 센터를 통해 수집한다. 재해·재난 데이터는 국가재 난정보센터를 통해 수집한다. 마지막으로 유가 데 이터는 한국석유공사(오피넷)를 통해 수집한다.
<그림 1>은 위에서 구성된 DW의 데이터를 활용 한 다양한 분석을 통해 이용자에게 제공하는 정보 를 나타낸다.
2) 데이터 웨어하우스 설계
DW는 목적에 부합하는 다양한 데이터를 수집하 고 통합하여 저장하는 기능을 수행한다. 이렇게 저 장된 데이터는 특정목적을 위해 요약된 정보를 이 용자들이 검색할 수 있도록 DM 구축 과정을 거쳐 신속하고 정확하게 의사결정을 할 수 있도록 분석 정보를 제공하게 된다. <그림 2>는 데이터 웨어하 우스의 구조를 나타낸다. 크게 4개 부문으로 구성 되는데, 데이터 수집 부문, 데이터 통합 및 축적 부 문, 이용자를 위한 데이터 저장 부문, 데이터 분석 및 활용 부문이다. 데이터 수집은 최근에는 주로 영 상검지기, 루프검지기 등을 통해 이루어진다. 데이 터의 수집 및 축적과 이용자를 위한 데이터 저장은 교통정보센터 내 시스템을 통해서 이루어진다. 데 이터 분석 및 활용은 각종 교통 알고리즘과 웹 등 을 통해 이루어진다.
본 연구에서는 다차원 모델링을 통해서 다양한 분석이 가능하도록 사실 테이블과 차원 테이블을 구성한다. 테이블이 구성되면 데이터를 저장하는 구조와 표현법을 정의하기 위하여 스키마 방식을 선정한다. 스키마 방식은 일반적으로 스타 스키마 방식과 스노우 플레이크 스키마 방식이 있다. 본 논 문에서는 DW 설계 방법으로 스노우 플레이크 스키 마 방식을 선정하였다. 스노우 플레이크 스키마 방 식은 대용량 데이터 처리를 지원하고, 데이터 무결 성이 높은 수준에서 유지되며, 정규화 된 구조에 의 해 갱신 및 유지를 쉽게 할 수 있다. 그리고 이 방 식은 차원 요소(연도, 월, 분기, 지점 그룹 등)마다 1 개의 차원 테이블을 가지고 있고, 각 차원 테이블은 정규화가 명확히 되어 있어 중복이 최소화 된다. 따 라서 테이블의 크기도 크지 않다. 스노우 플레이크 스키마에서는 스타 조인이라고 하는 여러 개의 작 은 테이블(축제 이력, 기상 관측 지점 등)과 한 개 의 큰 테이블(교통량, 강우량, 적설량 등)을 통합하 는 형태로 수행된다.
3) 데이터 웨어하우스 구축
DW에 통합할 데이터를 선정하기 위해 교통 데 이터와 대형 이벤트 데이터에 대한 교통 특성 분석 을 거쳐 최종적으로 관련성이 높은 데이터를 추출 하고 DW를 구축한다. 교통 특성 분석을 위해 소프 트웨어 R을 사용하였다. 분석 프로세스는 <그림 3> 과 같이 5단계로 진행한다.
먼저, 지역 축제는 축제 주변 도로의 노선을 선 정하여 노선별 조사 지점을 추출하고 해당 조사 지 점의 축제 개최 기간 전후의 교통패턴 변화를 분석 한다. 선정된 축제의 종류는 다음과 같다.
기상 데이터는 강우량, 적설량, 태풍의 기상 여부 와 차종별 교통량 변화의 관계를 파악한다. 강우량 등급은 0 mm, 0~20 mm, 20~40 mm, 40~60 mm, 60 mm 이상의 5개 등급으로 구분하고, 적설량 등급은 0 cm, 0~2 cm, 2~5 cm, 5~10 cm, 10 cm 이상의 5개 등급으로 구분한다. 관측지점은 강릉시, 강진군, 경 주시 등 83개 지점이다. 재해·재난은 강풍, 대설, 태 풍, 호우로 구분하여 지역별 발생 여부와 교통량의 변화를 비교 분석한다. 발생 연도, 발생 월, 발생 일, 순서, 재해·재난명, 지역, 피해 여부(0/1)로 구성 된다. 마지막으로 지역별 유가 변동과 교통량 변동 추이를 비교 분석한다.
이러한 교통 특성 분석을 거쳐 최종적으로 관련 성이 높은 데이터를 추출하고 DW에 구축된 다양한 데이터가 교통 정책수립에 활용될 수 있도록 주제 별 DM를 구축한다. 교통 데이터와 대형 이벤트 데 이터가 통합된 DM는 <표 2>와 같다. 구축된 주제 별 DM 데이터는 활용 가능하도록 TMS 서버에 저 장된다.
4) 대형 이벤트 관련 교통 특성 분석
(1) 지역 축제
최근 5년 간 지역 축제 시 교통량 변화를 평일과 휴일로 구분하여 비교 분석한 결과, 2010년 화천 산 천어축제 시 교통량 증가율이 평일 45.7%, 휴일 45.6%로 가장 높은 것으로 분석된다. 교통량 증가 율이 가장 낮은 지역 축제는 안동 하회탈축제로서 평일은 최대 5.5%(2011년), 휴일은 최대 13.3%(2012 년)로 분석된다.
(2) 기상
기상 데이터는 강우량, 적설량, 태풍데이터로 구 성된다. 강우량, 적설량 데이터는 기상청으로부터 수집하며, 태풍 데이터는 국가태풍센터로부터 수집 하였다.
강우량 등급에 따른 교통량 변화를 분석한 결과, 전체적으로 강우 시 평균 3.99% 감소하며, 2등급 (0~20mm) 강우 시 4.14%, 3등급(20~40mm) 강우 시 4.33%, 4등급(40~60mm) 강우 시 3.11%, 5등급 (60mm 초과) 강우 시 2.25% 감소하는 것으로 분석 된다.
적설량에 따른 교통량 변화를 분석한 결과, 전체 적으로 눈이 올 경우 평균 12.34% 감소하며, 2등급 (0~2cm) 적설 시 8.14%, 3등급(2~5cm) 적설 시 12.50%, 4등급(5~10cm) 적설 시 18.70%, 5등급(10cm 초과) 적설 시 48.39% 감소하는 것으로 분석된다.
태풍 발생에 따른 교통량 변화를 분석한 결과, 태풍 발생 시 전체적으로 평균 6.95% 감소하는 것 으로 분석된다. 교통량이 가장 많이 감소한 연도는 2008년으로 상행 10.49%, 하행 10.18% 감소하는 것 으로 분석된다.
(3) 재해·재난
재해·재난을 강풍, 대설, 태풍, 호우로 구분하여 지역별 발생 여부와 교통량의 변화를 비교 분석하 였다. 재해·재난 데이터는 국가재난정보센터에서 제공하는 데이터(2007~2012년)를 바탕으로 발생 연 도, 발생 월, 발생 일, 순서, 재해·재난명, 지역, 피해 여부로 구성된다. 지역별 교통량을 재해·재난 발생 여부에 따라 감소율을 파악하여 재해·재난이 교통 량에 미치는 영향을 파악한다.
강풍 발생 시 지역별 교통량 변화를 살펴보면, 전북 지역이 3.55% 감소하여 가장 크게 감소한 것 으로 분석된다. 한편 강원 지역은 0.89% 증가하는 것으로 분석되어 강풍과 교통량과의 상관관계가 낮 은 것으로 판단된다.
대설은 대부분 12월에서 다음 해 3월에 발생하였 으며, 대설 발생 시 교통량은 2.91~9.06% 감소하는 것으로 분석된다. 교통량 감소율은 강원 지역이 9.06%로 가장 크고, 경남 지역이 2.91%로 가장 작 은 것으로 분석된다.
태풍 발생 시 교통량의 변화 분석 결과, 평균적 으로 전 지역의 교통량이 감소한 것으로 분석된다. 강원도의 경우 평균 12.03%로 가장 많이 감소하며, 연도별 감소율을 분석한 결과 2012년도가 가장 많 이 감소한 것으로 분석된다. 특히, 2012년 강원도의 경우 34.51%로 가장 크게 감소한 것으로 분석된다.
호우 발생 시 지역별 교통량 변화를 살펴보면, 호우 발생 시 교통량은 1.43~4.81% 감소하는 것으 로 분석된다. 교통량 감소율은 강원 지역이 4.81% 로 가장 크고, 경북 지역이 1.43%로 가장 작은 것으 로 분석된다.
(4) 유가
최근의 유가 변동과 교통량 변화 추이를 비교 분 석하였다. 최근 4년간(2009~2012년) 휘발유와 경유 의 가격은 유사한 패턴으로 꾸준히 증가하는 추세 이다. 지역별 유가 변동에 따른 교통량 분포를 분석 한 결과, 전북, 충남 지역은 유가 상승 시 교통량이 감소하는 것으로 나타나며, 그 외 지역은 교통량이 증가하거나 변동이 없는 것으로 나타났다. 휴가철 에는 교통량이 급증하는 등 계절적 특성이 강하며, 지역별 행사의 영향을 받는 등 여러 요소가 복합적 으로 작용하는 만큼 유가 정보만 가지고 교통량의 변화량을 분석하는 데에는 어려움이 있는 것으로 판단된다.
2. BI 시스템 개발
1) BI 시스템 화면 설계
BI는 구축된 DW를 통해 교통 데이터를 분석하 여 다양한 서비스 및 교통 정책결정을 위한 콘텐츠 를 생성하고, 정의된 항목에 대한 리포트를 통계 테 이블 및 그래프 형태로 산출하여 이용자의 의사결 정을 위한 정보를 제공하는 application과 technology 의 통합 정보체계이다. 또한, 대용량 데이터 처리나 다양한 그래프 등을 제공하는 분석 도구와 수집된 데이터에 대한 다양한 요구분석 결과를 이용자가 원하는 지관적인 결과물로 제공하는 리포팅 도구로 구성되며, 두 개의 도구와 하나의 시스템이 서로 연 동하여 기능을 수행한다. 이 시스템을 이용하는 자 는 정책 결정자, 교통 전문가, 센터 운영자 및 관리 자로 구분한다. 이용자별 성향은 다음과 같이 정의 할 수 있다.
BI 시스템 화면으로 교통 데이터에 대하여 혼잡 도 캘린더, 우회도로 비교 교통정보, 소통상황 요약 기능 등 다양한 교통정보 제공을 위한 주기적인 콘 텐츠를 제공받을 수 있다. 먼저 chart를 설계하여 단 순히 데이터를 수치로만 확인하는 것이 아니라 시 각적으로 쉽게 표현이 가능하도록 하여 다양한 관 점으로 데이터를 확인할 수 있도록 한다. 두 번째로 filter를 만들어 사용자가 데이터 중에서 일부분만을 보고 싶을 때, filter panel을 사용하여 데이터를 필 터링할 수 있게 한다. 마지막으로 화면 layout을 설 계하여 page tab, filter, chart와 table에 사용 되어진 데이터 요약 정보를 기준으로 생성할 수 있게 한다.
2) BI 시스템 화면 구축
BI 시스템 화면 개발을 위한 솔루션으로 이 연구 에서는 spotfire를 활용하였다.
<그림 4>와 같이 기상 데이터와 교통 데이터를 통합 분석한 화면을 보면 filtering 기능을 통하여 수 집연도, 관측도명, 장비ID 선택 시 강우량 등급에 따른 교통량 분석 결과를 scatter plot으로 표현된다. 원의 크기가 클수록 강우량이 높음을 표시하며, 원 의 색으로 기상의 형태를 표시하는 것을 알 수 있 다. <그림 4>는 한 예로서 경기도 고양시에 위치한 10006지점의 2011년도 강우량과 교통량과의 관계를 도로 방향별(1=상행, 2=하행)로 나타내고 있다.
<그림 5>는 축제 명, 축제연도, 노선번호, 지점 고유번호 선택 시 축제와 관련 있는 도로의 지점에 대한 차종별 교통량 변화를 bar chart로 표현하는 것 을 볼 수 있다. 이 밖에도 유가 상승에 따른 교통량 이나 재해·재난으로 인한 교통량 분석 결과를 화면 으로 나타낼 수 있다. <그림 5>는 한 예로서 최근 5 년 간 경주 벚꽃축제 시 차종별 교통량 변화를 도 로 방향별(1=상행, 2=하행)로 나타내고 있다.
3) 검증
개발된 DW와 BI 시스템 화면이 잘 연동되어 나 타내어지는 지에 대한 검증을 실시하였다. 이는 데 이터 import 성능 테스트, dxp file loading 테스트, filtering 테스트, file과 image export 테스트를 통해 이루어졌다. 원시 데이터와 spotfire에 호출되어진 데이터를 비교하고 원시 데이터와 chart에 표현된 값을 비교하였다. 검증 결과 개발된 화면에 대해 이 상 없이 표출되었다.
Ⅴ. 결론
기존 교통분석 시스템들은 공간적, 시간적 제한 이 있었고 1차원적인 교통 데이터만 제공하여 이용 자가 신속하고 정확한 교통정책을 수립하는데 어려 움이 있음을 인식하였다. 이를 해결하고자 교통분 석 시스템 사례조사 및 한계점 분석 결과를 기초로 통합교통분석 시스템을 개발하였다.
본 논문에서 개발한 데이터 웨어하우스 기반의 통합교통분석 시스템은 DW를 통해 다양한 데이터 를 저장하여 BI 시스템 화면을 통해 쉽고 편리하게 데이터를 획득할 수 있었다. 이에 따라 웹, 모바일 등을 통해 이용자가 원하는 요약되고 정제된 정보 를 제공하고 그 밖에도 데이터를 관리하는 중앙부 처 및 지자체에 시스템을 구축하게 한다면 대형 이 벤트 시 신속하고 정확한 정책 결정으로 효율적이 고 경제적인 국가 정책을 수립할 수 있을 것으로 기대된다. 더 나아가 원하는 정보의 직접 접근 및 결과 도출을 위한 BI 시스템 도구인 on-line analytical processing(OLAP)과 각각의 데이터들을 연 계하여 관리할 수 있는 extraction transformation loading(ETL) 시스템과 도로 및 교통 정책지표 산출 을 위한 key performance index(KPI) 시스템도 개발 되어야 할 것이다.