Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.21 No.4 pp.78-95
DOI : https://doi.org/10.12815/kits.2022.21.4.78

Development of Predicting Model for Livestock Infectious Disease Spread Using Movement Data of Livestock Transport Vehicle

Woong Kang*, Jungyeol Hong**, Heehyeon Jeong***, Dongjoo Park****
*Dept. of Industrial and Management Engineering, Korea University
**Dept. of Transportation Engineering, Keimyung University
***Public and Private Infrastructure Investment Management Center, Korea Development Institute
****Dept. of Transportation Engineering, University of Seoul
Corresponding author : Dongjoo Park, djpark@uos.ac.kr
14 April 2022 │ 2 May 2022 │ 6 July 2022

Abstract


The result of previous studies and epidemiological invstigations for infectious diseases epidemic in livestock have shown that trips made by livestock-related vehicles are the main cause of the spread of these epidemics. In this study, the OD traffic volume of livestock freight vehicle during the week in each zone was calculated using livestock facility visit history data and digital tachograph data. Based on this, a model for predicting the spread of infectious diseases in livestock was developed. This model was trained using zonal records of foot-and-mouth disease in Gyeonggi-do for one week in January and February 2015 and in positive, it was succesful in predicting the outcome in all out of a total 13 actual infected samples for test.



가축관련 운송차량 통행 데이터를 이용한 가축전염병 확산 예측모형 개발

강 웅*, 홍 정 열**, 정 희 현***, 박 동 주****
*주저자 : 고려대학교 일반대학원 산업경영공학과 석사과정
**공저자 : 계명대학교 도시학부 교통공학과 조교수
***공저자 : 한국개발연구원 공공투자관리센터 연구원
****교신저자 : 서울시립대학교 교통공학과 교수

초록


아프리카 돼지열병, 구제역 등 가축전염병 유행과 관련된 기존의 연구 결과에서 가축전염병 확산의 주요 원인으로 축산 관련 차량 통행을 지목하는 경우가 많다. 이에 본 연구는 경기도 내 축산시설의 차량 방문이력 데이터와 화물차량의 디지털 운행기록계 데이터를 결합하여 각 읍면동의 주중 축산 화물차량 OD 통행량을 구한 후, 이에 기반한 가축전염병 확산 예측모형을 개발하였다. 모형은 2015년 1~2월 당시 주차별 구제역 발병기록을 이용하여 훈련되었으며, 긍 정적 시나리오 기준으로 검증용 감염 표본 13개의 감염을 모두 예측해내는 데에 성공했다.



    Ⅰ. 서 론

    1. 연구 배경 및 목적

    2018~2019년 전 세계적인 아프리카돼지열병 유행사태 등 가축 관련된 전염병 유행이 국내 및 국외에 빈 발함에 따라 가축전염병 유행 및 방역의 사회적 비용으로 인한 피해가 누적되고 있다. 파주시에서 발표한 자 료에 의하면, 아프리카돼지열병 방역을 위해 2019년 9월부터 11월까지 3달간 농가 111개소의 양돈 125,878두 에 대하여 수매 또는 살처분을 시행하였으며, 이로 인해 약 812억 원의 경제적 손실이 발생했다.(Paju City, 2020) 한국농촌경제연구원(Korea Rural Economic Institute, 이하 KREI)에 따르면, 2014~2015년 내 구제역 유행 을 조사한 결과, 147일의 유행 기간 내 구제역 발생 건수는 185건, 살처분 두수는 172,798마리, 재정 소요액 은 약 638억 원으로 밝혀졌다.(KREI, 2016) 이처럼 가축전염병 유행으로 인한 피해 및 사회적 비용 소모가 비대해짐에 따라, 가축전염병에 대한 방역이 국내외에서 주목받는 이슈로 대두되고 있다. 세계동물보건기구 (The World Organization for Animal Health, 이하 OIE)의 경우, 가축전염병 확산 방지 및 대응을 위해 매년 위 험 전염병을 선정하여 중점적인 연구를 수행함으로써 가축전염병 확산의 예방 및 통제에 노력을 기하고 있 다.(Mansour et al., 2015)

    가축전염병에 대한 관심이 높아지는 것과 별개로, 현행 방역 절차는 정량화된 가이드라인을 따르고 있지 않다. 국내 구제역 방역 실시요령에 따르면, 가축전염병 발병지점으로부터의 거리에 따라 일괄적으로 이동 제한 처분 또는 살처분을 적용하고 있는데,(Korea Law Information Center, 2022) 이에 따라 가축전염병 감염 위험성이 없음에도 살처분에 처해지는 농가가 상당수 발생하였다. 2017년의 가축전염병 피해액은 전체 국내 사회재난 피해액의 약 76% 달하는 830억 원이며, 이 중 대부분은 살처분으로 인하여 발생했다.(Gho, 2018) 가축전염병 유행으로 인하여 발생하는 사회적 비용 소모를 줄이기 위해서는 정량화된 기준에 따른 가축전염 병의 예방 및 방역 시행이 필수적이다. 본 연구는, 많은 문헌에서 가축전염병 확산의 주요 원인으로 지적하 고 있는 축산 관련 차량 이동을 활용하여 가축전염병 예방 및 방역의 정량화된 기준을 마련하고자 한다.

    2. 선행연구 고찰

    대다수의 연구에서는 차량 통행과 그로 인한 가축과 관련된 이동이 가축전염병 전파의 주요한 요인임을 지적하고 있다. Lee et al.(2010)는 2010년 1월 안동발 구제역 당시 농장 고용인 또는 축산업 종사자의 통행과 사료 및 집유 차량의 통행이 주요 전파 요인임을 밝혔다. KREI(2016)는 2014~2015년 구제역 유행에 대한 역 학조사 결과, 구제역 발생 건수 185건에 대하여 약 78.9%에 해당하는 146건에 대하여 구제역 바이러스 유입 의 주된 경로가 차량임을 밝혀냈다. 국외의 여러 연구에서도 가축전염병 전파의 주요 원인으로 가축과 차량 의 이동을 지적했다. 유엔식량농업기구(Food and Agriculture Organization)는 가축 이동 환경이 가축들에게 장 기간의 스트레스를 주는 등의 요인으로 가축전염병 전파에 최적임을 밝혔다.(Gregor, 2007) Lowe et al.(2014) 는 미국 내 돼지유행성설사(Porcine epidemic diarrhea virus; PEDV) 발병 당시 돼지를 운반했던 트럭에서 채취 한 샘플을 토대로 다수의 가축전염병 전파가 차량을 통한 이동과정에서 발생했음을 밝혔다. Ferguson et al.(2001)은 2001년 2월 영국에서 시작된 구제역 유행의 주요 원인 중 하나로 가축의 장거리 이동을 꼽았다.

    해외의 경우, 가축전염병 전파 확산을 방지하기 위하여 가축과 축산차량 이동에 관한 데이터를 수집하고, 이를 토대로 한 사전 예방책을 수립하는 연구를 다수 수행한 바 있다. 영국의 경우, 동물식물보건국(Animal and Plant Health Agency)에서 가축전염병 정보 수집 체계(Rapid Analysis and Detection of Animal-Related Risks, 이하 Radar)를 구축하였다. RADAR의 데이터는 돼지 이동 및 배치 패턴에 대한 네트워크 분석에 기반 한 가축전염병 감시 및 통제전략의 수립 등 가축과 축산차량의 이동에 관한 연구에 적극적으로 활용되고 있 다.(Guinat et al., 2016) RADAR 구축 이전에도 가축전염병 확산과 축산 관련 통행의 관계를 규명하려는 시도 가 발견되었다. Shirley and Rushton(2005)의 연구는 2001년 영국 내 구제역 사례를 바탕으로, 가축 이동 네트 워크에서 유통을 담당하는 일부의 노드가 구제역 확산에 결정적인 역할을 함을 밝히며, 사전에 가축 이동이 집중되는 위험시설에 대한 예방을 정책적으로 수행할 것을 촉구하였다. 덴마크에서도 이와 같은 연구가 진 행된 사례가 다수 있었다. Mwew et al.(2013)는 덴마크의 가축 등록정보를 통해 2000년부터 2009년까지 10년 동안 덴마크 내 50,494개의 축산시설에서 4,204,895개의 개별 이동을 분석하였다. 또한, 이를 통해, 가축전염 병 확산 통제 조치는 가축과 관련된 이동이 집중되는 곳에 초점을 맞추어 진행되어야 한다고 말했다. 국내 법령에서도 감염 의심 지역에 대해서 차량 통행 제한 및 소독시설 설치 등을 규정하고 있으나, 감염 의심 지 역을 도출하는 데에 있어서 정량적인 기준이 없다는 한계를 가진다. 국가가축방역통합시스템(Korea Animal Health Integrated System, 이하 KAHIS)에서 축산시설 출입을 기준으로 축산차량 통행을 집계하고 있으며, 축 산차량 통행이 집중되는 허브 시설을 도출하는 등(Lee et al., 2018)의 연구도 진행되었으나, 실제 방역 시행 시 지역별 방역역량 투입 우선순위 선정 기준 미비하다.

    3. 연구의 주요 내용

    이에 따라 본 연구는 축산시설 방문이력 데이터의 축산차량 및 축산시설 정보와 DTG 데이터의 화물차량 통행 이력을 매칭하여 행정구역 단위로 축산차량 통행을 정량화하였다. 이러한 과정을 통해 정량화된 축산 차량 통행과 기존의 방역 기준이었던 감염원으로부터의 접근 수준을 모두 고려하여 가축전염병 확산을 예측 하는 로지스틱 회귀모형을 개발하였다. 분석의 범위는 다음과 같다. 분석대상 전염병은 전염성이 강하면서 사회적 비용 소모가 큰 구제역이다. 분석의 공간적 범위는 2015년 구제역 유행 당시 주요 유행 지역이자 주 요 축산시설이 밀집된 경기도이다. 개인정보 특성상 구제역 등 가축전염병 발생정보에 농장 소재지는 동, 리 단위로 수록되어 있어 농장 단위의 표본 수집이 불가한 관계로 읍면동 단위로 표본을 수집하였다. 각 주차에 각 읍면동에서 하나의 농장에서 한 마리의 가축이라도 발병한 기록이 남아있으면, 해당 읍면동은 전 주차에 감염된 것으로 취급하였다. 분석의 시간적 범위는 2015년 경기·충청권 구제역 유행기 중 일부 기간인 2014년 12월 28일부터 2015년 2월 28일까지의 기간이다. 해당 기간은 63일 9주에 이른다. 잠복기가 개체별로 다른 특성상 하루 단위의 전파 예측이 어렵다고 판단되었다. 따라서 시간적인 전염병 전파 패턴이 비교적 뚜렷한 일주일 단위로 표본을 수집하였다.

    Ⅱ. 데이터 분석 방법론

    1. 데이터 분석 방법론 개요

    <Table 1>은 본 연구의 시간적 범위인 2014년 12월 28일부터 2015년 2월 28일까지 63일, 9주 동안 경기도 내 전체 구제역 발병 횟수를 주차별로 정리한 표이다. 이에 따르면, 2014년 12월 28일부터 2015년 1월 31일 까지 1주일 평균 구제역 발병 횟수는 4.2회, 2015년 2월 1일부터 2015년 2월 28일까지 1주일 평균 구제역 발 병 횟수는 2.0회로, 2월의 1주일 평균 구제역 발병 횟수가 1월 대비 약 47.6% 수준에 불과하다. 2015년 1월과 2015년 2월의 1주일 평균 구제역 발병 횟수 차이가 방역 시행 때문에 발생한 것인지 알아보기 위하여, “경기 도 구제역”을 키워드로 하여 각 시기에 맞게 인터넷 기사 자료를 크롤링 후, 텍스트 언급 빈도 상위 20개 키 워드를 확인하였다.

    <Table 1>

    Number of outbreaks of foot and mouth disease(FMD) per week

    KITS-21-4-78_T1.gif

    이후 축산차량 통행을 계량하기 위해서 KAHIS에서 제공한 축산시설 방문이력 데이터와 한국 교통공단에 서 제공한 디지털운행기록(Digital Tachograph, 이하 DTG) 데이터를 활용하였다. 데이터의 시간적 범위는 분 석대상 기간과(2015년 1~2월) 동일한 계절인 겨울의 주중 통행량을 계산하기 위해 2017년 12월 4일 월요일 부터 2017년 12월 8일 금요일까지로 설정하였다. 2017년 전국화물통행실태조사 결과에 따르면 화물차량의 주말 통행량은 37,163대 중 5,594대로, 약 15% 정도에 불과하다. 따라서 분석의 효율성을 위해 주중 통행량 에 한정하여 축산차량 통행을 계량하였다. 이후 KAHIS에서 제공하는 법정가축전염병 발생현황(2014년 12월 28일~2015년 2월 28일, 동리 단위 주소 수록)을 축산차량 통행에 매칭하여 감염 차량 통행량 및 통행 거리를 을 탐색 후 읍면동 단위로 집계했다. 이후, 감염 차량 통행량에서 통행 거리를 나눗셈함으로써, 읍면동별 통 행 거리 보정 감염 축산차량 통행량을 구했다. 또한, 감염원이 되는 읍면동으로부터 접근성을 고려하기 위하 여 좌표 정보를 이용하여 각 읍면동 centroid로부터 감염 읍면동의 centroid까지 직선거리를 계산 후, 각 개체 의 관측치를 최댓값에서 뺄셈하는 방식으로 감염원으로부터 접근성을 정량화하였다.

    이렇게 집계된 주차별 각 읍면동의 통행 거리 보정 감염 축산차량 통행량과 감염원으로부터의 접근성을 독립변수로, 2015년 1~2월 간 각 읍면동의 가축전염병 전파 여부를 종속변수로 하여 희귀표본 로지스틱 분 석을 시행하여 모형을 훈련했다. 이때, 인터넷 기사 텍스트 마이닝을 통해 구분한 확산 시기와 방역 시기에 서 1~2주는 모형 훈련 데이터, 3~4주는 모형 검증 데이터로 활용했다.

    본 연구는 농장, 사료공장, 집유장 등 축산 관련 시설이 밀집된 지역인 동시에, 2015년 구제역 유행 당시 주요 피해지역인 경기도를 공간적 범위로 설정했다. 또한, 2014년 12월 28일부터 2015년 2월 28일까지 63일, 9주를 시간적 범위로 설정하여 1주일 단위로 가축전염병 유행을 모사하였다. 각 읍면동의 분포 현황을 확인 하고 가축전염병 확산을 시각화하기 위하여 행정안전부에서 제공하는 행정구역도를 활용하였다. 2014년 12 월 28일부터 2015년 1월 24일까지 1월 1~4주, 그리고 2015년 2월 1일부터 2015년 2월 28일까지 2월 1~4주의 읍면동 단위 감염 확산은 <Fig. 1>에 나타난 바와 같다.

    <Fig. 1>

    FMD spread pattern for each zone by week in January and February 2015

    KITS-21-4-78_F1.gif

    2. 유행 시기 분할

    2014년 12월 28일부터 2015년 1월 31일까지, 그리고 2015년 2월 1일부터 2015년 2월 28일까지 두 개 기간 내에 네이버 뉴스 기사를 대상으로 “경기도 구제역”을 키워드로 웹 크롤링을 진행하였다. 크롤링된 인터넷 기사 텍스트 데이터에서 언급 빈도 상위 20개 키워드를 <Table 2>1)와 같이 도출하였다. 분석 결과, 1월의 기 사 수는 1,144개로, 2월의 251개에 비해 4.56배 많았으며, 이를 통해 구제역으로 사회 전반의 가축전염병 방 역에 대한 관심이 2월과 비교하여 1월에 더 높았음을 짐작할 수 있다. 1월의 경우 금지, 의심, 확진, 추가 등 직접적인 유행 확산 및 통제와 관련된 단어가 많이 언급되고 있다는 점에서 유행 확산 정보 전달과 관련된 언급이 많음을 짐작할 수 있다. 반면, 2월에는 ai와 같이 다른 질병에 대한 언급이나 결과, 방역 등 방역으로 인한 효과와 관련된 단어가 많다는 점에서 다른 질병과 비교 또는 방역 지침의 효과에 대한 언급이 많음을 짐작할 수 있다. 따라서, 본 연구는 2014년 12월 28일부터 2015년 1월 31일까지의 기간을 확산 시기, 2015년 2월 1일, 2015년 2월 28일까지의 기간을 방역 시기로 보고 분석을 진행하였다.

    <Table 2>

    Result of web crawling

    KITS-21-4-78_T2.gif

    3. 원시 데이터 전처리

    원시 데이터를 전처리하는 과정은 동일한 유형의 데이터를 사용하는 선행연구를 참조하여 본 연구에 맞 게 변형하여 적용하였다. (Jeong et al., 2021) 선행연구의 데이터 전처리 방법론이 적용된 데이터는 DTG 데이 터와 축산시설 방문이력 데이터의 두 가지가 있다.

    1) DTG 데이터

    DTG 단말기는 국내 모든 영업용 차량의 Trip key, 차량 번호, 차대번호, 속도, 가속도, 차량 위치 등 차량 및 운행 정보 20여 가지를 1초 단위로 기록하여 저장한다. 이 중 분석에 사용될 변수인 Trip key, 차량 종류, 속도, 경도 좌표, 위도 좌표, 이동 시간의 5개 변수를 <Table 3>과 같이 추출하였다. 2017년 12월 1달 동안 집계된 약 400억 행의 데이터 중 차량 종류가 영업용 화물차량 또는 개별 화물차량에 해당하는 2,499,788행 데이터를 추출하였다. 이 중, 축산시설 좌표 기준으로 반경 100m 이내에서 5분 이상 정차한 차량을 축산 화물차량으로 가정하여 추출하였으며, 해당 차량이 5분 이상 정차한 축산시설에 따라 축산시설 기종점을 매칭하였다.

    <Table 3>

    Structure of DTG data

    KITS-21-4-78_T3.gif

    2) 축산시설 방문이력 데이터

    축산시설 방문이력은 각 차량의 시설 방문 시점을 기준으로 방문 시간, 차량 번호, 시설 유형, 시설 주소, 적재 축종, 방문 목적 등을 기록한다. 2017년 12월 4일부터 2017년 12월 8일까지 기간 내 기록된 데이터는 총 12,348,940행이며, 이 중 경기도를 기·종점에 포함하는 2,116,905행의 데이터를 추출하였다. 차량 번호는 임의의 key 값을 부여하여 변환하였다. 또한 각 축산시설의 주소를 기준으로 geocoding하여 경·위도 좌표를 찾아낸 후 구분을 위하여 시설 key값을 부여하였다. 전처리 결과는 <Table 4>와 같다.

    <Table 4>

    Structure of visit history data

    KITS-21-4-78_T4.gif

    3) 법정가축전염병 발생현황

    법정 가축전염병 발생현황은 국내 모든 가축전염병 발생에 대해 가축전염병명, 농장명, 농장 소재지, 발생 및 진단 일자, 사육 축종, 발생 두수, 진단기관 등의 정보를 수록하고 있다. 이 중 분석에 사용되는 변수인 가 축전염병명, 농장 소재지, 발생일자, 축종의 4개 열을 추출하였다. 이후, 분석대상이 되는 2015년 구제역 유 행기간인 2014년 12월부터 2015년 4월까지 기간 중 경기도 내 구제역 발생 데이터 56개 행을 추출한 다음, 농장 소재지 centroid 기준으로 geocoding하여 경·위도 좌표를 찾아냈다. 전처리 결과는 <Table 5>와 같다.

    <Table 5>

    Structure of Infection history data

    KITS-21-4-78_T5.gif

    4. 독립변수 산정

    1) 통행 거리 대비 감염 축산차량 통행량

    축산시설 방문이력 데이터에 수록된 축산시설 주소 및 시설 유형 정보를 통해 기반으로 소·돼지 사육농장 이 소재한 읍면동 246개를 파악한 후, 전처리된 구제역 발생현황 데이터를 구제역 발병농장 소재지 주소를 읍면동 단위 및 주 단위로 변환하여 <Table 6>에 보이는 바와 같이 정리했다. 이때, 각 주차에 발병된 읍면동 은 전 주차에 가축전염병이 전파된 것으로 판정한다.

    <Table 6>

    Infection history of each zone by week

    KITS-21-4-78_T6.gif

    읍면동 단위 축산차량 이동을 알아보기 위한 목적으로 시설 단위의 축산차량 이동을 계량하였다. 우선, DTG 데이터에서 매칭된 기종점 시설의 key값에 따라 축산시설 방문이력을 매칭하였다. 이에 따라 출발 시 설 및 도착의 시설 key값, 축종, 이동 목적, 통행의 Trip key를 저장하였다. <Table 7>에 보이는 바와 같이, 2,638개의 축산시설 간 통행 이력을 추출한 후, 기종점별로 통행이 매칭된 횟수에 따라 축산시설 간 축산차 량 통행량을 구했다.

    <Table 7>

    Structure of integrated DB

    KITS-21-4-78_T7.gif

    앞서 파악된 주차별 구제역 발병기록을 축산시설 간 축산차량 통행량 정보에 매칭하여, 각 주차 발병 읍 면동 내 축산시설(이하 감염 시설) 목록을 도출하였다. 이를 축산차량 통행량 정보의 출발지 정보에 매칭하 여 감염 축산차량 통행을 추출하였다. 또한 감염 축산차량 통행이 경유한 도로 링크 길이를 합산하여 감염 차량 통행 거리를 도출하였다. 각 읍면동의 감염차량 통행량을 감염차량 통행 거리로 나누어 통행 거리 대비 감염차량 통행량이 집계된다. 이를 수식으로 다음과 같이 정리할 수 있다.

    V j = i = 1 n ( υ i j × x i )
    (1)

    L j = i = 1 n ( x i j × i = 1 n l k )
    (2)

    X 1 = V j L j
    (3)

    여기서,

    • xi : 각 주차 읍면동 i의 발병 여부 (0 or 1)

    • υij : 주중 읍면동 i를 출발하여 읍면동 j에 도착하는 축산차량 통행량 (veh)

    • lk : 주중 읍면동 i를 출발하여 읍면동 j에 도착하는 축산차량 통행이 경유한 각 링크 길이 (km)

    • n : 소·돼지 사육농장이 분포하는 전체 읍면동 개수

    • m : 주중 읍면동 i를 출발하여 읍면동 j에 도착하는 축산차량 통행이 경유한 전체 링크 개수

    • Vj : 각 주차 읍면동 j에 도착하는 감염 축산차량 통행량 총량(veh)

    • Lj : 각 주차 읍면동 j에 도착하는 감염 축산차량 통행이 경유한 전체 링크 길이(km)

    • X1 : 각 주차 읍면동별 통행 거리 보정 감염 축산차량 통행량(veh/km)

    2) 감염원 접근성

    각 읍면동 Centroid의 지리좌표 데이터를 통해 모든 감염원까지의 직선거리를 계산한 후 최솟값을 적용하 여 각 주차 읍면동별 감염원 직선거리를 구했다. 이를 주차별로 최댓값에서 각 개체값을 뺄셈하는 방식으로 보정하여 읍면동별 감염원 접근성을 산출했다. 이를 수식으로 다음과 같이 정리할 수 있다.

    D j = min ( d i j × x i )
    (4)

    X 2 = D max D j
    (5)

    여기서,

    • xi : 각 주차 읍면동 i의 발병 여부 (0 or 1)

    • dij : 각 주차 읍면동 i로부터 읍면동 j까지의 거리 (km)

    • Dj : 각 주차 읍면동 j의 감염 읍면동까지 최소 거리 (km)

    • xi : 각 주차 읍면동 j의 감염원 접근성 ((max km) - km)

    확산시기와 방역시기 각 시기의 모든 독립변수의 평균과 표준편차는 <Table 8>에 정리된 바와 같다. 또한, 각각 독립변수의 수준을 시각적으로 표현하면 <Fig. 2>에 보이는 바와 같다. <Table 8>과 <Fig. 2>에 나타난 내용에 따르면 X1 , 즉 통행 거리 대비 축산차량 통행량의 영향력은 확산 시기에서 방역 시기보다 더 뚜렷하게 드러나는 것으로 나타났다. 이는 방역 시기에 축산차량 소독 등의 조치 결과가 반영된 것이라 추론할 수 있다.

    <Table 8>

    Mean and Standard Deviation of independent variables

    KITS-21-4-78_T8.gif
    <Fig. 2>

    Level of independent variables in each periods

    KITS-21-4-78_F2.gif

    Ⅲ. 분석 결과

    1. 가축전염병 확산 예측모형 구축 결과

    가축전염병 확산 예측모형은 <Table 9>에 정리된 바와 같이 각 주차 읍면동별 구제역 감염 여부를 종속변 수로, 감염원 직선거리 보정 감염 축산차량 통행량과 감염 유통시설 접근성을 독립변수로 하여 구축되었다. 종속변수가 1과 0으로 나뉘는 이항 변수인 특성상 일반 회귀 등 연속형 변수에 적용하는 방법론이 적절치 못하다고 판단되었다. 또한, 전체 기간 중 감염 표본이 전체 25개로, 비감염 표본 1,943개의 약 1.3% 정도로 매우 희소함을 고려했을 때, 일반적인 이항 로지스틱 모형을 적용한다면 편향이 발생할 가능성이 크다. 이에 대해서 회귀계수의 편향를 수정하는 방법으로는 King의 방법과 Firth의 방법 두 가지가 있다.(Kim et al, 2014) 본 연구에서는 희귀 사건에 대한 로지스틱 분석으로 최대우도 추정량에서 편향을 제거하는 Firth(1993) 의 방법을 적용하여 모형을 구축하였다. 확산 시기 및 방역 시기에 대한 훈련 및 검증 표본은 <Table 10>에 정리된 바와 같이, 소·돼지를 사육하는 농장이 위치한 246개 읍면동에 대해 각각 2주간의 데이터로 집계되었 다. 확산 시기 및 방역 시기에 대하여 분석한 결과는 <Table 11>에 나타난 바와 같다. 모형의 적합도를 평가 하기 위하여 이탈도(deviance)에 대한 우도비 검정을 시행한 결과, null 이탈도와 모형의 이탈도 사이에 차이 가 없다는 귀무가설을 신뢰수준 99.9%에서 기각한다. 이에 따라 모형의 이탈도는 null 이탈도에 비해 충분히 작으며, 모형의 예측 정확도가 높음을 알 수 있다. 이를 정리하면 <Table 12>에 나타난 바와 같다.

    <Table 9>

    Description of variables

    KITS-21-4-78_T9.gif
    <Table 10>

    Description of sample

    KITS-21-4-78_T10.gif
    <Table 11>

    Result of training Firth’s logistic regression methodl

    KITS-21-4-78_T11.gif
    <Table 12>

    Result of goodness-of-fit test

    KITS-21-4-78_T12.gif

    2. 가축전염병 확산 예측의 정확도 검증

    훈련된 가축전염병 확산 예측모형에 따라 시기별 훈련 표본의 감염확률을 도출한 후, <Table 13>과 같이 긍 정적, 부정적 시나리오에 따라 Threshold를 설정하여 감염 여부를 판정한 후, 실제 감염 여부와 비교하여 정확 도, 특이도, 민감도를 산정하였다. 방역 시기인 2015년 2월의 전체 감염 표본이 8개로, 확산 시기인 2015년 1월 의 전체 감염 표본 17개의 50% 수준이므로, 방역 시기의 Threshold 또한 확산 시기의 50% 수준으로 설정하였 다. 세 가지 지표에 대하여 간략히 설명하면 다음과 같다. 정확도의 경우, 전체 표본 중에서 종속변수가 실제 집단과 동일하게 예측된 비율을 나타낸다. 특이도의 경우 종속변수가 0인 표본이 예측된 비율을 나타낸다. 반 면, 민감도의 경우 종속변수가 1인 표본이 예측된 비율을 나타낸다.

    <Table 13>

    Threshold to predict whether a zone is infected by scenario

    KITS-21-4-78_T13.gif

    1) 긍정적 시나리오 적용에 따른 정확도 검증 결과

    읍면동별 감염확률 상위 5% 수준에서 가축전염병 감염을 예측한 결과, <Table 14>와 같이 모형 훈련 및 검증에 대한 정확도가 측정되었다. Threshold에 해당하는 농장의 감염확률은 확산 시기 0.0102, 방역 시기 0.0428이다. 전 기간 내 검증용 표본 13개가 모두 감염이 예측되었다. 이에 따라 민감도가 1.000이 되었다. 한 편, 특이도의 경우 95~98% 수준에서 형성되므로, 실제 비감염 표본을 감염으로 예측할 확률은 2~5% 수준에 불과하다. 긍정적 시나리오에서 기간별 각 주차 가축전염병 확산 패턴은 <Fig. 3>에 보이는 바와 같다.

    <Table 14>

    Result of model accuracy test in positive scenarios

    KITS-21-4-78_T14.gif
    <Fig. 3>

    FMD spread pattern in positive scenario

    KITS-21-4-78_F3.gif

    2) 부정적 시나리오 적용에 따른 정확도 검증 결과

    읍면동별 감염확률 상위 3% 수준에서 가축전염병 감염 예측 결과, <Table 15>와 같이 모형 훈련 및 검증 에 대한 정확도가 측정되었다. Threshold에 해당하는 농장의 감염확률은 확산 시기 0.2231, 방역 시기 0.1909 이다. 전 기간 내 검증용 감염 표본 13개 전체의 69.2%에 해당하는 9개가 예측되었다. 민감도는 확산 시기에 서 0.625, 방역 시기에서 0.8로 나타났다. 긍정적 시나리오와 비교해서 민감도가 상당히 낮은데, 이는 실제 표 본 자체가 희소하여 표본 한 개의 이탈만으로도 비율이 크게 감소하기 때문이다. <Fig. 4>, <Fig. 5>에 나타 난 확산 패턴으로 보았을 때, 실제 확산 패턴과 크게 다르지 않다는 사실을 알 수 있다. 특이도의 경우, 전체 기간에서 약 98~99% 수준에서 형성되므로, 실제 비감염 표본을 감염으로 예측할 확률은 1~2% 수준에 불과 하다. 부정적 시나리오에서 기간별 각 주차 가축전염병 확산 패턴은 <Fig. 4>에 보이는 바와 같다.

    <Table 15>

    Result of model accuracy test in negative scenarios

    KITS-21-4-78_T15.gif
    <Fig. 4>

    FMD spread in negative scenario

    KITS-21-4-78_F4.gif
    <Fig. 5>

    Comparison of FMD spread pattern in each scenario

    KITS-21-4-78_F5.gif

    실제 발병 기록상 각 주차 확산 패턴과 각 시나리오에서 모형에 의해 예측된 각 주차 확산 패턴을 시각화 하면 <Fig. 5>에 나타난 바와 같다. 확산 시기, 즉 1월의 경우 긍정적 시나리오와 부정적 시나리오 모두 4주 까지의 감염 전파 읍면동의 대부분을 2주 안에 예측해내는 것을 확인할 수 있다. 또한, 방역 시기, 즉 2월에 도 가축전염병이 전파된 기간에 맞추어 실제 감염을 잘 예측해내는 것을 확인할 수 있다.

    3. 정책적 의의 및 시사점

    가축전염병 확산 예측모형과 긍정적, 부정적 시나리오에서 실제 데이터에 모형의 적용 결과를 통해 확인 한 가축전염병의 확산 양상 및 특징은 다음과 같다. 가축전염병 확산에 있어서 큰 영향을 미치는 요인은 감 염원 접근성 수준이었다. 즉, 기존의 거리 기준의 방역 절차 자체는 유효한 것으로 나타났다. 그러나 동시에 유행을 옮기는 주체인 축산차량의 영향력 또한 확인되었다. 따라서 감염 지점 인근의 다른 읍면동으로의 전 파를 조기에 차단하기 위해서는 인근 읍면동으로 향하는 축산차량을 선별하여 최우선으로 소독 및 방역하는 것이 필수적이다. 이것이 가능하기 위해서는 축산차량의 통행에 대한 체계적인 관리가 선행되어야 한다.

    본 연구는 축산차량 통행 관리 체계의 framework로서 역할을 할 수 있다. 본 연구는 감염원과의 접근성, 축산차량 통행을 모두 고려하였을 때, 향후 가축전염병 확산이 예상되는 읍면동을 찾아낼 수 있으므로, 가축 전염병 확산을 저지하는 방역대를 설정하는 데에 기여할 수 있다. 향후 연구를 통해 가축전염병을 확산시키 는 주요 도로를 찾아낼 수 있다면, 가축전염병 확산에 있어서 축산차량의 영향력을 획기적으로 통제할 수 있 을 것으로 기대된다.

    본 연구는 또한 축산차량 정보를 활용한 가축전염병 예방 정책 연구의 선행사례가 될 수 있다. 예를 들어, 평시 축산차량 이동 경로 및 OD 데이터를 분석하여 가축전염병 집중 모니터링 및 예방 구역을 설정하는 연 구를 진행할 때, 본 연구에서 활용된 단위 지역 간 축산차량 통행 추정 방법을 응용할 수 있다. 축산차량 통 행 분석 및 가축전염병 확산 예측 정보를 축산업과 관련된 민간부문에도 제공하는 방법도 생각할 수 있다. 가축전염병 유행상황에서 민간의 축산업 종사자들에게 가축전염병 유행 예상 지역 및 주요 도로에 대한 정 보를 제공함으로써, 민간 축산차량 통행에 의한 가축전염병 확산을 방지하는 데에 기여할 수 있을 것이다.

    본 연구의 방법론을 인수 공통 전염병 등으로 확대하는 방안도 고려할 수 있다. 2019년 말부터 전 세계를 강타하고 있는 COVID-19 팬데믹 상황을 겪으면서, 공간에 대한 방역이 전 세계적으로 주요한 키워드로 부 상하고 있다. 이러한 상황에서, 보행자의 통행 경로 및 OD 유추가 가능한 데이터를 활용한다면, 본 연구와 같이 전염병 확산 위험 공간을 정량적으로 확인할 수 있다. 예를 들어, 모바일 데이터를 통하여 보행자의 통 행량을 건물 단위로 분석하여 COVID-19 집단 감염 위험 지점을 찾는 모형을 구축할 수 있을 것이다. 이러한 모형을 통해 실제 위험시설을 정량적으로 파악할 수 있다면 사회적 거리두기 등 방역 대책으로 인한 사회적 비용을 절약하는 데에 이바지할 수 있을 것이다.

    향후 연구의 발전 방향은 다음과 같다. 첫 번째는 도로 단위의 실제 차량 움직임을 추적하는 것이다. 본 연구의 결과는 읍면동 단위에서 축산차량 출입을 통해 가축전염병 확산을 예측했다. 이를 실제 도로상에서 축산차량의 이동성 및 통행패턴과 관련된 다른 모형과 결합할 경우, 축산차량의 방역을 보다 효과적으로 수 행할 수 있을 것이다. 예시로, Jeong et al.(2021)의 경우, 축산용 화물차량의 운행기록에 기반하여 도로별 축 산차량 점유시간에 따른 도로별 가축전염병 노출도를 산정해낸 바가 있다. 이와 같은 도로 단위 축산차량 이 동성 지표를 가축전염병 확산 예측과 결합할 경우, 지역 간 주요 축산차량 이용 경로를 파악하고 도로 단위 의 방역 조치를 시행하는 방법을 생각할 수 있다. 두 번째는 차량 정보의 확대이다. 본 연구는 DTG 단말기 가 장착되어있는 영업용 화물차량에 한정되어 축산차량의 OD를 도출했다. 이로 인해 읍면동별로 축산차량 통행이 매칭되지 않는 경우 등 연구 결과의 정밀성을 저해할 요소가 발견되었다. 축산 농가에서 사용하는 차 량의 경우 영업용 차량 등록이 되어 있지 않은 경우가 자주 있다는 점을 고려했을 때, Navigation 데이터 등 비사업용 차량의 통행 정보가 포함된 범용적인 차량 통행 데이터를 활용하게 된다면 이러한 요소를 극복할 수 있으므로, 본 연구보다 발전된 결과를 기대할 수 있다. 예시로, Cheung et al.(2018)의 경우, Navigation 위 치 데이터를 활용하여 운전자의 성향을 분석한 바가 있는데, 이러한 방법론을 응용한다면, 각 차량의 이용 목적을 분석하여 축산차량을 파악해낼 수 있을 것이다. 세 번째는 분석대상 개체 각각을 시계열적 특성과 횡 단면적 특성을 모두 가지는 패널데이터로 전환하는 것이다. 예시로, Liu et al.(2019)의 경우, 중국 31개 성의 시계열 데이터를 패널데이터로 통합하여 녹지공간과 전염병 발생의 연관성을 밝혀냈는데, 이와같이 246개 읍면동에서의 9주간 시계열 데이터를 통합한다면, 본 연구보다 차량 이동과 가축전염병 확산의 연관성을 더 욱 정확하게 설명할 수 있을 것으로 예상한다.

    Ⅳ. 결 론

    본 연구는 인터넷 기사 크롤링 및 텍스트 빈도 분석을 통해 전염병의 확산 시작부터 방역까지 1달 정도의 시간이 소요됨을 유추했다. 또한 KAHIS의 축산시설 방문이력 데이터와 화물차량 디지털운행기록계 데이터 에 기반하여 주중 축산 화물차량의 실제 운행 정보를 추출하였고, 축산시설 및 읍면동 단위의 통행량을 분석 했다. 이러한 분석을 바탕으로, 통행 거리를 보정한 감염 차량 통행량, 감염원으로부터의 접근성 등 가축전 염병 전파에 유의미한 변수를 찾아냈다. 최종적으로 위와 같은 발견을 토대로 2015년 구제역 유행 당시 경기 도 내 읍면동별 가축전염병 발생 현황에 기반하여 로지스틱 분석을 시행하여 제시된 변수에 의한 가축전염 병 확산 위험도를 계량하였고, 이를 바탕으로 가축전염병 확산 예측모형을 구축하였다.

    차량 통행 데이터를 기반으로 구축된 본 연구의 가축전염병 확산 예측모형은 향후 감염이 전파될 지역을 정량적으로 예측함으로써 가축전염병 유행을 조기 진압하는 데에 활용될 수 있다. 또한, 과도한 방역 조치를 줄여 사회적 비용을 절감하도록 유도하는 효과도 기대할 수 있다. 축산차량의 도로 이용 등 축산업 이동성과 관련한 다른 모형과 결합한다면 축산차량 방역 수준을 고도화할 수 있을 것이다. 모형 자체뿐만 아니라, 모 형이 구축되는 과정에서 사용된 방법론을 이용하는 것도 가축전염병 유행 방지 및 진압에 이바지할 수 있다. 본 연구와 같이 지역별 축산차량 통행 정보를 활용한다면 가축전염병 유행이 없는 평상시에도 가축전염병 발병과 관련하여 집중 모니터링 및 예방 구역을 식별할 수 있을 것이다. 이를 통해 가축전염병 유행이 발생 할 가능성을 줄일 수 있다. 본 연구의 방법론에 차량 통행 또는 보행 경로에 대한 다른 형태의 데이터를 적 용한다면 인수공통 전염병 등으로의 확장도 기대할 수 있다.

    본 연구의 결과는 차량 통행에 기반한 가축전염병 확산 예측의 정확성을 보여준다. 더 나아가 축산차량 방역을 중심으로 한 가축전염병 방역 조치의 실효성을 시사한다. 축산차량 통행에 대한 관리 및 통제는 불필 요한 희생과 가축전염병 유행 기간을 최소화하는 데에 기여할 수 있다. 아직은 한 가지 질병에 대해서 국내 일부 지역에 대해서만 효과가 검증되었으나, 질병 및 지역을 다르게 하여 본 연구의 방법론을 적용하여 가축 전염병 확산 예측모형을 구축할 수도 있다. 본 연구의 결과가 향후 가축전염병 확산의 사전적 예방에 이바지 함으로써 가축전염병으로 인한 사회적 비용을 절감하는 데에 기여할 수 있기를 바란다.

    ACKNOWLEDGEMENTS

    본 연구는 국토교통부 교통물류연구개발사업의 연구비지원(21TLRP-B148680-04)에 의해 수행되었습니다.

    본 논문은 정희현·홍정열·박동주의 한국ITS학회 논문지 제19권 제6호에 게재되었던 논문, 빅데이터 기반 가축관련 운송차량 이동경로 분석을 통한 가축전염병 노출수준 평가를 수정·보완하여 작성하였습니다.

    Figure

    KITS-21-4-78_F1.gif

    FMD spread pattern for each zone by week in January and February 2015

    KITS-21-4-78_F2.gif

    Level of independent variables in each periods

    KITS-21-4-78_F3.gif

    FMD spread pattern in positive scenario

    KITS-21-4-78_F4.gif

    FMD spread in negative scenario

    KITS-21-4-78_F5.gif

    Comparison of FMD spread pattern in each scenario

    Table

    Number of outbreaks of foot and mouth disease(FMD) per week

    Result of web crawling

    Structure of DTG data

    Structure of visit history data

    Structure of Infection history data

    Infection history of each zone by week

    Structure of integrated DB

    Mean and Standard Deviation of independent variables

    Description of variables

    Description of sample

    Result of training Firth’s logistic regression methodl

    Result of goodness-of-fit test

    Threshold to predict whether a zone is infected by scenario

    Result of model accuracy test in positive scenarios

    Result of model accuracy test in negative scenarios

    Reference

    1. Cheung, E. , Bera, A. , Kubin, E. , Gray, K. and Manocha, D. (2018), “Identifying driver behaviors using trajectory features for vehicle navigation”, IEEE International Conference on Intelligent Robots and Systems.
    2. Ferguson, N. M. , Donelly, C. A. and Anderson, R. M. (2010), “The Foot-and-Mouth epidemic in Great Bratain: Pattern of Spread and Impact of Interventions”, Science, vol. 292, pp.1155-1160.
    3. Firth, D. (1993), “Bias Reduction of maximum likelihood estimates”, Biometrika, vol. 80, pp.27-28.
    4. Gho, K. (2018), Livestock infectious disease, Korea Institute of S&T Evaluation and Planning.
    5. Gregor, M. (2007), “The long haul: Risks associated with livestock transport”, Biosecurity and Bioterrorism: Biodefense Strategy, Practice, and Science, vol. 5, no. 4, pp.301-312.
    6. Guinat, C. , Relun, A. , Wall, B. , Morris, A. , Dixon, L. and Pfeiffer, D. U. (2016), “Exploring pig trade patterns to inform the design of risk-based disease surveillance and control strategies”, Science Reports, vol. 6, 28429.
    7. Jeong, H. , Hong, J. and Park, D. (2021), “A Framework of an integrated livestock vehicle trajectory database using digital tachograph data”, Sustainability, vol. 13, no. 5, 2694.
    8. Kim, H. , Ko, T. , Park, N. and Lee, W. (2014), “Comparison of Bias Correction Methods for the Rare Event Logistic Regression”, The Korean Journal of Applied Statistics, vol. 27, no. 2, pp.277-290.
    9. Korea Law Information Center,https://www.law.go.kr/LSW/admRulLsInfoP.do?admRulSeq=2100000182438, 2022.02.16.
    10. Korea Rural Economic Institute (2016), Research for the causes of foot-and-mouth disease in 2014-2015 and on measures to improve the quarantine system. (in Korean)
    11. Lee, G. J. , Park, S. I. , Lee, K. N. , Kim, H. Y. , Park, J. H. and Hong, S. J. (2018), “Hub Facilities in Vehicle Movement Network between Livestock Facilities”, Journal of the Korea Academia- Industrial Cooperation Society, vol. 19, no. 6, pp.137-146.
    12. Lee, Y. J. , Shin, M. S. , Yoon, H. J. , Jang, W. S. , Hwang, S. C. , Kim, Y. J. , Jeong, J. W. and Lee, S. J. (2010), “Epidemiological characteristics about introduction and transmission of foot-and-mouth disease in republic of Korea in January 2010”, Journal of Preventive Veterinary Medicine, vol. 34, no. 3, pp.203-201.
    13. Liu, L. , Zhong, Y. , Ao, S. and Wu, H. (2019), “Exploring the relevance of green space and epidemic diseases based on panel data in China from 2007 to 2016”, Environmental Research and Public Health, vol. 16, no. 14, 2551.
    14. Lowe, J. , Gauger, P. , Harmon, K. , Zhang, J. , Connor, J. , Yeske, P. , Loula, T. , Levis, I. , Dufresne, L. and Main, R. (2014), “Role of transportation in spread of porcine epidemic diarrhea virus infection, United States”, Emerging Infectious Diseases, vol. 20, no. 5, p.872.
    15. Mansour, S. M. , Ali, H. , Chase, C. C. and Cepica, A. (2015), “Loop-mediated isothermal amplification for diagnosis of 18 World Organization for Animal Health (OIE) notifiable viral diseases of ruminants, swine and poultry”, Animal Health Research Review, vol. 16, no. 2, pp.89-106.
    16. Mweu, M. M. , Fournie, G. , Halasa, T. , Toft, N. and Nielsen, S. S. (2013), “Temporal characterization of the network of Danish cattle movements and its implication for disease control: 2000-2009”, Preventive Veterinary Medicine, vol. 110, pp.379-387.
    17. Paju City (2020), White paper on African Swine Fever in Paju City, pp.26-27.
    18. Shirley, M. D. F. and Rushton, S. P. (2005), “Where diseases and networks collide: Lessons to be learnt from a study of the 2001 foot-and-mouth disease epidemic”, Epidemiology & Infection, vol. 133, pp.1023-1032.

    저자소개

    Footnote

    • 규정상 <Table 2>의 내용은 영어로 작성되어있으나, 실제 검색어 및 키워드는 한글임을 알림.