Journal Search Engine

View PDF Download PDF Export Citation Korean Bibliography PMC Previewer
The Journal of The Korea Institute of Intelligent Transport Systems Vol.18 No.6 pp.241-250
DOI : https://doi.org/10.12815/kits.2019.18.6.241

A Study on the Improvement of Automatic Text Recognition of Road Signs Using Location-based Similarity Verification

Kyusoo Chong*
*Dept. of Future Technology and Convergence Research, Korea Institute of Civil Engineering and Building Technology

† Corresponding author : Kyusoo Chong, ksc@kict.re.kr
20191118 │ 20191130 │ 20191202

Abstract


Road signs are guide facilities for road users, and the Ministry of Land, Infrastructure and Transport has established and operated a system to enhance the convenience of managing these road signs. The role of road signs will decrease in the future autonomous driving, but they will continue to be needed. For the accurate mechanical recognition of texts on road signs, automatic road sign recognition equipment has been developed and it has applied image-based text recognition technology. Yet there are many cases of misrecognition due to irregular specifications and external environmental factors such as manual manufacturing, illumination, light reflection, and rainfall. The purpose of this study is to derive location-based destination names for finding misrecognition errors that cannot be overcome by image analysis, and to improve the automatic recognition of road signs destination names by using Levenshtein similarity verification method based on phoneme separation.



위치기반 유사도 검증을 이용한 도로표지 안내지명 자동인식 개선방안 연구

정 규 수*
*주저자 및 교신저자 : 한국건설기술연구원 미래융합연구본부 연구위원

초록


도로표지는 도로 이용자를 위한 시설물로서 관리 및 유지보수의 편의성 증진을 위해 국토 교통부에서는 관리시스템을 구축하여 운영 중에 있다. 향후 자율주행 시대에 도로표지의 역할 은 감소하겠지만 그 필요성은 지속되고 있다. 이에 도로표지에 표기된 안내지명의 정확한 기 계적 판독을 위해 도로표지 자동인식 장비를 개발하여 영상 기반의 문자 인식 기술을 적용하 고 있지만 불규칙적인 규격과 수작업 제조, 조도, 빛반사, 강우 등 외부환경에 의해 오인식되는 경우가 다수 발생하고 있다. 본 연구에서는 영상 분석 등으로 극복할 수 없는 오인식 결과를 개선하기 위해 위치기반의 안내지명 후보를 도출하여 기준으로 하고, 오인식된 지명의 음소 분리를 통한 레벤슈타인 문자 유사도 검증 방법을 이용해 도로표지 안내지명 자동인식율을 개 선하고자 하였다.



    Ministry of Land, Infrastructure and Transport
    12교통시스템03

    Ⅰ. 서 론

    도로표지는 도로 이용자를 위한 시설물로서 관리 및 유지보수의 편의성 증진을 위해 국토교통부에서는 2002년부터 전국의 도로표지 정보를 관리할 수 있는 시스템1)을 운영하고 있다. 시스템을 이용하는 도로관리 자나 사용자의 입장에서 정보의 현시성은 중요한 부분으로, 단시간에 효율적인 정보의 조사 및 갱신을 위해 MMS(Mobile Mapping System)을 이용한 도로표지의 설치위치, 사진 및 표기 정보를 자동 인식하기 위한 기술 개발을 추진하여 영상 기반의 문자 인식 기술을 적용하고 있다2). 하지만 불규칙적인 규격과 수작업 제조, 조 도, 빛반사, 강우 등 외부환경에 의해 오인식되는 경우가 다수 발생하고 있다. 최근 자율주행 차량의 안전을 위해 라이다, 레이더, 카메라, 위성항법장치 등의 센서를 이용하여 차선인식, 보행자 등 이동체의 인식, 낙하 물, 팟홀(pot hole) 등 노면 상태 인식 연구가 급증하고 있다. 기본적 안전의 보장에서 한 단계 더 나아가서, 도로 상에 설치된 정보를 포함한 시설물은 부가적 안전을 위한 자율주행 차량의 판단에 영향을 줄 수 있는 것이다. 예를 들어 자율차량의 내비게이션을 이용하여 목적지로 주행할 때 복잡한 교차로에 설치된 도로표 지에 표기된 정보와 목적지 정보와의 일치여부를 판단한다면 운전자에게 효과적인 확신을 줄 수 있다. 도로 표지 뿐만 아니라 교통안전표지, 가변정보시스템 등 정보를 포함하고 있는 시설물은 향후 자율주행차가 스 스로 인지해야 하는 대상이 될 것이다. 따라서, 도로 상의 정보를 가지는 안내 시설물에 대한 정확한 판단 기술이 필요한 시점이다.

    본 연구에서는 현재 설치된 경기 북부의 도로표지를 대상으로, 도로상의 시설물에서 취득한 정보를 좀 더 정확하게 판독할 수 있도록 하고자 하였다. 영상처리 후 기존 OCR3)의 학습 과정 이외에 대상 정보를 기준 으로 위치기반의 안내지명 사전을 구축 하고, 이 사전을 기반으로 하여 OCR을 통한 단어를 추출하고 음소 분리를 하여 단어사전과의 일치성 여부를 판단하여 최종 도로표지에 표기된 안내지명을 결정하였다. 연구 수행 절차는 <Fig. 1>과 같다.

    Ⅱ. 관련연구

    영상을 이용한 도로표지 영역의 검출은 RGB(Red Green Blue) 또는 HSV(Hue Saturation Value)와 같은 컬러 모델을 이용할 수 있다. MMS의 비전센서를 이용한 도로표지의 추출 및 인식은 조도의 변화, 빛의 반사, 그 림자, 강우, 안개 등과 같은 외부 요인으로 인해 영향을 크게 받는다. 이를 극복하기 위해 그레이스케일(gray scale)로 후보군을 추출하고 소벨 에지검출(sobel edge detector)을 이용한 연구(Sathiya et al., 2013)가 있으나 과노출, 비정형화 문자, 장애물이 있을 경우 인식이 불가능 하였다. 교통안전표지를 대상으로 RGB, HSV 색 상 모델을 이용하여 이진화 모델 처리(Shneier, 2005), HSV, contourlet 변환, LESH(Local Energy based Shape Histogram)을 이용한 객체 인식(Zakir et al., 2011)의 경우 교통안전표지의 영역 추출에는 성공적 이었으나, 내 용 인식에는 문제가 있었다. 자동차 번호판의 경우는 크기와 패턴이 일정하여 에지 투영 기반으로 문자정보 를 인식할 수 있었으나(Song et al., 2010) 도로표지와 같이 패턴이 일정하지 않은 경우는 적용이 어려웠다. 그 외 외부 영상의 문자 인식 연구의 경우(Park et al., 2001) 환경 요인은 적용되지 않았다. 기하학적인 색상 모델에 기초한 표지판 인식 방법(Zhu et al., 2006), 표지판이 지표면으로부터 수직으로 세워진다는 특징을 이 용한 방법(Yoon et al., 2009), 웨이블릿 변환을 통해 표지판을 인식하는 방법(Oh et al., 2004), 색상 인식을 통 해 교통 표지판의 후보 영역을 추출 한 뒤 SIFT (Scale Invariant Feature Transform)나 SURF (Speeded Up Robust Features)와 같은 매칭 알고리즘 및 기계학 습을 통해 사전에 학습된 테이블 정보를 이용하여 후보 영 역과 매칭 시킴으로서 표지판을 인식하는 방법(Gomez-Moreno et al., 2010;Greenhalgh and Mirmehdi, 2012;Maldonado-Bascon et al., 2007) 등 다양한 방법의 표지판 인식 기법들이 연구되고 있다.

    도로표지의 경우 도로표지규칙에서 글씨 크기 등 규격을 정하고 있지만 예외의 경우가 많아 일정한 패턴 을 유지하기 어렵고 외부 환경 요인이 더해지면 다양한 기법을 이용하더라도 인식결과에 대한 신뢰도가 낮 아질 수 밖에 없다. 따라서 본 연구에서는 위치기반 안내지명 사전과 음소 분리를 통한 단어 매칭 방법을 통 해 단순 오인식되는 결과 값을 효과적으로 수정하고자 하였다.

    Ⅲ. 안내지명 인식

    본 연구는 외부 영상에서 영상처리를 거친 이진화 된 이미지를 사용하였다. 추출한 안내지명 정보의 정확 도를 높이기 위해 먼저 위치 기반 안내지명 사전을 구축하고, 안내지명 사전을 기반으로 두 문자열 간의 유 사도 측정 방법인 레벤스타인 거리(Levenshtein Distance)를 활용한 한글 유사도 판단 알고리즘을 적용하였다. 도로표지의 안내지명에 사용되는 단어는 사전적인 단어보다 지도상의 행정명, 관광지, 주요 관공서 및 시설 인 경우가 많다. 이에 별도의 표지 안내지명 분석에 적합한 사전 구축이 필요하며, 공간 분석을 수행할 수 있도록 안내지명의 공간 정보도 병행하여 구축할 필요가 있다. 또한, 표지의 위치정보를 통한 공간분석으로 처리 효율을 높이고, 한글의 특성을 고려하여 초성, 중성, 종성을 구분한 음소를 나열한 음소 분리 후 레벤스 타인 거리 알고리즘을 통해 안내지명 인식률을 높이는 방안을 사용하였다.

    1. 연구 방법론

    본 연구에서는 외부 영상 중 도로표지판 부분을 추출하여 이진화 하고 에지검출, SWT(Stroke Width Transform), 연결 부분 추출, 문자영역 추출 과정을 거쳐 Tesseract-OCR 기반 문자인식을 통한 결과를 활용하 였다(Chong, 2014). 그 결과 문자와 비교를 위해 영상의 위치 좌표를 이용하여 도로의 종류, 설치된 지역을 기반으로 미리 만들어 놓은 안내지명 사전 중 해당 지역 안내지명을 비교 대상으로 정하였다. 1개의 결과 문 자와 다수의 안내지명 문자를 음소 분리하여 레벤슈타인 거리 알고리즘을 이용한 거리를 산출 하였으며 그 중 최소 거리에 해당하는 문자를 안내지명으로 결정 하였다. 결과의 도출을 위한 데이터의 수집, 추출 및 활 용 알고리즘은 다음과 같다.

    첫째, 문자인식의 결과 값을 비교할 수 있는 참값에 해당하는 안내지명 사전을 구축한다. 도로표지에 사용 되는 안내지명은 국토교통부의 도로표지규칙에서 그 범위를 정하고 있다. 안내지명 선정 방식은 크게 지방 지역과 도시지역으로 구분되며, 도로의 종별(고속국도, 일반국도, 지방도 등)에 따라 결정된다. 이 범위를 기 준으로 현재 도로표지에서 안내하고 있는 안내지명 데이터베이스를 활용하여 <Table 1>과 같이 분류에 따른 안내지명 사전을 구축한다.

    둘째, 문자인식의 결과 값과 안내지명 사전과의 비교를 위해 레벤슈타인 거리(Levenshtein Distance) 알고리 즘을 적용한다. 레벤슈타인 거리 알고리즘은 두 개의 문자열 간 유사성을 보여주는 척도로써, 삽입, 제거, 교 체를 통한 유사한 두 개의 문자열 간 최소 수정거리(Edit distance)를 계산할 수 있다. 이 알고리즘은 음성 인 식, 철자법 검사, 검색 엔진 등 다양한 분야에서 널리 사용되는 방법으로 가장 일반적으로 사용되고 있는 연 산에 대한 모든 비용을 동일하게 설정하는 방법을 사용하였다. 이를 이용하여 결과값과 안내지명 사전과의 최소 거리를 나타내는 문자열을 찾아 동일한 문자라고 추정할 수 있다. 다음 수식(1)은 a, b 2개의 문자열에 대한 레벤슈타인 거리 산출방법이다.

    lev a , b ( i , j ) = max ( i , j ) { max ( i , j ) if min ( i , j ) = 0 min { υ a , b ( i 1 , j ) + 1 υ a , b ( i , j 1 ) + 1 υ a , b ( i 1 , j 1 ) + 1 ( a i b j ) o t h e r w i s e .
    (1)

    여기서, 문자 abi, j 는 1부터 1씩 증가하며, 레벤슈타인 거리는 aibjj일 경우 1, 그렇지 않을 경우 0으로 하여 이전 숫자 중 최소값에 더하여 산정한다.

    2. 안내지명 사전 구축

    안내지명 사전 구축을 위해 도로표지규칙의 국도 안내지명 대장을 이용하였다. 국도안내지명 대장은 국도 노선별 경유 지명의 중요도를 부여하여 위치별 사용하여야 할 지명을 정해 놓은 것으로, <Table 2>와 같다. 일반국도 1, 31, 44, 46호선의 도로표지는 도시지역을 제외하고 직진방향에 안내지명 대장을 준하여 표기되 어야 하므로 본 연구의 안내지명 사전으로 사용하였다. 안내지명은 일반국도의 경우 일반적으로 40∼60km 거리를 원거리 지명으로 사용하므로 지도 내 60km 반경 공간검색을 통해 안내지명 대장 중 후보지명을 결 정하였다. 범위 지정이 필요한 이유는 유사 지명이나 시설명이 많아 문자 유사도 검증에서 오류가 발생할 수 있다. 예를 들어 서울시에 설치된 도로표지에서 ‘시청’ 이란 문자가 ‘사청’으로 오인지 되었을 경우, 공간검 색 과정을 거치지 않으면 경남 ‘산청’ 이나 ‘사천’ 과의 일치성이 높아 오인 될 수 있는 것이다.

    3. 음소 비교를 이용한 안내지명의 결정

    1) 안내지명 비교 범위 설정

    <Table 3>의 문자영역은 이미지 이진화를 통해 문자부분을 추출하고 각각의 블럽을 가로방향은 좌에서 우 로 합치고 세로방향은 글자의 높이 값을 기준으로 합쳐, 한글 문자 영역을 추출한 결과이다. 위치는 도로표지 관리시스템의 해당 도로표지 위치좌표를 이용, 지도상의 위치를 찾고 그 위치에 해당하는 안내지명 대장을 검색, 해당 지명을 제시하였다. 해당 도로표지는 도로의 상하행 구분을 통해 다시 필터링 하였으며, case 1의 경우, 하행인 ‘서울, 문산’을, case 2의 경우 상행인 ‘양양, 간성, 속초’를 최종 비교 문자로 결정하였다. 추출된 한글 영역에 대해 Tesserect-OCR을 이용해 문자 인식을 수행하였으며 <Table 3>의 결과와 같다. Case 1은 ‘문 산’이 ‘문신’으로 오인식 되었는데, 도로표지에 사용되는 고딕체를 문자인식 학습 하였으며, 실제 도로표지 제 작시 수작업으로 하여 모음 ‘ㅏ’ 의 가로획을 아래쪽에 치우치게 하여서 발생한 오류로 판단된다. 여기에서 일반국도의 직진방향에 대한 안내지명 대장과 비교하기 위해 우회전 지명인 ‘당동리’는 제외하였다. Case 2는 ‘터양양, 속긋’으로 인식되어 안내지명과 많은 차이를 보였으며, 이를 기반으로 유사도 검증을 수행하였다.

    2) 유사도 검증을 이용한 안내지명 보정

    레벤슈타인 거리 알고리즘 적용을 위해 한글 단어의 음소 분리를 수행하였으며, 그 결과는 <Table 4>와 같다. 음소 분리 후 문자인식 결과와 그 위치에 해당하는 안내지명 사전을 비교 분석 하였다. 즉, case 1의 경 우 ‘서울’과 ‘서울, 문산’, ‘문신’과 ‘서울, 문산’을 각각 비교 하였다. <Table 5>와 같이, 동일한 문자인 ‘서울’ 거리가 ‘0’이었고 ‘문신’과 ‘서울’, ‘문산’의 경우 각가 거리가 ‘6’, ‘1’ 이었다. 이 결과에 따라 자동인식 된 문 자 결과인 ‘서울’, ‘문신’을 최종 ‘서울’과 ‘문산’으로 결정하였다.

    Case 2의 경우 ‘양양’ 앞에 공항 상징그림이 문자 높이와 유사하여 같은 문자 영역으로 추출 되어 ‘터양 양’으로 인식되었으며, ‘속초’는 ‘속긋’으로 인식되었다. 해당 지점의 안내지명 사전은 ‘양양, 간성, 속초’ 이 었으며 이와 각각 비교하였다. ‘터양양’의 문자인식 결과를 3개의 안내지명 사전과 비교하였을 때 레벤슈타 인 거리는 <Table 6>과 같이 각각 2, 6, 8 이었으며, ‘속긋’의 문자인식 결과를 3개의 안내지명 사전과 비교하 였을 때는 6, 6, 2의 결과가 나왔다. 따라서 ‘터양양’은 ‘양양’으로, ‘속긋’은 ‘속초’로 최종 결정하였다.

    Ⅳ. 실험 및 분석

    본 연구 방법론을 이용하여 구리, 의정부 등 경기북부 지역의 도로표지 198개의 425개 안내지명에 대해 인식 실험을 수행하였다. 전체 안내지명 개수는 452개 였으며, 이 중 영상의 전처리를 거쳐 시설물이나 가로수에 의 해 가려져 사람의 눈으로 인식이 불가능 한 경우를 제외한 문자영역 425개에 대해 Tesseract-OCR 오픈소스를 이용하여 산돌고딕 볼드체에 대한 학습과 단어사전을 적용하고 매개변수 튜닝과 확신도를 적용한 후처리 결과 는 374개 였다. 위치기반 유사도 분석 방법을 적용하였을 때 422개가 정인식 되었고, 3개의 오류가 발생하였으 며 그 결과 중 대표적 사례는 <Table 7>의 case 4와 같다. <Table 7>의 Case 1의 경우, OCR을 통해 성공적 결과 가 도출 되었다. Case 2의 첫 번째는 상징그림으로 인해 ‘편소요산’으로 인식된 것이 최종 ‘소요산’으로 수정되 었으며, 두 번째는 ‘율정동’이 ‘올칭동’으로 오인식 되었고 위치기반 유사도 분석에 의해 ‘율정동’으로 수정되었 다. 이는 문자의 상하 비율이 기본 폰트도 달라 발생된 오류로 추정된다. Case 4의 경우 본 연구 방법에 의해 개선되지 않았는데, 노선번호와 문자 영역이 분할되지 않아 전혀 다른 안내지명인 ‘55홑흙올’로 인식되어 유사 도 비교가 되지 않았다. Case 5는 시설물에 의해 가려진 경우이며 이 경우는 본 연구 대상에서 제외 하였다.

    Ⅴ. 결 론

    본 연구는 자율주행 도로 환경에서 도로표지와 같이 정보를 가지는 시설물의 자동인식 정확도 제고에 대 한 방안을 제시하였다. 빛에 의한 영상 외곡과 기상에 의한 영상 분석의 문제점 등 외부 영상에서 발생할 수 있는 문자 등 정보 인식 문제를 위치 기반과 대상 정보의 사전을 제시하는 등 보조적 정보 필터링 방법을 이용한 정확도 제고 방안을 제시하였으며, 경기 북부 지역 도로표지를 대상으로 위치 기반의 안내지명 후보 와 음소 분리에 의한 유사도 검증을 통해 실험한 결과 개선된 결과를 얻을 수 있었다.

    도로표지규칙에 정해 놓은 대장을 활용 하여 일반국도의 안내지명 사전을 구축 하였으며, 지방도, 시군도 등 그 외 도로에서는 도로표지시스템의 공간검색을 통해 경기 북부 지역 안내지명 사전을 구축하였다. 안내 지명 비교 후보군이 많을수록 모두 비교해야 하므로 시간이 다소 소요될 수 있으므로 공간 검색 범위에 대 한 추가 연구가 필요하다. 또한, 다수의 안내지명을 비교할 경우 유사한 경우가 많아 레벤슈타인 거리와 위 치 기반 검색 방법의 적절한 적용이 필요할 것이다.

    향후, 교통표지, 노면표시, VMS 등에 대한 정보 자동인식을 위한 비교 대장에 대한 연구와 간판, 관광지 안내와 같은 정보의 자동 인식에 대한 연구를 통해 자율주행 차량의 외부 정보 인식 기술에 적용하여 주행 안전에 기여할 것으로 판단된다.

    ACKNOWLEDGEMENTS

    본 연구는 국토교통부/국토교통과학기술진흥원 교통체계효율화사업(12교통시스템03) 및 2019년 도로표지 센터운영 과제의 지원으로 수행하였습니다.

    Figure

    KITS-18-6-241_F1.gif

    The research flow

    Table

    A range of destination name dictionary

    The destination names on national highway No. 1, 31, 44, 46

    The result of text recognition and destination name dictionary

    The result of phoneme separation

    The result of Levenshtein distance (Case1)

    The result of Levenshtein distance (Case2)

    The test result of location based similarity verification

    Reference

    1. Chong K. S. (2014), “Text Area Detection of Road Sign Images based on IRBP Method,” The Journal of the Korea Institute of Intelligent Transport Systems, vol. 13, no. 6, pp.1-9.
    2. Gomez-Moreno H. , Maldonado-Bascon S. , Gil-Jimenez P. and Lafuente-Arroyo S. (2010), “Goal evaluation of segmentation algorithms for traffic sign recognition,” IEEE Transactions on Intelligent Transportation Systems, vol. 11, no. 4, pp.917-930.
    3. Greenhalgh J. and Mirmehdi M. (2012), “Real-time detection and recognition of road traffic signs,” IEEE Transactions on Intelligent Transportation Systems, vol. 13, no. 4, pp.1498-1506.
    4. Im C. J. and Kim D. W. (2007), “Real-Time Traffic Information and Road Sign Recognitions of Circumstance on Expressway for Vehicles in C-ITS Environments,” Journal of The Institute of Electronics and Information Engineers, vol. 54, no. 1, pp.55-69.
    5. Maldonado-Bascon S. , Lafuente-Arroyo S. , Gil-Jimenez P. and Gomez-Moreno H. (2007), “Road-Sign Detection and Recognition Based on Support Vector Machines,” IEEE transaction on Intelligent Transportation System, vol. 8, no. 2, pp.264-278.
    6. MOLIT (2016), Road Sign Regulation, pp.215-280.
    7. Oh J. , Kwak H. and Kim W. (2008), “Recognition of Traffic Signs using Wavelet Transform and Shape Information,” IEIE-SP Journal, vol. 41, no. 5, pp.125-134.
    8. Park S.-Y. et al. (2001), “A Study on the Extraction of Character from a Calling Card by using Contour Tracking Algorithm,” Proceedings of the Korea Information Processing Society Conference, pp.723-726.
    9. Road Sign Management System,http://www.korearoadsign.go.kr.
    10. Sathiya S. et al. (2013), “Automatic Detection and Segmentation of Text in Signages,” IJREAT International Journal of Research in Engineering & Advanced Technology, vol. 1, Iss. 1.
    11. Shneier M. (2005), “Road Sign Detection and Recognition,” IEEE Computer Society International Conference on Computer Vision and Pattern Recognition.
    12. Song J.-H. et al. (2010), “Extraction of car license plate based on edge detection and character recognition,” Korea Multimedia Society, pp.439-442.
    13. Yoon C. , Jang S. and Park M. (2009), “Real-Time Road Sign Detection Using Vertical Plane and Adaboost,” IEIE-SC Journal, vol. 46, no. 5, pp.29-37.
    14. Zakir U. et al. (2011), “Road Sign Detection and Recognition by Using Local Energy based Shape Histogram (LESH),” International Journal of Image Processing(IJIP), vol. 4, Iss. 6, pp.566-582.
    15. Zhu S. , Liu L. and Lu X. (2006), “Color-geometric model for traffic sign recognition,” Computational Engineering in Systems Applications, IMACS Multiconference on, vol. 2, pp.2028-2032.

    저자소개

    Footnote

    • 도로표지관리시스템 http://www.korearoadsign.go.kr
    • RRAP(Road sign Recognition and Analysis Platform)은 전방위카메라, 위치측위시스템, 레이저스케너 등으 로 구성된 도로표지 조사용 플랫폼
    • Optical Character Reader; 광학적 문자 판독 장치