신세계를 여는 지름길,
공간빅데이터 연구

Writer. 신동빈(안양대학교 도시정보공학과 교수, (전)한국공간정보학회회장)

들어가며

최근 몇 년간 화두가 되고 있는 4차 산업혁명은 우리 생활에 많은 변 화를 가져올 것으로 예상된다. 4차 산업혁명은 사물 간의 초연결성과 연결된 정보를 활용하는 초지능 사회를 근간으로 한다. 이러한 초연 결성과 초지능은 사회·경제적으로 빠른 속도로 넓은 범위에 영향을 끼치게 될 것이다. 미래의 산업수요는 데이터 및 아이디어가 집적되 는 도시공간에서 발생할 것이며, 도시는 하나의 플랫폼 역할을 수행 하게 될 것이다. 여기서 주목해야 할 것은 4차 산업혁명의 핵심기술 들이 국토, 도시, 지역 등 공간에 집중된다는 것이다. 이에 따라 우리 정부에서도 드론, 자율주행차, 공간정보, 스마트시티, 제로에너지빌 딩, 리츠 등이 포함된 7대 신산업을 육성하겠는 계획을 수립한 바 있 다. 특히 공간정보는 다른 분야의 인프라로서의 역할과 자체적인 산 업 육성을 통해 경제 활성화에 기여할 수 있다는 점 때문에 더욱 중요 하다고 볼 수 있다.
일상생활에서 쉽게 활용되는 공간정보는 다양하게 분포한다. 일례로 스마트폰 애플리케이션 중에서 약 80% 정도가 공간정보를 포함 하고 있다. 공간정보 활용의 중요성은 정부 정책에서도 찾아볼 수 있 다. 정부는 공공정보 개방 정책을 추진하면서 국가공간정보포털, 국 가공간정보오픈플랫폼 등을 다양한 서비스를 통해 생산한 공간정보 를 민간에 제공하고 있다. 그렇지만 이러한 공공정보만으로는 충분 하지 않아 보인다. 새로운 공간정보에 대한 욕구가 점점 커지고 있 기 때문이다.
현재 다양한 센서(사람 혹은 차량의 이동정보)정보, 통계정보, 신용 카드 매출 정보, CCTV 정보 등 여러 가지 형태의 정보들이 디지털 의 형태로 누적·저장되고 있다. 이러한 정보는 공간정보와 결합하면 서 다양하게 활용될 수 있다. 택시의 승하차 정보를 1년 간 모아놓은 정보나 부동산실거래가 정보 등 거래정보를 공간정보와 융합하여 표 현하는 방식이나 드론과 자율주행차, 로봇 등이 운행하기 위해 공간 정보를 기존에 축적한 데이터와 결합하여 활용하는 방식이 주목을 받 고 있다. 특히 이러한 정보를 분석하고 결합하면 의미있는 결과를 얻을 수 있다는 사실이 알려지면서 다양한 요구들이 등장하게 되었다. 그러나 이렇게 누적되는 정보는 이전에는 상상할 수도 없는 많은 양 을 가지게 되었다. 때문에 많은 데이터를 저장·분석·활용하기 위해 서는 ‘공간정보 빅데이터 처리’라는 새로운 기술이 필요한 상황이다.

‘공간빅데이터’란 무엇인가?
빅데이터와 공간빅데이터

빅데이터에 대한 정의는 다양하다. 맥캔지(McKinsey) 등은 빅데이 터를 BI(Business Intelligence), DW(Data Warehouse) 등 기 존 IT 시스템이 수집·저장·관리·분석할 수 있는 범위 이상의 데이터 및 데이터로부터 효과적으로 가치를 추출할 수 있도록 고안된 새로 운 기술 등으로 정의한다. IDG는 다양한 데이터로 구성된 방대한 데 이터로부터 고속 캡처, 데이터 탐색 및 분석을 통해 경제적으로 필요 한 가치를 추출할 수 있도록 디자인된 차세대 기술과 아키텍처로 정 의한다. 가트너는 빅데이터가 3V(Volume, Velocity, Variety)의 특성을 가지며, 대량의 데이터가 실시간으로 끊임없이 다양한 형태 로 들어오는 것이라고 정의한다. 특히 가트너의 정의에 따라 빅데이 터의 특징인 3V를 살펴보면, 우선 크기(Volume)로 데이터의 크기 가 대단히 크다는 것을 의미한다. 속도(Velocity)는 데이터가 실시간 으로 변화하며 확장한다는 것을 의미한다. 다양성(Variety)은 기존 의 정형 데이터뿐만 아니라 비정형 데이터까지 다루어야 한다는 것 을 의미한다.
최근 다양한 형태와 내용을 가진 데이터가 폭발적 증가하면서 빅데 이터 시대로 진입하였다. SNS, 모바일 서비스, IoT 등의 발전과 수 많은 데이터들이 재활용되면서 데이터는 기하급수적으로 쌓이고 있 다. 이렇게 축적된 빅데이터로부터 가치 있는 정보를 추출할 수 있 는 신기술들이 등장하고 이를 사업화하여 성공한 기업들이 출현하 면서 빅데이터의 경제적 가치도 날로 높아지고 있다. 더불어 빅데 이터와 관련한 기술, 전략, 산업 전반으로 관심이 크게 증가하고 있 다. 2012년 ‘가트너 10대 기술’은 빅데이터와 관련하여 문맥과 소셜 UX(User eXperience), 차세대 분석기술, 빅데이터, 인메모리 컴 퓨팅, 클라우드 프로그래밍 기술을 선정하였다. 또 미국의 대통령과 학기술자문위원회가 발간한 ‘Designing a Digital Future’ 보고 서에서도 모든 미국 연방정부 기관은 빅데이터 전략을 수립해야 한다고 하였다. 한편 이코노미스트(Economist)는 3IT 성장 동력 중 의 하나로 빅데이터를 제시하였는데, 빅데이터 중에서도 특히 데이 터 형식이 복잡하고 그 볼륨이 급증할 것으로 예상되는 공간빅데이터 (Geospatial Big Data) 처리 기술에 대하여 언급하였다. 때문에 최 근 MIT, 미네소타대학 등에서는 공간빅데이터의 효율적 처리, 분석, 활용에 있어서 수많은 기술적인 도전에 직면할 것으로 예측하고 다양 한 연구를 진행하고 있다.1)

‘공간빅데이터 연구’ 왜 필요한가

이미 오래전부터 공간정보는 지속적으로 축적되었다. 그런데 최근 수치지도, 지적도, 지형도, 위성영상, 항공사진, DEM 정보 등과 같 이 기본 공간정보의 축적과 함께 Open API 등을 통하여 외부에 서비 스되는 과정에서 점차 데이터의 크기가 커지고 있다. 또, 공공시설물 DB, 지하시설물 DB, 부동산 DB, BIM 정보, 재난·재해 정보, 스마 트시티 정보, 위치기반 SNS 정보, VGI(Volunteered Geograpic Information) 등과 같이 다양하게 확장된 공간정보도 지속적인 증 가 과정 및 서비스 제공 과정에서 빅데이터화되고 있다. 이렇게 축적 된 정보는 다양한 서비스에서 기반정보로 사용된다. 일례로 민원정 보의 지도화분석을 들 수 있다. 기존의 민원정보는 텍스트 형태로 담 당자의 경험이나 지식에 의존하여 처리되었다. 그러나 누적된 민원 정보를 분석하여 민원발생 위치를 추출하고, 이를 공간정보 데이터 와 연계하여 지역별 분석결과를 지도화하면 담당자의 판단에도 도움 을 주고, 맞춤형 민원대응이 가능함에 따라 효율적인 정책 지원이 가 능하게 된다.

빅데이터 관련 원천기술은
글로벌 기업들이 주도하고 있으나
공간빅데이터 관련 기술력은
미약한 상황이다.
더 이상 기술 개발에 대한 투자를
머뭇거릴 여유가 없는 상황이다.

이같은 이점 때문에 주요 선진국들은 빅데이터를 미래 국가경쟁력 의 핵심자원으로 판단하고 빅데이터 관련 기술 선점과 지속적인 리 더십을 유지하기 위하여 정부 주도로 대규모 R&D 투자 프로그램 을 진행하고 있다. 우리나라에서도 공간빅데이터 관련 기술 경쟁력 을 확보하고 관련 서비스 산업을 활성화할 수 있는 지원책이 필요하 다. 특히 공간빅데이터 서비스 플랫폼 구축을 위해 필요한 공간빅데 이터 핵심기술 개발에 속도를 내야 한다. 현재 빅데이터 관련 원천 기술은 글로벌 기업들이 주도하고 있으나 공간빅데이터 관련 기술 력은 미약한 상황이다. 더 이상 기술 개발에 대한 투자를 머뭇거릴 여유가 없다.

공공빅데이터 개방 및 관련 기관의 활동

올해 초 정부에서는 빅데이터 활용도 향상을 위해 ‘공공빅데이터센 터’ 구축을 본격 추진한다는 계획을 발표하였다. 그동안 정부와 민간 부문이 보유한 방대한 양의 빅데이터를 분석해 국가 주요정책결정과 전략수립을 지원하는 기구의 필요성은 지속적으로 제기됐다. 다행스 러운 일이다. 공공빅데이터센터는 정부통합 데이터 분석 기능과 공 공·민간 빅데이터센터 허브 기능을 수행할 할 예정이다. 행정안전부 의 발표에 따르면 공공빅데이터센터는 현 국가정보자원관리원의 빅 데이터분석과를 확대·개편하여 데이터분석·처리 전문가 중심으로 조직하되 인력은 최소한으로 구성할 계획이다. 이에 따라 관련 전문 가와 공무원으로 구성된 공공빅데이터센터 설치준비전담조직(TF) 을 발족하고 공공빅데이터센터의 기반이 되는 범정부 데이터 플랫폼 도 구축할 예정이다.

1) G oing Big on Spatial Data, 2013, Sam Madden, MIT7
공간빅데이터 연구방향 및 과제
공간빅데이터 연구의 비전 및 목표

필자는 국토교통과학기술진흥원에서 추진하고 있는 ‘국토공간정보 의 빅데이터 관리, 분석 및 서비스 플랫폼 기술 개발(이하 공간빅데이 터 연구)’를 맡고 있다. 이 사업의 비 전은 ‘공간빅데이터의 창의적 활 용을 통하여 국민을 행복하게 하고, 세계를 이끌어 갈 수 있는 스마트 공간정보 기술 강국을 실현한다’는 데 있다. 이러한 비전을 달성하기 위해 연구개발의 목표를 다음과 같이 세 가지로 설정하였다. 첫째, 공 간정보 관련 세계 G5 진입을 위한 첨단 공간빅데이터 기술 경쟁력 확 보 및 해외 수출 촉진이다. 둘째, 개방·융합·참여를 통한 공간빅데이 터의 창의적 활용이 가능한 생태계 구축이다. 셋째, 사회·안전·복지 등의 현안 사항에 대하여 적시 대응을 할 수 있는 대국민 맞춤형 공간 빅데이터 서비스 제공 추진이다.

그림2. 공간 빅데이터 개발 기술을 활용한 필지기반 전국 가스사용량(2017년) 분석 결과
주) 격자는 분석결과의 지역별 비교를 위해 1㎞×1㎞ 단위로 구분하여 가스사용량을 합산한 결과임.

공간빅데이터 연구개발 주요 연구내용

연구개발 과제에서는 우선 향후 공간빅데이터를 활용한 분석을 체계 적이고 합리적으로 수행할 수 있도록 처리속도가 빠르고, 다양한 분 석기능과 시각화 기능을 제공할 수 있는 플랫폼을 개발하고 있다. 또 한 개발된 플랫폼의 관련 서비스를 활성화하고 실증할 수 있는 내용 을 포함하고 있다. 제1 세부과제는 한국전자통신연구원에서 수행하 고 있는 ‘공간빅데이터 저장 관리 인프라 기술 개발’이다. 주요 연구 내용은 ▲빅데이터 플랫폼 기반 공간정보 지원 프레임워크 기술 개 발, ▲빅데이터 플랫폼 기반 공간 DBMS 기술 개발, ▲공간빅데이 터 웨어하우스 핵심기술 개발 등이다. 제2 세부과제는 한국과학기 술원(KAIST)에서 수행하고 있는 ‘공간빅데이터 분석 및 가시화 기 술 개발’이다. ▲공간빅데이터 분석 프레임워크 기술 개발, ▲공간 빅데이터 일괄(Batch) 분석 컴포넌트 기술 개발, ▲공간빅데이터 Interactive 분석 컴포넌트 기술 개발을 담당한다. 제3 세부과제 는 안양대학교 스마트도시공간연구소에서 수행 중에 있는 ‘공간빅 데이터 서비스 활성화 및 실증 연구’이다. 주요 연구내용으로는 공 간정보 오픈플랫폼 기반 서비스 활성화 및 실용화 방안, 공간빅데이 터 실증 등이다.
현재 개발 중인 공간빅데이터 개발 기술의 사례를 하나 들어 보겠다. <그림 2>는 전국단위 지적도(shp)와 2017년 전국 가스사용량 데이 터(txt)의 융합 분석을 통해 ‘우리나라 가스사용량 분포’를 비교·분석한 것이다.
국토교통부에서 제공하는 지적도(shp)는 전국 합산 약 30GB의 용 량을 가진 대용량 공간정보 데이터로서 시·도 단위로 분할하여 제공 된다. 또한 가스사용량 데이터(txt) 역시 2017년도 전국 합산이 약 2GB에 달하며, 대용량 파일 편집이 가능한 전용 프로그램을 활용해 야만 속성 확인이 가능하다. 연구단은 분석을 위해 우선, 시·도 단위 로 분할된 지적도를 전국단위로 합치는 과정을 수행하였다. 그리고 전국 단위로 합친 지적도와 가스사용량 데이터 속성에 공통으로 포 함된 필지고유번호(PNU)를 활용하여 두 데이터를 융합(Attribute Join)하였다. 분석된 결과를 살펴보면, 2017년도 우리나라 전국 가스사용량은 필지기준으로 12~1.4x109KWh의 분포를 보이며, 대부분 대도시 중심지역에서의 사용량이 높게 나타났다. 지역별로 는 서울시 강남구와 중구의 가스사용량이 전국에서 가장 높은 것으 로 나타났다.
이 연구에서 공간빅데이터 기술을 활용하여 전국단위 지적도와 가 스사용량 데이터를 융합하는 데 소요된 시간은 약 3~4분정도이다. 기존의 외산 소프트웨어의 경우, 2GB 이상의 데이터를 분석하는 데 상당한 소요시간이 걸릴 뿐 아니라 분석이 멈추는 경우도 많다. 이 와 같은 기술 개발은 공간빅데이터를 다루는 데 활용도가 클 수밖 에 없다.

공간빅데이터 처리 기술의 기대효과 및 활용방안

공간빅데이터 처리 기술을 기반으로 기존 정보와의 융합 서비스를 실 행하다면 다양한 신(新) 시장 창출과 중소기업 육성뿐 아니라 새로운 일자리 창출까지 기대할 수 있다. 현재 IoT, SNS, 모바일, 건설-IT, 자동차-IT 등의 비즈니스 분야에서 이용되는 정 보의 80% 이상이 공간정보와 관련이 있다. 또한 공간빅데이터 처리기술은 공공부문 공간빅데이터 분석 서비스 제공을 위한 핵심 엔진으로 활용이 가 능하다. 부동산, 지적, 교통 등과 같은 다양한 국토 교통 분야에 대하여 대규모 공간빅데이터 기반 지 식추출, 이벤트 대응, 의사결정 지원, 미래 예측 등 의 분석을 수행하는 데 있어서 저장 및 분석 엔진 으로 활용할 수 있다. 이외에도 공간빅데이터 통계 및 마이닝 등의 분석 서비스도 제공이 가능하다. 실시간 이동경로 분석, 대규모 교통 모니터링, 재난재해 대응 등과 같 은 실증 서비스도 지원할 수 있다. 공간빅데이터 분석 기술의 활용 방 안은 무궁무진하다 할 수 있다.

참고문헌

1. 국가정보화전략위원회, 2012. 스마트 국가 구현을 위한 빅데이터 마스터플랜
2. 국토교통과학기술진흥원, 2017. 국토공간정보의 빅데이터 관리, 분석 및 서비스 플랫폼 기술 개발 연차실적계획서
3. 국토해양부, 2012. 국가공간정보 활용 방안 연구
4. 김민수, 2013. 공간빅데이터 이슈, 한국전자통신연구원
5. 박준민, 이명호, 신동빈, 안종욱, 2015. 공간 빅데이터 서비스 활성화를 위한 정책 과제 도출에 관한 연구, 한국공간정보학회지
6. 빅데이터 전략연구센터, 2012. 빅데이터로 진화하는 세상 – Big Data 글로벌 선 진 사례, 한국정보화진흥원
7. 빅데이터 전략연구센터, 2013. 빅데이터로 진화하는 세상 – Big Data 글로벌 선 진 사례Ⅱ, 한국정보화진흥원
8. 신동빈, 2016.5.25. 국토공간정보의 빅데이터 관리 분석 및 서비스 플랫폼 구축 방안, 96호, 부동산포커스
9. 행정안전부 보도자료, 2018.1.17. 공공 빅데이터센터 구축 본격화
10. 안종욱, 이미숙, 신동빈, 2013. 공간빅데이터 개념 및 체계 구축방안 연구, 한국 공간정보학회지, 21(5): 43-51
11. 안양대 스마트도시공간연구소, 2018. 도봉구 GIS 활용 민원분석 정책지도 구축 계획 최종보고회 발표자료

12. 가트너그룹 홈페이지, www.gartner.com
13. 보건의료빅데이터개방시스템, http://opendata.hira.or.kr/home.do
14. 농림축산식품 공공데이터 포털, http://data.mafra.go.kr/main.do
15. 경기데이터드림, https://data.gg.go.kr/portal/mainPage.do
16. 고속도로공공데이터포털, http://data.ex.co.kr/
17. 휴먼시티수원공공데이터, http://data.suwon.go.kr/pubr/main.do
18. 공공데이터포털, https://www.data.go.kr/

‘공간빅데이터’란 무엇인가?
빅데이터와 공간빅데이터

빅데이터에 대한 정의는 다양하다. 맥캔지(McKinsey) 등은 빅데이 터를 BI(Business Intelligence), DW(Data Warehouse) 등 기 존 IT 시스템이 수집·저장·관리·분석할 수 있는 범위 이상의 데이터 및 데이터로부터 효과적으로 가치를 추출할 수 있도록 고안된 새로 운 기술 등으로 정의한다. IDG는 다양한 데이터로 구성된 방대한 데 이터로부터 고속 캡처, 데이터 탐색 및 분석을 통해 경제적으로 필요 한 가치를 추출할 수 있도록 디자인된 차세대 기술과 아키텍처로 정 의한다. 가트너는 빅데이터가 3V(Volume, Velocity, Variety)의 특성을 가지며, 대량의 데이터가 실시간으로 끊임없이 다양한 형태 로 들어오는 것이라고 정의한다. 특히 가트너의 정의에 따라 빅데이 터의 특징인 3V를 살펴보면, 우선 크기(Volume)로 데이터의 크기 가 대단히 크다는 것을 의미한다. 속도(Velocity)는 데이터가 실시간 으로 변화하며 확장한다는 것을 의미한다. 다양성(Variety)은 기존 의 정형 데이터뿐만 아니라 비정형 데이터까지 다루어야 한다는 것 을 의미한다.
최근 다양한 형태와 내용을 가진 데이터가 폭발적 증가하면서 빅데 이터 시대로 진입하였다. SNS, 모바일 서비스, IoT 등의 발전과 수 많은 데이터들이 재활용되면서 데이터는 기하급수적으로 쌓이고 있 다. 이렇게 축적된 빅데이터로부터 가치 있는 정보를 추출할 수 있 는 신기술들이 등장하고 이를 사업화하여 성공한 기업들이 출현하 면서 빅데이터의 경제적 가치도 날로 높아지고 있다. 더불어 빅데 이터와 관련한 기술, 전략, 산업 전반으로 관심이 크게 증가하고 있 다. 2012년 ‘가트너 10대 기술’은 빅데이터와 관련하여 문맥과 소셜 UX(User eXperience), 차세대 분석기술, 빅데이터, 인메모리 컴 퓨팅, 클라우드 프로그래밍 기술을 선정하였다. 또 미국의 대통령과 학기술자문위원회가 발간한 ‘Designing a Digital Future’ 보고 서에서도 모든 미국 연방정부 기관은 빅데이터 전략을 수립해야 한다고 하였다. 한편 이코노미스트(Economist)는 3IT 성장 동력 중 의 하나로 빅데이터를 제시하였는데, 빅데이터 중에서도 특히 데이 터 형식이 복잡하고 그 볼륨이 급증할 것으로 예상되는 공간빅데이터 (Geospatial Big Data) 처리 기술에 대하여 언급하였다. 때문에 최 근 MIT, 미네소타대학 등에서는 공간빅데이터의 효율적 처리, 분석, 활용에 있어서 수많은 기술적인 도전에 직면할 것으로 예측하고 다양 한 연구를 진행하고 있다.1)

‘공간빅데이터 연구’ 왜 필요한가

이미 오래전부터 공간정보는 지속적으로 축적되었다. 그런데 최근 수치지도, 지적도, 지형도, 위성영상, 항공사진, DEM 정보 등과 같 이 기본 공간정보의 축적과 함께 Open API 등을 통하여 외부에 서비 스되는 과정에서 점차 데이터의 크기가 커지고 있다. 또, 공공시설물 DB, 지하시설물 DB, 부동산 DB, BIM 정보, 재난·재해 정보, 스마 트시티 정보, 위치기반 SNS 정보, VGI(Volunteered Geograpic Information) 등과 같이 다양하게 확장된 공간정보도 지속적인 증 가 과정 및 서비스 제공 과정에서 빅데이터화되고 있다. 이렇게 축적 된 정보는 다양한 서비스에서 기반정보로 사용된다. 일례로 민원정 보의 지도화분석을 들 수 있다. 기존의 민원정보는 텍스트 형태로 담 당자의 경험이나 지식에 의존하여 처리되었다. 그러나 누적된 민원 정보를 분석하여 민원발생 위치를 추출하고, 이를 공간정보 데이터 와 연계하여 지역별 분석결과를 지도화하면 담당자의 판단에도 도움 을 주고, 맞춤형 민원대응이 가능함에 따라 효율적인 정책 지원이 가 능하게 된다.

빅데이터 관련 원천기술은
글로벌 기업들이 주도하고 있으나
공간빅데이터 관련 기술력은
미약한 상황이다.
더 이상 기술 개발에 대한 투자를
머뭇거릴 여유가 없는 상황이다.

이같은 이점 때문에 주요 선진국들은 빅데이터를 미래 국가경쟁력 의 핵심자원으로 판단하고 빅데이터 관련 기술 선점과 지속적인 리 더십을 유지하기 위하여 정부 주도로 대규모 R&D 투자 프로그램 을 진행하고 있다. 우리나라에서도 공간빅데이터 관련 기술 경쟁력 을 확보하고 관련 서비스 산업을 활성화할 수 있는 지원책이 필요하 다. 특히 공간빅데이터 서비스 플랫폼 구축을 위해 필요한 공간빅데 이터 핵심기술 개발에 속도를 내야 한다. 현재 빅데이터 관련 원천 기술은 글로벌 기업들이 주도하고 있으나 공간빅데이터 관련 기술 력은 미약한 상황이다. 더 이상 기술 개발에 대한 투자를 머뭇거릴 여유가 없다.

공공빅데이터 개방 및 관련 기관의 활동

올해 초 정부에서는 빅데이터 활용도 향상을 위해 ‘공공빅데이터센 터’ 구축을 본격 추진한다는 계획을 발표하였다. 그동안 정부와 민간 부문이 보유한 방대한 양의 빅데이터를 분석해 국가 주요정책결정과 전략수립을 지원하는 기구의 필요성은 지속적으로 제기됐다. 다행스 러운 일이다. 공공빅데이터센터는 정부통합 데이터 분석 기능과 공 공·민간 빅데이터센터 허브 기능을 수행할 할 예정이다. 행정안전부 의 발표에 따르면 공공빅데이터센터는 현 국가정보자원관리원의 빅 데이터분석과를 확대·개편하여 데이터분석·처리 전문가 중심으로 조직하되 인력은 최소한으로 구성할 계획이다. 이에 따라 관련 전문 가와 공무원으로 구성된 공공빅데이터센터 설치준비전담조직(TF) 을 발족하고 공공빅데이터센터의 기반이 되는 범정부 데이터 플랫폼 도 구축할 예정이다.

1) G oing Big on Spatial Data, 2013, Sam Madden, MIT7
공간빅데이터 연구방향 및 과제
공간빅데이터 연구의 비전 및 목표

필자는 국토교통과학기술진흥원에서 추진하고 있는 ‘국토공간정보 의 빅데이터 관리, 분석 및 서비스 플랫폼 기술 개발(이하 공간빅데이 터 연구)’를 맡고 있다. 이 사업의 비 전은 ‘공간빅데이터의 창의적 활 용을 통하여 국민을 행복하게 하고, 세계를 이끌어 갈 수 있는 스마트 공간정보 기술 강국을 실현한다’는 데 있다. 이러한 비전을 달성하기 위해 연구개발의 목표를 다음과 같이 세 가지로 설정하였다. 첫째, 공 간정보 관련 세계 G5 진입을 위한 첨단 공간빅데이터 기술 경쟁력 확 보 및 해외 수출 촉진이다. 둘째, 개방·융합·참여를 통한 공간빅데이 터의 창의적 활용이 가능한 생태계 구축이다. 셋째, 사회·안전·복지 등의 현안 사항에 대하여 적시 대응을 할 수 있는 대국민 맞춤형 공간 빅데이터 서비스 제공 추진이다.

그림2. 공간 빅데이터 개발 기술을 활용한 필지기반 전국 가스사용량(2017년) 분석 결과
주) 격자는 분석결과의 지역별 비교를 위해 1㎞×1㎞ 단위로 구분하여 가스사용량을 합산한 결과임.

공간빅데이터 연구개발 주요 연구내용

연구개발 과제에서는 우선 향후 공간빅데이터를 활용한 분석을 체계 적이고 합리적으로 수행할 수 있도록 처리속도가 빠르고, 다양한 분 석기능과 시각화 기능을 제공할 수 있는 플랫폼을 개발하고 있다. 또 한 개발된 플랫폼의 관련 서비스를 활성화하고 실증할 수 있는 내용 을 포함하고 있다. 제1 세부과제는 한국전자통신연구원에서 수행하 고 있는 ‘공간빅데이터 저장 관리 인프라 기술 개발’이다. 주요 연구 내용은 ▲빅데이터 플랫폼 기반 공간정보 지원 프레임워크 기술 개 발, ▲빅데이터 플랫폼 기반 공간 DBMS 기술 개발, ▲공간빅데이 터 웨어하우스 핵심기술 개발 등이다. 제2 세부과제는 한국과학기 술원(KAIST)에서 수행하고 있는 ‘공간빅데이터 분석 및 가시화 기 술 개발’이다. ▲공간빅데이터 분석 프레임워크 기술 개발, ▲공간 빅데이터 일괄(Batch) 분석 컴포넌트 기술 개발, ▲공간빅데이터 Interactive 분석 컴포넌트 기술 개발을 담당한다. 제3 세부과제 는 안양대학교 스마트도시공간연구소에서 수행 중에 있는 ‘공간빅 데이터 서비스 활성화 및 실증 연구’이다. 주요 연구내용으로는 공 간정보 오픈플랫폼 기반 서비스 활성화 및 실용화 방안, 공간빅데이 터 실증 등이다.
현재 개발 중인 공간빅데이터 개발 기술의 사례를 하나 들어 보겠다. <그림 2>는 전국단위 지적도(shp)와 2017년 전국 가스사용량 데이 터(txt)의 융합 분석을 통해 ‘우리나라 가스사용량 분포’를 비교·분석한 것이다.
국토교통부에서 제공하는 지적도(shp)는 전국 합산 약 30GB의 용 량을 가진 대용량 공간정보 데이터로서 시·도 단위로 분할하여 제공 된다. 또한 가스사용량 데이터(txt) 역시 2017년도 전국 합산이 약 2GB에 달하며, 대용량 파일 편집이 가능한 전용 프로그램을 활용해 야만 속성 확인이 가능하다. 연구단은 분석을 위해 우선, 시·도 단위 로 분할된 지적도를 전국단위로 합치는 과정을 수행하였다. 그리고 전국 단위로 합친 지적도와 가스사용량 데이터 속성에 공통으로 포 함된 필지고유번호(PNU)를 활용하여 두 데이터를 융합(Attribute Join)하였다. 분석된 결과를 살펴보면, 2017년도 우리나라 전국 가스사용량은 필지기준으로 12~1.4x109KWh의 분포를 보이며, 대부분 대도시 중심지역에서의 사용량이 높게 나타났다. 지역별로 는 서울시 강남구와 중구의 가스사용량이 전국에서 가장 높은 것으 로 나타났다.
이 연구에서 공간빅데이터 기술을 활용하여 전국단위 지적도와 가 스사용량 데이터를 융합하는 데 소요된 시간은 약 3~4분정도이다. 기존의 외산 소프트웨어의 경우, 2GB 이상의 데이터를 분석하는 데 상당한 소요시간이 걸릴 뿐 아니라 분석이 멈추는 경우도 많다. 이 와 같은 기술 개발은 공간빅데이터를 다루는 데 활용도가 클 수밖 에 없다.

공간빅데이터 처리 기술의 기대효과 및 활용방안

공간빅데이터 처리 기술을 기반으로 기존 정보와의 융합 서비스를 실 행하다면 다양한 신(新) 시장 창출과 중소기업 육성뿐 아니라 새로운 일자리 창출까지 기대할 수 있다. 현재 IoT, SNS, 모바일, 건설-IT, 자동차-IT 등의 비즈니스 분야에서 이용되는 정 보의 80% 이상이 공간정보와 관련이 있다. 또한 공간빅데이터 처리기술은 공공부문 공간빅데이터 분석 서비스 제공을 위한 핵심 엔진으로 활용이 가 능하다. 부동산, 지적, 교통 등과 같은 다양한 국토 교통 분야에 대하여 대규모 공간빅데이터 기반 지 식추출, 이벤트 대응, 의사결정 지원, 미래 예측 등 의 분석을 수행하는 데 있어서 저장 및 분석 엔진 으로 활용할 수 있다. 이외에도 공간빅데이터 통계 및 마이닝 등의 분석 서비스도 제공이 가능하다. 실시간 이동경로 분석, 대규모 교통 모니터링, 재난재해 대응 등과 같 은 실증 서비스도 지원할 수 있다. 공간빅데이터 분석 기술의 활용 방 안은 무궁무진하다 할 수 있다.

참고문헌

1. 국가정보화전략위원회, 2012. 스마트 국가 구현을 위한 빅데이터 마스터플랜
2. 국토교통과학기술진흥원, 2017. 국토공간정보의 빅데이터 관리, 분석 및 서비스 플랫폼 기술 개발 연차실적계획서
3. 국토해양부, 2012. 국가공간정보 활용 방안 연구
4. 김민수, 2013. 공간빅데이터 이슈, 한국전자통신연구원
5. 박준민, 이명호, 신동빈, 안종욱, 2015. 공간 빅데이터 서비스 활성화를 위한 정책 과제 도출에 관한 연구, 한국공간정보학회지
6. 빅데이터 전략연구센터, 2012. 빅데이터로 진화하는 세상 – Big Data 글로벌 선 진 사례, 한국정보화진흥원
7. 빅데이터 전략연구센터, 2013. 빅데이터로 진화하는 세상 – Big Data 글로벌 선 진 사례Ⅱ, 한국정보화진흥원
8. 신동빈, 2016.5.25. 국토공간정보의 빅데이터 관리 분석 및 서비스 플랫폼 구축 방안, 96호, 부동산포커스
9. 행정안전부 보도자료, 2018.1.17. 공공 빅데이터센터 구축 본격화
10. 안종욱, 이미숙, 신동빈, 2013. 공간빅데이터 개념 및 체계 구축방안 연구, 한국 공간정보학회지, 21(5): 43-51
11. 안양대 스마트도시공간연구소, 2018. 도봉구 GIS 활용 민원분석 정책지도 구축 계획 최종보고회 발표자료

12. 가트너그룹 홈페이지, www.gartner.com
13. 보건의료빅데이터개방시스템, http://opendata.hira.or.kr/home.do
14. 농림축산식품 공공데이터 포털, http://data.mafra.go.kr/main.do
15. 경기데이터드림, https://data.gg.go.kr/portal/mainPage.do
16. 고속도로공공데이터포털, http://data.ex.co.kr/
17. 휴먼시티수원공공데이터, http://data.suwon.go.kr/pubr/main.do
18. 공공데이터포털, https://www.data.go.kr/