한 강연장에 황소 한 마리가 나타났다. 강연자가 이 황소의 무게를 500여명의 청중들에게 맞춰보라고 했지만, 단 한명도 무게를 정확히 맞추지 못했다. 반면에, 청중들이 적어낸 무게를 모두 합산하여 평균을 내보니 813kg이었고, 놀랍게도 실제 황소의 무게인 814kg과는 불과 1kg밖에 차이가 나지 않았다. 이 사례는 많은 데이터가 모이면 의미있는 정보를 얻을 수 있고, 더 나아가 새로운 가치 창출이 가능하다는 것을 보여준다. 
 
방대한 양의 데이터를 분석하여 개인의 행동이나 사회적인 현상을 예측하는 기술을 거대자료(빅데이터, Big Data)라고 한다. PC와 인터넷, 모바일 기기의 이용이 생활화된 이후, 데이터의 양이 기하급수적으로 증가하면서 이를 어떻게 활용할 것인지가 중요하게 부각되었다. 유튜브, 사회관계망서비스(SNS), 이메일 등을 통해 인류가 쏟아낸 데이터의 양은 2011년 1조 9천억 기가바이트였는데, 2012년에는 이보다 40% 증가한 2조 7천억 기가바이트를 기록했다. 그리고 오는 2020년에는 무려 35조 기가바이트에 도달할 것으로 전망되고 있다.    
   
이렇게 방대한 양의 데이터를 얼마나 잘 활용하느냐에 따라 기업의 경쟁력에도 큰 차이가 발생한다. 전세계에서 거대자료를 가장 잘 활용한 기업으로는 구글(Google)이 꼽힌다. 구글은 수천만 권의 도서, 유엔과 유럽회의의 의사록, 웹사이트 자료 등을 활용하여 100개가 넘는 언어 간의 자동번역 시스템을 개발하였다. 지금은 5억 명 이상이 이용하고, 매일 1천억 회의 번역이 이뤄지는 가장 부가가치 높은 서비스로 자리 잡았다. 제조업도 예외는 아니다. 세계적인 의류업체인 자라(ZARA)는 전세계 판매 현황을 실시간으로 분석하여 수요가 높은 의류를 빠르게 공급할 수 있는 물류망을 구축했고, 그 결과 재고 부담은 줄이고 매출은 극대화할 수 있었다.  
민간분야뿐만 아니라 정부를 포함한 공공부문에서도 거대자료를 활용하여 공공서비스의 질을 한 단계 높이기 위한 움직임이 활발하다. 이미 많은 국가와 지자체에서는 우범지역을 예측하여 순찰차를 선제적으로 배치해 범죄율을 줄이거나, 시간대별 승객 수를 분석하여 버스 노선을 설계하는 등 공공행정에 거대자료를 다양하게 활용하고 있다. 최근에는 공공부문이 보유한 데이터를 외부에 적극적으로 개방하고, 민간에서 이를 활용하여 새로운 비즈니스모델과 일자리를 만들고 있다. 
 
해양수산 분야에서도 해양환경, 수산, 해상물류 등과 관련하여 매년 5천 기가바이트가 넘는 데이터가 생산된다. 이 데이터들은 해양예보·예측의 정확도 개선, 선박의 안전ㆍ자율운항 서비스 제공, 스마트 양식장 운영, 해양공간의 통합관리 등 다양한 분야로 활용 범위를 확대해 나가고 있다. 예컨대, 국립수산과학원은 510개 조사지점에서 자체 수집한 수온 정보, 국립해양조사원의 해양환경 정보, 미국 해양대기청(NOAA)의 예보 자료 등을 종합ㆍ분석하여 ‘적조예측시스템’을 만들었다. 과거에 비해 적조의 발생과 이동·확산을 과학적으로 예측할 수 있게 되어 보다 신속한 적조 대응이 가능해졌다.  
 
해양수산부는 앞으로 해양수산 거대자료의 활용을 더욱 촉진하기 위하여 “제1차 해양수산정보 공동이용 종합계획”을 수립했다. “해양수산정보의 가치 창출 데이터 허브 바다(VADah, Value Added Data Hub) 실현”을 목표로 2021년까지 3년간 121억원을 투입한다. 앞으로 해양수산정보의 품질관리를 강화하고, 통합 포털을 통해 원스톱 서비스를 제공하는 등 이용자의 접근성과 편의성을 높여 나갈 계획이다. 
    
해양수산 분야에서 거대자료의 활용은 아직까지 시작단계이다. 그러나  해양강국의 위상에 걸맞은 수준 높은 해양수산 행정서비스를 제공하기 위해 거대자료의 활용은 필요불가결한 선택이다. 우리 해양수산 현장과 일반 국민 누구나 더욱 편리하게 해양수산 행정서비스를 제공받고, 민간에서도 해양수산 정보를 활용한 창업이 활성화되는 밝은 미래를 그려본다. <김양수 해양수산부 차관>
저작권자 © 수산신문 무단전재 및 재배포 금지