빅데이터가 인공지능 알고리즘의 원료라는 것은 이제 많은 사람들이 공감하는 개념이 되었다. 그러한 측면에서 볼 때, 분야별 전문지식을 이해하고 학습할 수 있는 형태로 데이터베이스화한 빅데이터는 해당 분야의 4차 산업혁명을 견인하는 원동력이다. 특히 연구개발과 관련된 연구 빅데이터의 경우 공유가치 극대화가 실현될 수 있는 가장 영향력 있는 분야다. 선진국은 연구데이터를 관리 및 활용하기 위한 정책과 제도를 적극적으로 시행 중이다.

미국은 백악관 과학기술정책실의 연구데이터 관리 및 공유에 대한 지침(2013년)을 기반으로 정책을 추진 중이다. 공적자금이 투입된 연구데이터(과제예산 1억 달러 이상)에 대해 연구기관별 관리 및 공개 지침을 운영 중이며, 연구 기획단계에서 데이터관리계획(Data Management Plan·DMP) 제출을 의무화하고 있다. 연구 종료 후 12개월의 엠바고 기간 이후 공공에 공개하는 것을 원칙으로 하고 있다. 또한, 과학 분야별로 4개의 빅데이터 지역 혁신 허브를 구축하여 원본 통합 수집을 추진 중이다. 혁신 허브는 △헬스케어 등에 특화된 남부 허브 △에너지 분야 등에 특화된 북동부 허브 △농업·식품 등에 특화된 중서부 허브, 빅데이터 기술과 데이터 집중 발견 분야 등에 특화된 서부 허브이다.

영국의 정보자유법은 공개정보 범위에 데이터셋을 포함시켜며 광의의 데이터를 공개 대상으로 규정하고 있다. 영국의 국가연구위원회는 공동원칙을 통해 7개의 연구위원회(예술인문, 생명과학, 공학물리, 경제사회, 의학, 자연환경, 과학기술설비)가 독자적으로 분야별 특성을 반영한 데이터 관리 및 공유정책을 시행토록 하고 있다. 실제 데이터관리계획(DMP)은 공학물리연구위원회를 제외한 6개 연구위원회가 의무 제출 규정을 마련해 시행 중이다. 대량의 연구데이터를 저장하고 공유할 수 있는 공유데이터 센터와 데이터의 활용을 지원하는 디지털 큐레이션 센터를 구축하여 운영 중이다.

호주는 정보자유법(FOIA)에 의해 모든 정부 정책 관련 데이터를 공개대상으로 하고 있다. `책임 있는 연구수행을 위한 국가지침(the Code)`을 통해 연구데이터를 포함한 산출물(연구소유권, 저작권, 지재권 등)에 대한 관리 규정을 마련하고 시행 중이다. 2014년부터 호주연구위원회(Australian Research Council)의 재정지원을 받는 연구기관은 의무적으로 데이터관리계획을 제출하도록 규정하고 있다. 한편 국가 차원에서 통합 연구데이터를 공유하고 활용할 수 있도록 지원하는 호주국가데이터서비스(ANDS)를 통해 연구기관들의 데이터를 목록화하고 메타데이터를 수집해 검색 및 서비스하고 있다. 호주의 이러한 중앙 집중적 체제가 성공적으로 운영되는 데에는 정부의 강력한 의지도 있고, 전통적으로 생명의료 분야 중심의 집중화된 과학기술 연구 분야 특성도 작용한 것으로 파악된다.

우리나라의 경우는 국가 차원의 연구데이터 관리 및 공유 체계가 아직은 부재하다. 기상청(기후데이터), 질병관리본부(임상, 유전체 데이터)와 같은 개별기관이나 CERN(유럽)과 KEK(일본)처럼 고에너지 물리 분야국제공동연구 차원에서 일부 데이터를 수집 및 관리하는 상황이다.

빅데이터급 규모의 관측실험데이터를 위한 대형 연구장비 구축에도 데이터 관리 및 공동 활용에 대한 체제고려가 아직은 미흡한 것도 사실이다.

최근 우리 정부도 R&D 전 과정의 연구데이터를 빅데이터 화하는데 집중하고 있다. 이를 기반으로 인공지능을 적용하고 활용할 수 있는 체제를 구축해 R&D 성과 제고를 위해 노력을 기울이고 있다. 이제 우리도 장기적인 관점에서 데이터 수집과 관리 제도를 마련하고 연구데이터 공동 활용을 위한 인프라와 플랫폼, 생태계 구축을 고려한 체계 구축을 추진할 것으로 기대된다. 주요 추진 전략이자 고려사항은 해외사례 분석과 전문가 의견을 종합한 결과 네 가지로 요약할 수 있다. 첫째, 분야별 특성을 고려한 추진방안 마련, 둘째, 연구커뮤니티 수요 기반 추진, 셋째, 우선 순위에 따라 성공사례 창출 후 점진적 분야 확장 추진, 넷째, 연구 데이터플랫폼 구축 지원이다. 이는 연구데이터의 공동활용 체제 분야에서 후발주자로서 우리나라가 효과적이고 효율적인 정책을 추진하기 위한 필수적인 전략으로 사료된다. 이번 연구 빅데이터 관리 및 활용 체제 마련 정책 실행을 통해 우리나라의 과학기술 경쟁력과 수준이 한층 더 업그레이드 될 것으로 기대된다. 서민호 한국과학기술정보연구원 미래정책연구부장

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

저작권자 © 대전일보 무단전재 및 재배포 금지