AI 기술 수준 미·중·일에 뒤처져
관련 연구 촉진 등에 근본적 역할

`기계학습 데이터(기계가 학습할 수 있도록 정제된 데이터)`가 정부의 디지털 뉴딜의 성공 키워드로 꼽힌다. 디지털 뉴딜의 핵심인 인공지능(AI)의 활성화에 기계학습 데이터가 씨앗 역할을 할 것이란 분석이다.

한국과학기술정보연구원(KISTI)은 26일 발간한 `KISTI 이슈 브리핑 제26호`를 통해 과학기술 기계학습 데이터 구축과 활용 방안에 대해 소개했다. 현재 우리나라 AI 기술 수준은 세계 1위인 미국의 81.6% 수준인데, 중국 88.7%, 일본 86.1%보다 낮게 나타나고 있다. 또 전 세계 AI 핵심 인재 500명 가운데 한국 출신은 1.4%에 그치면서 미국 14.6%, 중국 13%에 크게 뒤처진 상태다.

디지털 뉴딜의 성공을 위해선 AI 활성화가 무엇보다 중요하다. AI는 지속적이며 신뢰성 있는 양질의 학습데이터 확보가 필수적이다. 기계학습 데이터가 AI 연구 촉진과 관련 산업 발전에 근본이라 평가받는 이유다.

그러나 우리나라는 주로 해외에서 공개된 기계학습 데이터를 활용해 AI 기술 개발 등을 하고 있다. 특히 과학기술 분야 기계학습 데이터는 공공·일반 분야보다 상대적으로 부족하다는 지적이다. 정확도 등 AI 기술 성능을 고려할 때 과학기술 분야 대량의 학습데이터가 필요한 실정이다.

또한 기계학습 데이터 확보 역량도 부족한 상황이다. 우리나라 산·학·연 연구자들은 과학기술 분야 연구를 AI 기반으로 수행하고 싶어도 연구에 필요한 학습데이터를 자체적으로 확보할 역량이 부족하다는 것이다. 구축을 위한 많은 시간과 비용도 발목을 잡는다는 진단이다.

이에 정부는 올 추가경정예산 296억 원을 들여 지난달부터 KISTI에서 과학기술 기계학습 데이터 구축 사업을 추진하고 있다. 이 사업은 올해 말까지 과학기술 기계학습 데이터의 대규모·AI 학습 데이터 구축을 목표로 한다. 이를 통해 디지털 뉴딜의 성공 조건인 데이터 표준화, 기업 데이터와의 연계, 데이터 활용 프로세스를 견인하겠다는 구상이다. 황혜경 KISTI 콘텐츠큐레이션센터 센터장은 "기계학습 데이터는 디지털 뉴딜 사업의 씨앗 같은 역할을 할 것"이라며 "AI 등 과학기술 분야뿐 아니라 전 산업 분야에서 활용할 수 있을 것으로 기대한다"고 강조했다. 장진웅 기자

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

장진웅
저작권자 © 대전일보 무단전재 및 재배포 금지