최원춘 한국화학연구원 부원장
최원춘 한국화학연구원 부원장
2016년 이세돌과 구글 딥마인드 알파고의 세기의 바둑 대결은 많은 주목을 불러일으켰다. 인공지능 알파고의 힘은 빅데이터에 있었다. 알파고는 바둑의 빅데이터 "기보"를 통해 다양하고 심오한 바둑의 수를 익혔던 것이다. 1년 후 알파고는 스스로 바둑을 두며 기보를 생성하고, 바둑의 최고 고수라 알려진 중국의 커제에게 완승을 거두었다. 이처럼 인공지능은 빅데이터를 떼어 놓고는 이야기할 수 없다.

빅데이터는 이미 우리의 생활에 깊숙이 들어와있다. 밤에 온라인으로 주문한 신선 식품을 다음날 새벽에 배송해 주는 `새벽 배송`도 빅데이터의 결과다. 심지어 배송 경로도 빅데이터를 활용해 최적의 동선을 찾아 최대한 짧은 시간에 신선 식품을 소비자에게 배달해 주고 있다.

과학 분야에서 빅데이터는 어떻게 활용되고 있을까? 2000년 인간 게놈 지도 완성을 비롯해, 선진 글로벌 제약사들을 중심으로 신약 개발에 화합물 빅데이터 및 인공지능 기술이 활발히 활용되고 있다. 최근에는 소재 분야에서도 글로벌 화학 기업의 빅데이터 및 인공지능 활용 성공 사례들이 보고되고 있다.

그러나 누구나 빅데이터를 자유롭게 만들고 활용할 수 있는 것은 아니다. 데이터 자체가 중요한 자산이 되어서, 빅데이터를 보유하고 있는 기업이 이를 외부에 공유하지 않기 때문이다. 특히 대부분의 중소기업과 대학 연구실은 자체적으로 빅데이터를 생성하거나 인공지능에 접근하기가 쉽지 않다. 따라서 공공기관인 출연연의 역할이 매우 중요하다. 출연연에서 데이터 공유 플랫폼을 구축하고 제공하면 많은 연구실이 이를 활용할 수 있다.

한국화학연구원은 이러한 공유 플랫폼의 필요성을 20여 년 전에 인지하고, 신약 개발에 필요한 화합물과 데이터를 수집·공유하는 `한국화합물은행`을 설립했다. 한국화합물은행은 2000년 8,000종의 화합물로 출발해 20년이 지난 현재 67만종 이상의 라이브러리를 보유하고 있다. 그동안 1,000여 연구과제에 920만 개 이상의 화합물을 지원하였다. 2018년부터는 화합물 구조 데이터와, 공개가능한 화합물 활용 약효 데이터의 분양을 시작했다. 작년부터는 코로나 감염병 백신 및 치료제 개발에도 많은 기여를 하고 있다. 관련해서 2020년 화합물은행의 화합물 지원 건수가 크게 증가해, 신약 개발을 위한 공유 데이터 플랫폼으로서의 한국화합물은행 역할을 실감할 수 있었다.

연구원이 구축하는 빅데이터 공유 플랫폼은 비단 신약 개발에만 국한되지 않는다. 최근 한국화학연구원은 소재 빅데이터 공유 플랫폼을 구축하고 있다. 한국화학연구원이 구축하고 있는 "Chemical Data Explorer"에서는 공개된 소재 데이터와 연구자들이 제공하는 소재 데이터의 통합 검색 시스템이 운영될 예정이다. 다양한 소재 응용 분야에 특화된 소재 데이터를 수집하고 활용할 수 있는 플랫폼을 개발하고 있다. 특히 화학 분야의 데이터를 다루는 데 특화된 인공지능 플랫폼을 구축하여 올 여름에 공개할 준비를 하고 있다.

한국화학연구원에서 구축한 데이터 공유 플랫폼이 더욱 다양해지고 활성화되어, 좀 더 많은 연구자들이 빅데이터에 접근하고 인공지능을 활용할 수 있기를 기대한다. 그래서 이전에 실험실 수준의 데이터에서는 찾을 수 없었던 새로운 과학적 지식을 찾아낼 수 있기를 바란다. 앞으로 빅데이터와 인공지능은 화학기술의 미래에 새로운 영향을 끼칠 것이다. 가까운 미래로는 현재의 코로나를 종식시킬 수 있는 새로운 치료제 또는 에너지 문제를 해결할 수 있는 신소재가 빅데이터와 인공지능으로 개발될 수 있지 않을까? 알파고가 기보를 통해 여러 바둑의 수를 읽었듯, 화학기술도 빅데이터 공유 플랫폼을 통해 새로운 시너지 효과를 창출할 수 있기를 기대한다. 최원춘 한국화학연구원 부원장

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

저작권자 © 대전일보 무단전재 및 재배포 금지