남의 성과물만 가져다 쓰면 한계 기초연구 알고리즘 경쟁력 강화 훈련·인센티브 '지적 자극' 필요

몇 해 전에 구글의 수학자를 워크숍에 초청했다. 발표 동영상을 찍지 말아 달라 하더니 발표 파일도 남기지 못한다고 양해를 구했다. 그럴 수밖에 없으려니 했다. 나름 폐쇄적인 회사의 숙명을 가지고 있는 회사니까. 시대를 앞서가는 연구를 하고 자율주행 자동차 등에서 치고 나가는 구글에게, 그 과실의 사업화를 위한 기업 비밀 유지가 왜 중요하지 않겠는가. 그런 구글이 작년 11월에 기계학습 소프트웨어인 텐서플로를 누구나 수정까지 할 수 있게 공개하자 인공지능에 한발 걸친 사람들은 환호했다. 보통 사람들은 기계학습이니 딥러닝이니 하는 말을 들어본 적도 없던 때였다. 올봄에 알파고 충격이 우리나라를 강타한 뒤에는 초등학생에게도 생소하지 않은 말이 됐으니 상전벽해다. 알파고로 화들짝 놀란 우리 사회에 열띤 후속 논의가 이루어졌다. 인공지능의 주요 알고리즘은 공개되어 오픈 이노베이션으로 발전할 것이니, 부족한 데이터를 쌓는 게 시급하다는 의견이 대세다. 구글이 알고리즘은 공개해도 데이터는 공개 안 한다고도 한다.

어디서 이런 착시와 오해가 생겼을까. 구글이나 테슬라가 자율주행 자동차의 상세 작동 알고리즘을 공개할 거라는 건 환상이다. 집단지성으로 기술을 다 같이 발전시키는 게 합리적이지만, 지금은 보편적(generic) 수준의 개방을 크게 넘지 못한다. 알파고 기술이 공개됐다는 것도 오해다. 알파고의 요소 알고리즘과 전체적인 작동방식은 네이처 논문의 형식으로 공개됐지만, 타사의 인공지능 바둑 프로그램이 알파고의 정확도를 재현하고 있나? 상세 알고리즘이 있으면, 공개된 기보 데이터를 수집해서 학습한 뒤에, 끊임없이 다른 프로그램과 두어보면서 방대한 추가 데이터를 만들고 축적해서 학습할 수 있다. `하면서 배우는(learning by doing)` 것이다.

결국 타 기업이 못 따라가는 이유는, 데이터의 부족이 아니라, 몬테카를로 서치를 어느 정도의 규모로 하는지, 딥러닝의 히든레이어 수는 어떻게 정하는지 등의 기술적 내용이 철저하게 비밀로 유지되는 탓이다. 알파고를 만들어낸 영국 회사 딥마인드는 그 상세 알고리즘을 모기업인 구글에게도 비밀로 한다고 알려져 있다.

예전 인공지능의 대세였던 규칙기반 방식에 비해서 지금의 기계학습은 데이터를 학습하며 의미를 읽어낸다. 의료에서 질병 가능성을 판단하기 위해 환자의 신체 측정치가 예전 환자들의 측정치와 흡사한지를 계산하는 데서 보듯이, 그 핵심은 수학의 최적화 이론 활용이다.

축적된 데이터는 물론 중요하다. 의료 데이터를 축적해야 정확한 진단을 하는 닥터 알파고가 나올 수 있고, 자율주행 데이터를 축적해야 스스로 운전하는 차들이 길거리에 나다닐 수 있다. 하지만, 그 데이터로부터 의미를 찾아내고 인간에게 유익한 최종 제품으로 만들어내는 핵심은 수학적 알고리즘이다. 먼저 기술을 개발하는 선진국이 다 공개할 것이니 우리는 그런 건 걱정 안 해도 된다니. 아예 지금부터 영원토록 따라잡기만 하자는 말과 뭐가 다른가. 안드로이드라는 공개 운영체제를 믿고 하드웨어에 일로매진한 우리 기업들이, 이제 구글의 고급형 스마트폰인 픽셀이라는 강력한 경쟁자를 맞게 됐다. 구글의 스마트폰 사업이 폐쇄형 기업 애플을 닮아간다는 말도 나온다.

애플도, 페이스북도, 구글도, 테슬라도, 우버도, 중국 기업 바이두도 모두 강력한 자체 인공지능 알고리즘 연구팀을 운영한다. 이 분야 우수 연구자들을 휩쓸어가는 바람에, 대학과 연구소들은 인재 구하기가 너무 힘들다고 하소연한다. 이 인재들이 열심히 데이터만 모으고 있나. 결국, 기초 연구가 중요하다. 데이터를 모을 뿐 아니라, 그 데이터로부터 의미를 읽어내는 알고리즘 연구에서 세계적인 경쟁력을 가져야 한다. 남이 만든 것 가져다 쓰면 된다는 시각은 분명 무모하다. 이 분야 국내 연구자가 충분치 않지만, 인접 분야의 연구자들에게 적절한 훈련과 인센티브를 제공해서 새로운 지적 자극을 경험하게 한다면 돌파구를 만들 수 있지 않을까. 박형주 국가수리과학연구소장

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

김정원
저작권자 © 대전일보 무단전재 및 재배포 금지