하지만 이러한 소프트웨어가 임상에서 질병의 예측과 진단 그리고 치료에 활용되기까지는 시간이 필요하다. 또한 이는 의사들의 진료에 보조적인 역할을 하는 임상 의사 지원의 성격을 가지게 된다. 인간의 생명을 다루는 의료 분야에서 윤리적인 측면의 접근 또한 매우 중요하다.
예를 들어 인공지능 검사를 통해 환자의 암 발생 확률이 30%라고 했을 때 `암이란 이유로 미리 치료를 권장해야 할 것인가`, `아니면 이전처럼 지켜보자고 해야 할 것인가`하는 문제에서 최종적으로는 의사의 판단에 의존할 수밖에 없다.
인공지능 소프트웨어 정확도는 대규모 의료 데이터의 확보와 데이터의 편향성을 제거하는 여부에 따라 결정된다고 할 수 있다. 또한 예측이나 진단의 결과에 대한 해석 가능성이 담보돼야만 의사의 진료 행위에 유용하게 활용될 수 있다. 데이터의 편향성과 딥러닝 결과의 이해에 있어서도 수학적 분석을 통한 이상 탐지 알고리즘이나 특징 영역 탐지 및 성분 분석 알고리즘으로 정확도와 해석 가능성을 높일 수 있다.
현재 전 세계적인 코로나19 팬데믹 상황에서 선진국을 중심으로 백신 개발이 진행되고 있다. 보통의 경우에는 백신 개발에는 15억 달러 이상의 막대한 비용과 5년에서 10년 이상의 긴 시간이 필요하다. 국제적인 공조로 18개월로 단축시키기를 기대하고 있다. 백신 개발이나 신약 개발에 있어서 장기간의 시간이 소요되는 중요한 단계는 후보 물질을 찾아내는 과정이다. 현재는 신약 개발 맞춤형 다양한 인공지능 플랫폼을 구축하기 위한 알고리즘 개발 연구가 활발하게 이뤄지고 있다. 질병의 표적이 되는 원인 단백질을 규명하고 단백질 구조에 밀착하는 약물을 찾아내는 과정을 거치게 된다. 이러한 후보 물질의 활성도 예측을 통한 과정에서 대규모의 활성도 실험 데이터가 필요한데, 개별의 제약회사들이 보유하고 있는 비공개 데이터들로 인해 데이터 통합이 불가능하다. 공개돼 있는 공적 데이터를 중심으로 통합하고 분석해 최종적으로 활성도를 예측하는 알고리즘 개발에 있어서도 수학적 분석이 필요하다.
민족의 명절인 추석이 다가오고 있다. 여론은 바이러스 확산을 막기 위해 명절 기간 중 이동 제한 조치가 필요하다고 조사되고 있다. 명절 기간 내의 접촉을 통한 바이러스 확산 예측을 하기 위해서는 시도별 인구 이동 자료, 고속도로 진출입 자료, 항공기 이용객 자료, 열차 및 선박 이동 자료 등과 17개 광역시별 확진자 관련 세부 자료 등이 필요하다. 이러한 인구 이동 자료와 방역 관련 데이터는 개인정보 유출 문제와 통합적인 자료관리 시스템의 부재로 획득 단계에서 어려움이 발생한다. 정부에서도 이러한 데이터 제공을 통한 확산 예측이 이뤄지고, 이를 근거로 한 세밀한 방역 정책 및 지침이 수립돼 코로나바이러스 확산이 진정되길 기대해 본다.
조도상 국가수리과학연구소 산업수학연구본부장
<저작권자ⓒ대전일보사. 무단전재-재배포 금지>