음향장면인식 분야서 두각

한국전자통신연구원(ETRI)은 최근 인공지능 기반 음향 이벤트·장면 인식 기술 경진 대회(DCASE)에서 `음향 장면 인식 분야`에 참가해 우승을 차지했다. 사진은 연구진들이 개발한 차세대 다채널 오디오 프로세서 기술을 시연하는 모습. 사진=전자통신연구원 제공
한국전자통신연구원(ETRI)은 최근 인공지능 기반 음향 이벤트·장면 인식 기술 경진 대회(DCASE)에서 `음향 장면 인식 분야`에 참가해 우승을 차지했다. 사진은 연구진들이 개발한 차세대 다채널 오디오 프로세서 기술을 시연하는 모습. 사진=전자통신연구원 제공
국내 연구진이 인공지능(AI) 기반 음향 인식 기술 국제대회에서 세계 정상에 올랐다.

한국전자통신연구원(ETRI)은 지난 3일 `인공지능 기반 음향 이벤트·장면 인식 기술 경진 대회(DCASE)`에서 `음향 장면 인식 분야`에 참가해 우승을 차지했다고 20일 밝혔다.

지난 3월부터 6월까지 열린 이번 대회에는 6개 분야 모두 138개팀(473개 제안 시스템)이 참가해 경쟁했다.

ETRI가 참가한 음향 장면 인식 분야에선 여러 종류의 단말기로 녹음한 소리를 듣고 녹음 장소를 알아맞히는 과제가 주어졌다.

액션캠과 스마트폰 등 장비별로 다른 신호 특성을 정확하게 판단하는 분야로 `일반화 성능`이 관건이다.

가령 프랑스 파리 지하철에서 나는 소리를 스마트폰 녹음 파일(학습용 음향 데이터)로 제공하면 이를 인식하는 시스템을 개발한 뒤, 학습에 쓰이지 않았던 액션캠으로 녹음한 지하철 소리를 들려주면서 상황을 맞힐 수 있는지 평가하는 방식이다.

연구진은 소리를 주파수 대역별로 나눠 모델이 각각 학습을 할 수 있도록 만든 `딥러닝 기반 트라이던트(Trident) 구조 신경망` 등을 개발해 선보였고

시스템 순위 1·2위에 이어 팀 순위에서도 1위를 차지했다.

이 기술은 노약자·청각 장애인 등을 위한 `위험 회피 기술` 분야에 쓰일 것으로 기대받는다.

한편, 올해 6회째인 DCASE는 세계 최대 전기·전자기술자협회(IEEE) AASP가 주관하고 구글·인텔·삼성·LG 등 세계 유수 기관이 참가하는 음향 기술 관련 유일한 대회다.장진웅 기자

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

장진웅
저작권자 © 대전일보 무단전재 및 재배포 금지