KAIST, 선제적으로 말 걸기 좋은 최적 시점 결정 기술 개발
스스로 대화 시작·중지·재개…지능적인 음성 서비스 제공

사람이 말을 걸기 전에 먼저 말을 거는 스마트 스피커의 선제적 서비스가 작동하는 방식이다. 용건만 바로 말하기보다는
사람이 말을 걸기 전에 먼저 말을 거는 스마트 스피커의 선제적 서비스가 작동하는 방식이다. 용건만 바로 말하기보다는 "안녕하세요"와 같이 대화의 시작을 알리는 문장으로 말을 건다. 사진=KAIST 제공
일명 눈치 보는 스마트 스피커가 등장할 예정이다. 이 스마트 스피커는 사용자의 요청이 있기 전에 선제적으로 말 걸기 좋은 최적의 시점을 결정해 스스로 대화를 시작하거나 중지하는 등 지능적인 음성 서비스를 제공할 수 있다.

28일 KAIST에 따르면 전산학부 이의진 교수 연구팀과 산업디자인학과 이상수 교수 연구팀은 스마트 스피커가 선제적으로 음성서비스를 제공하기 좋은 최적의 시점을 찾는 연구를 진행했다. 최적의 발화 시점을 찾는 것인데, 스마트 스피커가 음성서비스를 시작하거나 중지하는 행위를 스스로 결정하고 제어하기 위한 필수적인 기술이다.

연구진은 우선 실험용 스마트 스피커를 제작해 사용자 움직임이 있거나 일정 시간이 지나면 주기적으로 "지금 대화하기 좋은가요"란 질문을 하게 했다. 이어 참가자가 `예` 또는 `아니오`로 대답하고 무엇을 하고 있었는지를 설명하게 했다. 연구진은 교내 기숙사에 사는 학생 40명의 방에 스마트 스피커를 설치해 일주일간 이같은 방식의 사용자 응답 데이터를 수집했다.

그 결과 대화하기 적절한 시점을 결정하는 상황 맥락 요인이 크게 개인적 요인과 움직임 요인 그리고 사회적 요인이 있다는 점을 찾아냈다.

개인적 요인은 활동 집중도, 긴급함·바쁨 정도, 정신·육체적 상태, 다중 작업 수행을 위한 듣기·말하기 가능성 등 4가지로 이뤄졌다. 가령 공부를 하거나 드라이로 머리를 말리는 등 집중하고 있을 때는 스마트 스피커와 대화가 어려웠다. 움직임 요인은 외출·귀가·활동 전환 등 3가지인데, 사용자 움직임이 있을 때 스피커와 대화 가능한 거리가 최적 시점 판단에 큰 영향을 미치는 것으로 나타났다. 예를 들어 스마트 도어락 또는 현관 모션 센서 등으로 귀가를 감지한 뒤 대화를 시작하는 게 효과적이란 분석이다. 사회적 요인으론 전화 대화나 누군가와 있을 때 스마트 스피커와 대화하는 데 영향을 끼친다는 점을 파악했다.

KAIST 관계자는 "이번 연구가 미래 스마트 스피커 개발의 중요한 토대가 될 것"이라며 "앞으로는 센서 데이터로 감지된 상황 맥락 정보를 활용해 스마트 스피커 스스로 대화를 시작·중지하거나 재개하기 좋은 타이밍을 선제적으로 감지해 지능적인 음성 서비스를 제공할 수 있을 것"이라고 밝혔다. 장진웅 기자

<저작권자ⓒ대전일보사. 무단전재-재배포 금지>

장진웅
저작권자 © 대전일보 무단전재 및 재배포 금지