뷰페이지

“못 알아들어 속터지는 AI 스피커 이제 끝”

“못 알아들어 속터지는 AI 스피커 이제 끝”

유용하 기자
유용하 기자
입력 2021-02-15 15:07
업데이트 2021-02-15 15:07
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

카이스트 이건재 교수팀, 사람 귀 흉내낸 고감도 음성인식센서 개발

못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
국내 연구진이 음성인식 고감도 인공지능 기반 기술을 개발했다.

언스플래쉬 개발
최근 인공지능(AI) 스피커를 사용하는 사람들이 많아지고 있다. 음성인식 수준이 높아졌다고는 하지만 여전히 제대로 알아듣지 못하고 엉뚱한 답변을 내놓거나 다른 명령을 수행하는 경우가 있다. 여전히 ‘못 알아들어’ 속터지는 경우가 잦다. 이에 국내 연구진이 사람의 귀를 흉내내 초고감도 인공지능 기반 음성센서를 개발해 주목받고 있다.

카이스트 신소재공학과 연구팀은 음성 주파수 영역에서 센서의 막이 큰 진폭으로 진동하는 공진현상을 활용해 전기신호가 만들어지는 공진형 유연 압전 음성센서를 개발해 정확도가 높은 초고감도 인공지능 기반 화자 식별 및 음성 보안기술을 구현했다고 15일 밝혔다. 또 스마트폰과 인공지능 스피커에 탑재해 제품화하는데도 성공했다. 이번 연구결과는 기초과학 및 공학분야 국제학술지 ‘사이언스 어드밴시스’ 12일자에 실렸다.

인간이 먼 거리의 소리를 인식하는 방법은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 공진현상을 발생시켜 소리를 증폭시킨다. 연구팀은 사람의 귀를 흉내내기 위해 얇은 유연 압전막을 사용해 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 만들었다.
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서 카이스트 제공
유연 압전 음성센서는 신호 대 잡음비(SNR)가 우수해 음성인식 기능이 뛰어나고 다수의 채널을 이용해 적은 데이터양으로도 화자 식별 정확도를 높일 뿐만 아니라 원거리에서 스마트 기기들을 정확하게 제어할 수 있다. 연구팀이 개발한 음성센서를 같은 조건에서 기존 기술과 비교한 결과 음성인식 오류율을 60~95%까지 줄이는 것으로 확인됐다.

이건재 신소재공학과 교수는 “이번에 개발된 기술은 높은 민감도를 갖고 있으며 크기를 획기적으로 줄였기 때문에 미래 인공지능기술을 작동시키는데 핵심 센서로 적용할 수 있다”라며 “현재 대량생산 공정이 완성 단계에 있기 때문에 곧 상용화될 수 있을 것”이라고 말했다.

유용하 기자 edmondy@seoul.co.kr

많이 본 뉴스

‘금융투자소득세’ 당신의 생각은?
금융투자소득세는 주식, 채권, 파생상품 등의 투자로 5000만원 이상의 이익을 실현했을 때 초과분에 한해 20%의 금투세와 2%의 지방소득세를, 3억원 이상은 초과분의 25% 금투세와 2.5%의 지방소득세를 내는 것이 골자입니다. 내년 시행을 앞두고 제도 도입과 유예, 폐지를 주장하는 목소리가 맞서고 있습니다. 당신의 생각은?
제도를 시행해야 한다
일정 기간 유예해야 한다
제도를 폐지해야 한다
모르겠다
광고삭제
위로