장준혁 융합전자공학부 교수
영화 ‘아이언맨’ 속 인공지능(AI) 비서 자비스는 토니 스타크(아이언맨)의 일정 관리부터 저택 관리, 나아가 전투까지 보조한다. 음성인식으로 스마트폰, 자동차, 심지어는 집도 제어할 수 있다. 장준혁 융합전자공학부 교수는 삼성의 빅스비(Bixby), 현대자동차의 음성인식 시스템에 이르기까지 자비스 상용화의 최전선에 서 있다. 장 교수가 이끄는 음성음향 오디오 신호처리연구실(Acoustics speech audio signal processing lab, 이하 ASAP Lab)이 그리는 인공지능과 함께하는 미래를 알아보자.
ASAP Lab에서는 음성인식 기술을 비롯한 음성 신호처리, 바이오 신호처리 연구를 진행하고 있다. 음성인식이란 사람이 말하는 음성 언어에서 특징들을 학습해 그 내용을 텍스트로 변환하는 기술이다. 장 교수는 사람의 음성을 컴퓨터, 로봇이 인식하는 분야는 도전적이라고 말했다. “AI가 발전하기 전에는 음성인식 기술이 지금처럼 성능이 뛰어나지 않았다”며 “기존의 음성인식 기술에 AI를 결합하자 스마트폰, 자동차, 로봇에 있어서 폭발적인 파급력을 가지게 됐다”고 설명했다.

장 교수가 이끄는 ASAP Lab의 강점은 상용화다. 스마트폰, 자동차, 로봇 산업체를 종횡무진 활약하고 있다. ASAP Lab은 삼성의 빅스비, 현대자동차의 AI 카닥터 및 음성인식 엔진, LG의 Q보이스, 인천공항 안내 로봇 ‘클로이’의 엔진을 공동 개발했다. 장 교수는 “현대자동차 AI 카닥터를 개발할 때 데이터베이스, 딥러닝(deep learning·심층학습), 응용을 바탕으로 연구했다”고 말했다. AI 카닥터는 소음으로 차량의 고장 여부를 판별하고 고장 부위를 진단하는 기술이다.
먼저 자동차 모든 부품을 하나씩 고장 내 소리 데이터베이스를 만들었다. 딥러닝은 충분한 데이터를 필수로 한다. 장 교수는 수학적인 방법과 신호처리 방법을 활용해 부족한 데이터를 증폭시켰다. 가능한 경우의 수를 확률모델로 구상하고 확률 데이터를 따르는 새로운 데이터를 생성하고 컴퓨터 시뮬레이션을 통해 다양한 환경에서의 소리 데이터를 만들었다. ASAP Lab의 연구는 고장부위를 진단하는 정답률이 8.6%에서 87.6%로 올랐다는 평가를 받았다.

장 교수가 음성인식 연구로 이루고 싶은 꿈은 무엇일까. 장 교수는 “목소리만으로 자연스럽게 모든 기기를 제어하는 미래를 꿈꾼다”며 “집에서는 스마트폰 혹은 AI 스피커를 통해 냉장고, 에어컨, TV를 제어하고, 운전할 때 명령으로 와이퍼, 라디오, 내비게이션을 작동하는 연구를 계속할 것”이라고 말했다. “자율주행 자동차가 개발되는 시점에는 운전자가 목소리만으로도 가고자 하는 목적지의 날씨와 교통 정보를 알 수 있도록 하겠습니다”

글/ 김가은 기자 kate981212@hanyang.ac,kr
사진/ 김주은 기자 coramOdeo@hanyang.ac.kr
