세계 최고 수준의 음성인식 성능 검증해

한양대학교 융합전자공학부 장준혁 교수가 KT와 '한국어 End-to-End 음성인식 트랜스퍼 러닝' 기술을 개발했다. 해당 기술은 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였고, 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 검증했다. 또한 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선을 가능하게 했다. KT는 이 기술을 활용해 KT의 AI 서비스를 고도화할 계획이라고 밝혔다.

이 기술은 KT의 AI 산·학·연 협의체 ‘AI 원팀’에서 공동연구를 통해 만들어졌으며 이번 연구로 장 교수의 기술을 포함해 총 4종의 AI 기술이 개발되었다. 4종의 기술은 △로봇 실내 공간지능 기술 △로봇 소셜 인터랙션 기술 △보이스 클로닝 기술 △한국어 E2E 음성인식 트랜스퍼 러닝 기술로 KT AI 사업 및 서비스에 활용된다.

한편 대한민국을 AI 1등 국가를 만들겠다는 목표로 2020년 2월에 출범한 AI 원팀은 KT를 비롯해 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, ㈜한진, 한국과학기술원(KAIST), 한양대, 한국전자통신연구원(ETRI)까지 총 10개 산학연이 참여하고 있다.

키워드

'한양위키' 키워드 보기 #장준혁 #융합전자공학부
저작권자 © 뉴스H 무단전재 및 재배포 금지