한양대, 데이터 정제·필터링 알고리즘 개발, 분산·병렬 알고리즘 및 모델 최적화 분야 담당

한양대학교와 KT가 KT의 '초거대 인공지능(AI)' 개발에 'AI 원팀'으로서 공동연구협약을 체결했다. AI원팀은 지난해 출범해 한양대학교 이외에도 한국전자통신연구원(ETRI), 한국과학기술원(KAIST)로 이루어져 있으며 다자간 공동연구를 통해 초거대 AI 모델 개발에 나설 예정이다. 이들은 초거대 AI 모델 확보를 대한민국 AI 경쟁력 확보를 위한 핵심 의제로 설정하고 약 6개월간 실무 논의를 거쳐 이번에 협약을 체결했고, 참여기관별 정의된 역할에 따라 프로젝트 수행에 본격 나설 계획이다.

AI 원팀의 한양대, KT, ETRI, 카이스트 관계자들이 온라인으로 AI 원팀 초거대 AI 모델 개발 협약을 체결했다.(한양대 백은옥 교수, 한양대 노영균 교수)
AI 원팀의 한양대, KT, ETRI, 카이스트 관계자들이 온라인으로 AI 원팀 초거대 AI 모델 개발 협약을 체결했다.(한양대 백은옥 교수, 한양대 노영균 교수)

KT는 내년 상반기까지 초거대 AI 모델을 상용화하고, KT를 비롯한 AI 원팀 참여 기업과 국내외 산업계의 활용을 지원한다. 앞서 이 분야에 도전한 네이버, LG, SKT·카카오 등과 AI 기술 선도 경쟁을 벌일 전망이다.

초거대 AI란, 방대한 연산 자원으로 대규모 데이터를 학습해 성능을 확 끌어올린 AI를 의미한다. 구글이 언어 AI 모델 '버트(BERT)'로 검색서비스를 개선하고 마이크로소프트가 미국 오픈AI의 'GPT-3'를 시범 도입하면서 세계적인 관심을 끌고 있는 분야다. 국내에선 네이버가 지난 5월 서울대·카이스트와 공동연구센터를 설립해 '하이퍼클로바'를 선보였고, LG AI연구원은 3년간 1억 달러 투자와 올 하반기 초거대 AI 공개를 예고했다. 지난 4월 SKT·카카오도 국립국어원과 손잡고 'GLM' 개발에 나섰다.

KT는 초거대 AI 언어모델이 빠르게 발전하고 있고 데이터 정제, 학습 알고리즘, 분산·병렬학습, 경량화, 응용모델 발굴 등 다양한 분야의 연구가 필요하기 때문에 단일 기업이 단독으로 추진하기는 어려우며, 학교와 연구기관에서는 AI 연구를 위한 대규모의 그래픽처리장치(GPU) 인프라에 접근하는 것이 쉽지 않다고 지적했다. KT는 AI 원팀 차원에서 대규모 투자를 통해 GPU 인프라를 구축하고 최신 연구 동향을 반영한 기술을 제공하는 산학연 협력 방식으로 초거대 AI 개발을 추진할 계획이다.

KT는 대규모 GPU 인프라 구축, 데이터 수집·분석, 모델 학습, 응용태스크 적용 등 연구개발(R&D)과 상용화 관련 업무를 총괄한다. 한양대는 데이터 정제·필터링 알고리즘 개발, 분산·병렬 알고리즘과 모델 최적화 분야에 힘을 보탠다. ETRI는 대형 모델 학습·개발 분야에 참여한다. 카이스트는 머신러닝 알고리즘 최적화와 애플리케이션 영역을 맡는다. 

AI 원팀 연구진은 올해 말까지 1차로 초거대 AI 학습을 완료하고 내년 상반기 초거대 AI 모델을 상용화한다. 함께 구축할 대규모 AI 연산 인프라에서 향후 2000억개 파라미터(매개변수) 이상의 모델을 만들 수 있도록, 인프라 규모를 점차 확장할 예정이다. 또 AI 원팀 연구진은 학습데이터 필터링 강화, 데이터 간 균형 조정 등으로 AI 편향성을 제거하고, 딥러닝 기반 탐지 기술을 활용한 유해 콘텐츠(Toxic Content) 필터링 기술 등으로 잠재적인 AI 윤리 문제 소지를 사전에 차단한다.

이번에 개발될 초거대 AI 모델은 즉시 상용화할 수 있는 '과제 지향적' 한국어 언어 모델로 설계된다. KT는 기존 AI 기반 제품·서비스인 'KT 기가지니'와 'KT AICC'를 고도화하는 데에 초거대 AI 모델의 음성인식(STT), 음성합성(TTS), 텍스트분석(TA), 대화 등 요소기술을 먼저 활용하고, 나아가 제조·금융·물류·유통 등 AI 원팀 참여 기업들의 다양한 사업 분야에 적용할 예정이다. 향후 'AI 1등 대한민국'이라는 AI 원팀의 취지에 따라 국내외 기업, 학교, 연구기관이 AI 원팀의 초거대 AI 모델을 활용하도록 지원한다.

지난해 2월 출범한 AI 원팀은 KT, ETRI, 카이스트, 한양대, 현대중공업그룹, LG전자, LG유플러스, 한국투자증권, 동원그룹, 우리은행 등 10개 기업·기관이 참여한 산학연 협력체로, AI 인재양성과 개방형 R&D, AI 생태계 강화 등을 위해 힘을 모으고 있다.

 

관련기사

키워드

'한양위키' 키워드 보기 #백은옥 #노영균 #SDG17
저작권자 © 뉴스H 무단전재 및 재배포 금지