단백질 구조 예측 AI '로제타폴드' 개발 과정 공개

한양대학교 생명과학과가 이번 달 12일부터 제1회 '한양 바이오 국제미니심포지움 시리즈'를 개최한다. 한양대 LTER 기초연구실, 자연과학연구소, 기초과학융합연구소의 후원으로 개최된 이번 심포지움시리즈는 '바이오 데이터, 유전체, RNA 치료제, 단백질 구조(Bio data, Genome, RNA therapeutics, Protein structure)'를 주제로 개최된다. 심포지움의 모든 강의는 8월부터 12월까지 온라인을 통해 진행된다.

▲ '제1회 한양 바이오 국제미니심포지움 시리즈' 안내 포스터 ⓒ한양대학교 생명과학과
▲ '제1회 한양 바이오 국제미니심포지움 시리즈' 안내 포스터 ⓒ한양대학교 생명과학과

8월 심포지움에서는 지난 12일 미국 펜실베이니아대학 김도균 박사가 'EHR 연계 바이오뱅크 데이터를 이용한중개연구(Translational research using EHR-linked biobank data)'에 대해 강의했다. 이어서 미국 워싱턴대 백민경 박사는 '3 트랙 NN을 사용한 단백질 구조 및 상호작용의 정확한 예측(Accurate prediction of protein structures and interaction using a three track NN)'에 대해 발표했다. 특히 이날 심포지엄에서는 백 박사가 단백질 구조를 예측하는 AI인 '로제타폴드(RoseTTAFold)'의 개발 과정을 직접 공개했다.

로제타폴드는 구글 수준의 AI 전문가와 컴퓨팅 인프라 없이도 단백질 구조 예측 AI 개발이 가능함을 증명했기에 주목 받고 있다. 로제타폴드는 딥마인드가 개발한 단백질 구조 예측 AI, 알파폴드2의 논문이 공개되기 전에 이를 재현하는 과정에서 탄생했다.

▲ 백민경 박사 ⓒ제1회 한양 바이오 국제미니심포지움 행사 화면
▲ 백민경 박사 ⓒ제1회 한양 바이오 국제미니심포지움 행사 화면

연구팀은 로제타폴드 개발을 위해 기존 모델과 차별화되는 알파폴드2 특징들에 주목했다. 백 박사는 “CNN 대신 어텐션을 활용했을 때  (단백질 구조 파악 과정에서) 전체 투입정보(input)를 보고 연관도에 따라 정보를 가져오는 양을 조절할 수 있다."며 "이것이 단백질 구조 예측에 필요한 부분”이라고 설명했다. 또한 이외 특징에 대해 “기존 연구에서는 다중서열정렬(MSA)로부터 2D 이미지 인풋을 만들고 나면 다시 들여다보지 않았다."며 "알파폴드2에는 MSA 정보를 다시 확인하는 트랙이 포함됐다”고 설명했다. 향후 로제타폴드 연구팀은 단백질 간 상호작용 이해, PPI 네트웨크 예측 연구에 집중할 예정이다.

한편, 제1회 한양 바이오 국제미니심포지움 시리즈는 오는 9월 9일 덴마크 코펜하겐대학 원경제 박사의 발표를 시작으로 다시 이어질 예정이다.

저작권자 © 뉴스H 무단전재 및 재배포 금지