데이터 사이언스 분야 최우수 국제 컨퍼런스에서 발표
추천 시스템 및 사회 과학 연구에 활용 기대

김상욱 교수
김상욱 교수

한양대학교 컴퓨터소프트웨어학부 김상욱 교수팀이 최근 데이터 분포 변화에 유연하게 대처하는 소셜 네트워크 분석 기술 ‘ODIN’을 개발했다고, 한양대가 28일 밝혔다. 

소셜 네트워크 분석 기술은 페이스북, 인스타그램, 트위터 등과 같은 소셜 플랫폼에서 사용자들 간의 관계에 내재된 복잡한 특성을 이해하고, 숨겨진 패턴을 추출해내는 기술이다. 이를 통한 분석 결과는 다양한 학문 분야와 추천시스템·이상탐지 등의 비즈니스에 널리 활용된다. 

기존 분석 기술들은 주어진 소셜 네트워크 사용자들의 차수분포(degree distribution)를 활용한다. 차수 분포는 사용자가 관계를 맺는 다른 사용자 수의 분포를 의미한다. 

김 교수팀은 기존 소셜 네트워크 분석기술들의 정확도가 차수분포의 변동에 큰 영향을 받음을 밝혀냈다. 예를 들면 특정 연예인의 인스타그램 현재 팔로워 수 분석에는 높은 정확도를 보이지만, 유명세로 팔로워가 급증하여 차수분포가 변하면 분석 정확도가 현저히 떨어지는 것이다. 

김 교수팀은 기존 소셜 네트워크 분석 기술들이 사용자들 간 친구 맺기·팔로우 등 관계가 형성되는 유형을 구분하여 고려하지 않음을 밝혔고, 이것이 차수 분포 변동 시 분석의 정확도를 떨어뜨리는 주요 원인임을 파악했다. 

따라서 김 교수팀은 각 사용자의 관계 형성에 영향을 미치는 요소들이 구분되어 표현된 특징 벡터(disentangled feature vector)를 학습하는 기술 ‘ODIN(Out-of-Distribution Generalized Directed Network Embedding)’을 개발했다. ODIN은 각 요소에 대해 분리되어 표현된 특징 벡터를 효과적으로 학습하기 위해, 차수를 고려한 네거티브 샘플링(negative sampling) 전략과 다중-목적 손실 함수(multi-objective loss function) 등의 기술을 활용한다. 

그 결과 ODIN은 기존 소셜 네트워크 분석 기술들과 비교해 실세계 데이터 집합들에서 발생할 수 있는 다양한 차수 분포 변화 시나리오들에서 일관적으로 높은 분석 정확도를 달성했다. ODIN은 주어진 소셜 네트워크를 정확하게 분석하는 작업뿐 아니라 이러한 소셜 네트워크를 활용하는 다양한 추천시스템 및 사회 과학 연구에 활용될 수 있을 것으로 기대된다. 

이연창 박사
이연창 박사

이번 연구는 한국연구재단(NRF), 정보통신기획평가원(IITP)의 SW스타랩과 방송통신

산업기술개발사업의 지원을 받았으며, 김상욱 교수 연구팀과 더불어 미국 조지아 공과대학(Georgia Tech) 이연창 박사, 한국과학기술원 신기정 교수가 함께 참여했다. 

한편 ODIN은 그 기술의 독창성 및 우수성을 인정받아 오는 30일부터 닷새간 미국 텍사스 오스틴에서 개최되는 ‘The ACM Web Conference 2023(이하 TheWebConf)’에서 발표될 예정이다. TheWebConf은 세계적으로 인정받는 데이터 사이언스 분야의 최우수 컨퍼런스 중 하나다. 김상욱 교수팀은 2023년도 TheWebConf에 6편의 논문이 게재 승인되었으며, 이 컨퍼런스에서 ODIN을 포함한 3편의 정규연구논문(full paper)과 3편의 포스터논문(short paper)을 발표할 예정이다.

차수 분포 변화에 따른 기존 소셜 네트워크 분석 기술들의 정확도 하락에 대한 실험 결과. 김 교수 연구팀은 기존 소셜 네트워크 분석 기술들이 소셜 네트워크의 차수 분포가 시간에 따라 변하는 상황에 유연하게 대처하지 못 한다는 것을 실험적으로 검증하였다.
차수 분포 변화에 따른 기존 소셜 네트워크 분석 기술들의 정확도 하락에 대한 실험 결과. 김 교수 연구팀은 기존 소셜 네트워크 분석 기술들이 소셜 네트워크의 차수 분포가 시간에 따라 변하는 상황에 유연하게 대처하지 못 한다는 것을 실험적으로 검증하였다.
데이터 분포 변화에 유연하게 대처하는 소셜 네트워크 분석 기술. 네트워크 내 사용자들 간의 관계 형성에 영향을 미치는 요소들을 정의하고, 각 사용자를 이러한 요소들을 구분하여 반영할 수 있는 특징 벡터(disentangled feature vector)로 표현한다.
데이터 분포 변화에 유연하게 대처하는 소셜 네트워크 분석 기술. 네트워크 내 사용자들 간의 관계 형성에 영향을 미치는 요소들을 정의하고, 각 사용자를 이러한 요소들을 구분하여 반영할 수 있는 특징 벡터(disentangled feature vector)로 표현한다.

 

 

키워드

'한양위키' 키워드 보기 #김상욱 #컴퓨터소프트웨어학부 #SDG9
저작권자 © 뉴스H 무단전재 및 재배포 금지