바이오스펙테이터 신창민 기자
▲쓰리빌리언 ASHG 2025 발표현장(회사 제공)
쓰리빌리언(3billion)은 지난 14일부터 오는 18일까지(현지시간) 미국 보스턴에서 열리는 미국유전학회(American Society of Human Genetics, ASHG 2025)에 참가해 인공지능(AI) 기반 유전변이 해석기술과 관련한 연구 4편을 발표한다고 밝혔다.
ASHG는 전세계 8000여명의 유전학 및 유전체학 전문가들이 참여하는 유전학회다. 쓰리빌리언은 이번 학회에서 AI를 통한 진단기술의 임상적 유용성과 연구성과를 집중적으로 소개했다.
쓰리빌리언은 이번 학회에서 △AI 통합 변이해석모델 ‘3ASC 2.0’ △대형언어모델(LLM)을 활용한 자동 ACMG 판정 시스템 ‘AIVARI(AI VARiant Interpreter)’ △AI 유전체분석 플랫폼 ‘GEBRA’ △서울대병원과 공동수행한 전장유전체 기반 희귀질환 임상 등 총 4편의 연구결과를 공개한다.
이 가운데 AI 통합 변이해석모델인 3ASC 2.0 연구는 학회에 제출된 3000여편의 포스터 중 상위 60편에 선정돼 구두발표 기회를 제공하는 라이트닝토크(Lightning Talk) 세션에서 소개한다. 라이트닝토크는 과학적 혁신성과 임상적 기여도가 높은 연구에 주어지는 발표세션으로, 올해 새롭게 신설된 포스터 발표 형식이라고 쓰리빌리언은 설명했다.
3ASC 2.0은 트랜스포머(Transformer) 기반 딥러닝모델로 희귀질환 환자의 전장유전체(WGS)와 전장엑솜(WES) 데이터를 통합해 다양한 변이유형을 동시에 평가하는 최신 기술을 적용했다. 기존에는 단일염기변이(SNV), 삽입결실(INDEL), 복제수변이(CNV), 반복서열(STR) 등 여러 변이를 각각 해석해야 했지만, 3ASC 2.0은 이를 하나의 AI시스템 내에서 통합분석할 수 있도록 설계했다.
쓰리빌리언은 모델의 진단정확도 향상과 변이데이터의 불균형 문제를 해결하기 위해 환자의 임상정보와 유전정보를 함께 학습하는 ‘MIL-GFE(Multiple Instance Learning–Global Feature Extractor)’ 구조도 자체 개발해 적용했다. 이 과정에서 대형언어모델(LLM) 기술을 결합해 환자의 증상과 질병간 연관성을 스스로 학습하며 보다 정교한 해석을 수행하도록 고도화했다.
실제 연구결과, 3ASC 2.0은 경쟁모델과 비교해 높은 성능을 보였다고 회사는 강조했다. 수백개의 후보변이 중 실제 원인변이를 상위 10개 이내에서(Top-10 recall) 98% 확률로 검출했으며, 전체모델정확도(AUROC)는 99.6%로 나타났다. 또한 AI가 중요하다고 분류한 상위변이 10%만 검토해도 원인변이의 99%를 확인할 수 있어, 임상유전학자의 분석 효율을 향상시킬 수 있을 것으로 기대했다.