2022년
genomics-england-logo

Genomics England, AWS 기반 유전체학 및 건강 정보 플랫폼을 개발하여 과학을 의료 서비스로 전환

Genomics England(GEL)는 지난 2013년 7월, 영국 국민보건서비스(NHS) 창립 65주년을 맞아 정식으로 설립된 기업입니다. GEL은 영국 보건사회복지부에서 전액 출자한 기업으로, 희귀 질환을 앓는 NHS 환자와 그 가족 및 일반 암 환자의 전장유전체 100,000개의 염기 서열을 분석하는 플래그십 프로젝트를 추진할 책임을 맡고 출범했습니다. 2018년에 이 시범 프로젝트가 무사히 완료된 뒤, NHS에서는 GEL 및 UK Biobank와 협력 관계를 체결하고 5년 안에 유전체 최대 5백만 개의 염기 서열을 분석하고, 그 데이터를 연구용으로 제공하겠다고 공표했습니다.

99%

연구진이 보편적인 작업을 수행하는 데 드는 시간 단축

보안 및 내구성

수십만 개에 달하는 유전체학 데이터 샘플

최적화

유전체학 데이터 세트의 고유한 요구 사항에 맞춘 데이터 관리 플랫폼

대중화

유전체학 연구에 대한 액세스

개요

암은 전 세계적으로 인간의 대표적인 사망 원인이며, 매년 암으로 인한 사망자는 1천만 명에 달합니다. 희귀 질환의 경우 전 세계 4억 명이 고통받는 원인이며, 그중 95%는 승인된 치료법이 없습니다. 대부분 암과 희귀 질환은 유전병으로, 단일 유전자나 다유전자성 변이 때문에 발생합니다. 세계 각지 기관에서는 환자를 진단하고 치료할 비법으로 유전학에 주목하고 있습니다.

사람은 개개인마다 각기 다른 유전자 코드를 갖고 있지만, 연구진에게는 환자와 건강한 피험자 양측이 골고루 섞인 강력한 데이터 코호트가 있어야 유전자에서 질병을 초래하는 영역의 유사성과 차이점을 파악할 수 있습니다. 전 세계의 정부 기관, 연구 기관과 기업체에서는 전 인구를 아우르는 유전체학 프로젝트를 정립하여 질병의 근원에 대한 이해도를 높이고 새로운 치료법을 알아내며, 유전체학이라는 학문을 연구의 범위를 넘어 의료 서비스로 확대하고자 합니다.

Genomics England(GEL)는 지난 2013년 7월, 영국 국민보건서비스(NHS) 탄생 65주년을 맞아 정식으로 설립된 기업입니다. GEL은 영국 보건사회복지부에서 전액 출자한 기업으로, 희귀 질환을 앓는 NHS 환자와 그 가족, 보편적인 암 환자 전장유전체 100,000개의 염기 서열을 분석하는 플래그십 프로젝트를 추진할 책임을 맡고 출범했습니다. 2018년에 이 시범 프로젝트가 무사히 완료된 뒤, NHS에서는 GEL 및 UK Biobank와 협력 관계를 체결하고 5년 안에 유전체 최대 5백만 건의 염기 서열을 분석하고, 그 데이터를 연구용으로 제공하겠다고 공표했습니다.

GEL에서는 유전체학 의료 서비스를 실현하기 위해 프로젝트에서 플랫폼으로 전환 중입니다. GEL은 Amazon Web Services(AWS) 도구를 활용해 연구진이 이러한 대량의 데이터 세트에 안정적이고 종합적이며 개인 정보 보호 규정을 준수하는 형태로 액세스할 수 있도록 지원하고 있습니다. 이 이니셔티브는 안전한 협업과 분석을 통해 진단 정보를 제공하고, 약물 개발을 추진하며, 정밀 의료의 미래를 열어갈 것입니다.

점점 늘어나는 유전체학 데이터 세트에 맞춘 확장성 지원

GEL에서는 100,000개의 유전체 프로젝트만으로 50PB에 달하는 데이터를 수집했으며, 이는 미국 의회도서관에 소장된 도서의 정보량보다 대략 세 배 정도 많은 규모입니다. GEL에서는 연구 커뮤니티에서도 이 데이터에 액세스할 수 있도록 하기 위해 자사에서 보유한 데이터를 AWS로 마이그레이션하여 액세스를 대중화하고자 합니다.

"100,000개의 유전체 프로젝트를 통해 생성한 데이터를 연구 커뮤니티에서도 이용할 수 있게 하는 것이 과학적 혁신을 가속하는 데 중대한 역할을 한다는 점을 잘 알고 있었고, 그렇게 하기 위해서 데이터를 AWS로 마이그레이션하고 있습니다." GEL의 최고 정보 책임자인 Peter Sinden 씨의 말입니다.

이 기업에서는 환자 유전체학에 대한 좀 더 종합적인 정보를 얻기 위해 현재의 '쇼트 리드(short read)' 형식 외에 '롱 리드(long read)' 유전체 형식도 통합할 예정입니다. 롱 리드 유전체의 경우, 쇼트 리드 형식보다 약 다섯 배 많은 데이터를 포함합니다. 따라서 연구자가 연구 대상 유전체의 각 부분에 관해 더 많은 정보를 확보할 수 있으므로, 전에는 미처 알아채지 못했던 미묘한 차이를 밝혀낼 가능성이 있습니다.

"연구를 계속 진전시키고 더 강력한 데이터 세트를 생성하게 되면 탄력적인 스토리지와 컴퓨팅 서비스를 이용할 수 있어야 우리 기업과 연구 커뮤니티에서 데이터에 안전하게, 비용 효율적으로 액세스하고 이를 분석할 수 있을 것입니다." Sinden 씨가 덧붙였습니다. "AWS에서 호스팅하면 데이터에 대한 액세스를 민주화할 수 있습니다. 연구진에게는 컴퓨팅 비용을 충당할 소액의 예산과 사용할 컴퓨터만 제공해 주면 됩니다."

kr_quotemark

연구를 계속 진전시키고 더 강력한 데이터 세트를 생성하게 됨에 따라, 탄력적인 스토리지와 컴퓨팅 서비스 이용을 통해 우리 조직과 연구 커뮤니티에서 데이터에 안전하고 비용 효율적으로 액세스하고 분석을 수행할 수 있을 것입니다. AWS에서 호스팅하면 데이터에 대한 액세스를 민주화할 수 있습니다."

Pete Sinden
Genomics England 최고 정보 책임자

기술을 통해 과학을 의료 서비스로 전환

GEL에서는 과학과 기술 발전에 맞춰 진화할 수 있는 확장 가능하고 내구성이 우수한 데이터 인프라를 구축하는 것을 사명으로 삼았습니다. 보안, 규정 준수와 액세스 민주화가 이 연구 플랫폼의 핵심이었고, GEL에서는 AWS 파트너인 Lifebit를 선택해 AWS에서 플랫폼 개발을 추진하기로 했습니다. 이들은 AWS와 함께 신뢰할 수 있는 조사 환경(TRE)을 만들어 연구진이 서로 협력하고, 고급 클라우드 컴퓨팅 도구를 사용하여 유전체학 데이터에서 인사이트를 얻을 수 있게 하였습니다.

"저희 목표는 데이터 중심 의료 서비스를 제공하고 유전체학 연구를 실시할 수 있는 생태계를 가능하게 하는 것이었는데, AWS 덕분에 이 목표를 안정적으로 달성하는 데 큰 도움을 받았습니다." Sinden 씨의 말입니다. "최신 GPU와 다른 여러 서비스를 이용할 수 있어 기술적인 한계를 극복하고 유전체학을 의료 서비스에 도입하는 속도를 높일 수 있게 되었어요."

GEL은 AWS Professional Services, AWS 파트너인 Kainos와 협력해 AWS Migration Acceleration Program(MAP)을 진행 중입니다. GEL은 페타바이트급 규모의 유전체학 데이터와 온프레미스 연구 환경을 AWS로 옮기면서 과학 연구 결과를 도출하는 속도를 한층 높이고 있습니다. 클라우드에서 분석과 툴링을 활용하면 데이터 보안을 강화하는 효과도 있습니다. 유전체학 데이터를 Amazon Simple Storage Service(S3)에 저장하면 99.999999999%의 내구성이 보장됩니다.

GEL에서는 유전체학 분석과 관련 컴퓨팅 요구 사항에 Amazon Elastic Compute Cloud(Amazon EC2)를 이용하여 안정적이고 규모를 조정할 수 있는 클라우드 컴퓨팅 기능을 활용하고 있습니다. 이 덕분에 연구진과 데이터 사이언티스트가 온디맨드 방식으로 컴퓨팅 용량을 조절할 수 있어, 전보다 비용 효율성이 좋아졌습니다. Sinden 씨는 사용량에 따른 요금(pay-as-you-go) 운영 방식이 학계나 정부 기관에서 자금을 지원하는 연구 프로젝트에 가장 이상적이라고 지적했습니다. 이 방식을 따르면 지원금 조달 상황에 발생하는 변동을 유연하게 수용할 수 있기 때문입니다. GEL에서는 파트너의 도움을 받아 AWS에 고성능 컴퓨팅 아키텍처를 구축하고 비용과 속도 두 가지 면 모두에서 최적화하여, 연구진이 통상적인 작업을 수행하는 데 걸리는 시간을 단 23초로 단축했습니다(이전에는 25시간 소요).

AWS로 클라우드 유전체학의 미래 구축

빅 데이터와 관련한 문제는 대부분 크기가 작은 파일을 대량으로 관리하는 것과 연관이 있지만, 유전체학 분석의 경우 보통 크기가 극히 큰 파일을 비교적 소량으로 다루게 됩니다. 따라서 클라우드 유전체학에는 고유한 데이터 분배 모델이 필요합니다. GEL은 AWS와 협력하여 압축 기술과 여타 고급 도구를 활용해 이 분야만의 구체적인 요구 사항을 바탕으로 유전체학 데이터 클라우드 스토리지와 분석을 최적화하고 있습니다. 업계를 선도하는 이 벤처 프로젝트는 앞으로 몇 년간 효율적이고 연구에 적합한 유전체학 데이터 관리 방식을 구축하기 위한 길을 개척하게 될 것입니다.

Genomics England 소개

Genomics England(GEL)는 영국에서 100,000건의 유전체 프로젝트를 운영할 목적으로 창립한 기업이며, 현재 인류 건강을 위한 유전체학 연구 분야를 이끄는 주역입니다. GEL은 영국 보건사회복지부에서 소유한 기업입니다.

사용된 AWS 서비스

AWS Professional Services

AWS Professional Services 조직은 AWS 클라우드를 사용하여 원하는 비즈니스 성과를 달성하도록 도움을 줄 수 있는 글로벌 전문가 팀입니다.

자세히 알아보기 »

Amazon S3

Amazon Simple Storage Service(S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.

자세히 알아보기 »

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)는 안전하고 크기 조정이 가능한 컴퓨팅 파워를 클라우드에서 제공하는 웹 서비스입니다. 개발자가 더 쉽게 웹 규모의 클라우드 컴퓨팅 작업을 할 수 있도록 설계되었습니다.

자세히 알아보기 »

MAP

AWS Migration Acceleration Program(MAP)은 수많은 기업 고객을 클라우드로 마이그레이션한 AWS의 경험에 기반을 둔 포괄적이고 검증된 클라우드 마이그레이션 프로그램입니다. 기업 마이그레이션은 복잡하고 시간이 많이 소요될 수 있지만 MAP는 결과 중심 방법론을 통해 클라우드 마이그레이션 및 현대화 여정을 가속화하는 데 도움이 될 수 있습니다.

자세히 알아보기 »

자세히 알아보기

AWS에서는 클라우드 유전체학을 지원하여 세계적인 생명 과학 연구진이 새로운 사실을 발견하도록 돕고 있습니다. 자세한 내용을 알아보세요.

시작하기

모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다. 지금 전문가와 상담하고 AWS로의 여정을 시작하세요.