Relay Therapeutics, AWS를 사용하여 신약 개발을 가속화

2020

Relay Therapeutics는 단백질 운동에 대한 독보적인 인사이트를 활용하여 신약 개발 프로세스를 혁신하는 정밀의학 회사입니다. 실험실에서 가능성 높은 화합물을 테스트하기 전에 과학자들은 시작점으로 삼을 수 있는 화합물이 거의 1백억 개에 이르는 분자 세계를 고려해야 합니다. 이 광범위한 세트를 필터링해서 생물학적 목표에 부합할 가능성이 가장 높은 100~200개의 화합물을 추려내야 합니다.

과학자들은 더 많은 화합물을 분석하면서 실험실에서 테스트하기에 적합한 분자를 찾을 확률을 높입니다. CPU 수가 수천 개인 일반적인 온프레미스 데이터 센터에서 십억 개의 화합물을 분석하려면 수개월이 걸릴 수 있습니다. 온프레미스 데이터 센터에 충분한 수의 CPU를 배포하려면 특히 분석의 ‘버스트’한 특성으로 인해 엄청난 비용이 듭니다.

African chemist researcher typing information
kr_quotemark

수십억 개의 행이 있는 테이블을 정렬하는 것은 사소한 일이 아닙니다. AWS 기술을 사용하면 이 모든 정보를 효율적으로 처리할 수 있습니다. 이렇게 해서 이전에 가능하다고 생각했던 것보다 더 빠르게 환자들에게 의약품을 제공하고자 하는 궁극적인 목표를 달성할 수 있습니다.”

Pat Walters
Relay Therapeutics 전산 부문 수석 부사장

수십억 개의 분자를 24시간 안에 처리

일반적으로 기존 IT 환경에서 제약 회사들은 한 번에 수백만 개의 화합물을 가상으로 검사합니다. Relay Therapeutics는 이 수를 수십억 개로 확장하기로 결심하고 Amazon Web Services(AWS)에서 당면 과제를 해결하기로 했습니다. Relay Therapeutics의 전산 부문 수석 부사장인 Pat Walters는 “다른 클라우드 제공업체 대신 AWS를 선택한 가장 큰 요인은 시작할 때부터 받은 지원에 있다”면서 “지금까지도 작업을 더 효율적으로 처리하는 데 도움이 되고 있다”고 말합니다.

Relay Therapeutics 팀은 AWS에서 1십만 개에 가까운 CPU에 액세스하여 하루에 수십억 개의 화합물을 분석할 수 있습니다. CPU 비용 문제는 필요에 따라 구동하고 종료할 수 있는 Amazon Elastic Compute Cloud(Amazon EC2) 스팟 인스턴스 의 탄력적인 용량을 활용하여 해결했습니다.
 
Relay Therapeutics는 AWS 클라우드의 미사용 Amazon EC2 용량을 온디맨드 인스턴스 요금 대비 최대 90% 할인된 요금으로 활용합니다. 클라우드 네이티브 오케스트레이션 서비스인 AWS Batch를 스팟 인스턴스와 함께 사용하여 각 가상 검사에 필요한 수의 CPU로 손쉽게 확장합니다.

과학자를 위한 프로세스 간소화

이 회사는 AWS에서 가상 검사도 간소화했습니다. 과학자들은 오픈 소스 스크립트를 사용하여 AWS Batch에서 분석을 시작할 수 있습니다. 그런 다음에는 인프라 관리가 불필요한 서버리스 쿼리 서비스인 Amazon Athena를 활용하여 신속하게 데이터를 분석합니다. 

과학자들은 복잡한 프로그래밍에 대해 걱정하지 않아도 되기 때문에 결과를 분석하고 신약 개발 프로세스를 최적화하는 데 더 많은 시간을 쓸 수 있습니다. Relay Therapeutics의 전산 부문 이사인 Levi Pierce는 “기존 시스템에서 이렇게 많은 작업을 수동으로 오케스트레이션하는 것은 악몽과도 같다”면서 “하지만 AWS Batch를 사용하면 많은 시간이 절약된다”고 말합니다.

컴퓨팅 비용의 50% 절감

Pierce는 Amazon EC2 스팟 인스턴스를 사용하면 온프레미스에서 가상 검사를 시행할 때보다 컴퓨팅 비용이 50% 절감될 것으로 예측합니다. AWS와 Relay Therapeutics는 분석 비용이 예산 금액을 초과하지 않도록 하는 파라미터 확인을 프로세스 안에 구축했습니다. Walters는 “작업이 설정된 비용 임계값을 초과하면 알림이 전송된다”면서 “이 알림은 파라미터가 꺼졌으니 작업을 종료하거나 즉시 조정할 수 있다는 것을 알려준다”고 설명합니다.

1백억 개의 화합물을 처리할 수 있는 잠재력

AWS의 고성능 컴퓨팅 솔루션을 배포한 후 Relay Therapeutics는 5십억 개의 화합물이 포함된 다수의 검사를 실행했습니다. AWS가 제공하는 확장성 덕에 동일한 이동 단백질 표적의 여러 스냅샷에서 검사를 실행할 수 있었습니다.  

향후에 Relay Therapeutics는 1백억 개의 화합물이 포함된 상용 라이브러리를 가상으로 검사할 수 있을 것으로 예상하는데, 비용을 제어하려면 여기에 기계 학습을 통합해야 할 것입니다. AWS 데이터 센터의 가용 영역Amazon EMR은 이 작업에서 중요한 역할을 하게 될 것입니다.

불가능을 가능하게

몇 년 전에 Relay Therapeutics 팀은 회사가 지금 달성한 규모, 즉 십억 개의 행이 포함된 테이블을 분석하는 규모로 가상 검사를 실행하는 것이 가능하다고 생각하지 않았습니다. Walters는 “수십억 개의 행이 있는 테이블을 정렬하는 것은 사소한 일이 아니다”라면서 “AWS 기술을 사용하면 이 모든 정보를 효율적으로 처리할 수 있는데 이는 궁극적인 목표에 전념하는 데 도움이 된다. 이전에 가능하다고 생각했던 것보다 더 빠르게 환자들에게 의약품을 제공하는 것”이라고 강조합니다.

Relay Therapeutics 소개

메사추세츠주 소재의 Relay Therapeutics는 환자에게 혁신적인 영향을 미치는 의약품을 만드는 데 전념합니다. 이 회사는 구조생물학, 생물물리학, 화학 및 생물학 전반에서 전례 없는 수준의 컴퓨팅 파워와 최첨단 실험적 접근 방식을 조합하여 활용합니다.

AWS의 이점

  • 몇 개월이 아닌 단 하루 안에 5십억 개의 분자 화합물을 분석
  • 컴퓨팅 리소스 비용을 50% 절감
  • 복잡한 분석을 손쉽게 실행할 수 있는 기능 제공
  • 분석 파라미터를 검증하여 클라우드 비용 초과를 방지
  • 각 분석 작업에서 필요에 따라 컴퓨팅 리소스를 조정


사용된 AWS 서비스

AWS Batch

AWS Batch를 사용하면 개발자, 과학자 및 엔지니어가 AWS에서 수많은 배치 컴퓨팅 작업을 효율적으로 손쉽게 실행할 수 있습니다.

자세히 알아보기 »

Amazon Athena

Amazon Athena는 표준 SQL을 사용해 Amazon S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스입니다.

자세히 알아보기 »

Amazon EC2 스팟 인스턴스

Amazon EC2 스팟 인스턴스를 사용하면 AWS 클라우드에서 미사용 EC2 용량을 활용할 수 있습니다. 스팟 인스턴스는 온디맨드 요금과 비교하여 최대 90% 할인된 금액으로 제공됩니다.

자세히 알아보기 »


시작하기

산업 분야를 불문하고 다양한 규모의 기업들이 AWS를 통해 매일 비즈니스를 혁신하고 있습니다. 지금 전문가와 상담하고 AWS 클라우드로의 여정을 시작하세요.