AWS 기반 데이터 리소스를 사용해 소아과 연구 속도를 높이는 CHOP
2021년
산업 당면 과제
의료 연구진은 점점 더 많은 임상 데이터를 생성하게 되면서 획기적인 의학적 발견을 촉진하기 위해 그러한 데이터에 액세스하여 연구하고 교차 참조할 수 있도록 데이터를 저장하고 체계적으로 정리해야 한다는 과제에 직면하게 됩니다. Children’s Hospital of Philadelphia(CHOP)에서는 Amazon Web Services(AWS)를 이용해 Gabriella Miller Kids First Data Resource Center(KFDRC)를 짓기로 했습니다. 이 센터는 다분야 의료 연구를 결합해 유전체, 임상, 영상 데이터의 가용성을 높여 전 세계 어린이를 위해 광범위한 질병에 관한 인사이트를 도출하고자 하는 혁신적인 의료 서비스 검색 솔루션입니다.
현재 저희 시스템은 모두 AWS를 기반으로 하여 구축되어 있습니다. 그 결과, 아무것도 없던 상태에서 시작해 1년도 채 되지 않아 몇 페타바이트에 달하는 유전체 데이터를 관리하게 되었습니다.”
Allison Heath
CHOP Director of Data Technology and Innovation,
Center for Data-Driven Discovery in Biomedicine
CHOP의 솔루션
CHOP에서는 소아암 및 구조적 선천적 기형(SBD) 중심의 리서치 데이터 리소스인 KFDRC를 통해 소아과 연구 커뮤니티 내에서 데이터 공유를 지원하기 위해 노력하고 있습니다. 이 데이터 리소스는 누구나 이용할 수 있으며, 연구자가 가상 코호트를 쿼리, 검색, 탐색, 빌드, 시각화할 수 있게 해줍니다. CHOP의 Center for Data-Driven Discovery in Biomedicine에서 데이터 기술 및 혁신 담당 이사로 근무 중인 Allison Heath 씨는 “많은 경우, 질병은 뇌암, 폐암, 선천성 심장 결함과 같이 특정 종류의 장기를 기준으로 분류됩니다. 하지만 이러한 장기 체계 사이에 연관 관계가 있을 가능성이 있습니다.”라고 말합니다. KFDRC는 연구자가 한곳에서 유전체, 임상, 영상 데이터에 액세스하여 질병을 교차 분석하고, 새로운 가설을 생각해 내고, 새로운 사실을 발견하게 해줍니다.
KFDRC는 다양한 AWS 서비스의 지원을 받아 1.5PB 이상의 유전체, 임상, 영상 데이터를 저장, 정리, 배포할 수 있습니다. CHOP에서는 처리해야 하는 데이터의 양이 엄청나게 많다 보니 강력한 의료 데이터 서비스가 꼭 필요합니다. 현재 유전체 변이 데이터베이스에는 2억 1,500만 개가 넘는 고유한 유전체 변이에 대해 260억 건 이상의 발생 사례가 저장되어 있는데, 이 데이터는 겨우 환자 5,000명분에 불과한 것입니다. “클라우드의 확장성을 이용한 덕분에 그러한 빅데이터 문제를 상당 부분 해결할 수 있었습니다.”라고 Heath 씨는 말합니다. 또한 KFDRC에서는 유전체가 치료 옵션이나 건강 결과, 후속 조치에 어떤 영향을 미치는지에 대한 이해도를 높이기 위해 대규모로 의료 데이터를 저장, 변환, 쿼리, 분석하는 HIPAA 적격 서비스인 Amazon HealthLake를 사용하여 전자 의료 기록과 리서치 양식으로부터 얻은 임상 데이터를 통합합니다. KFDRC에서는 Amazon HealthLake를 통해 Fast Healthcare Interoperability Resources(FHIR) 개방형 업계 표준을 활용하여 임상 데이터 공유를 촉진하고, 통합형 의료 자연어 처리를 적용해 형태와 형식이 다양한 임상 데이터를 상세히 구조화할 수 있습니다.
AWS 사용의 이점
CHOP에서는 수십만 명이 넘는 참가자로부터 얻은 추가 데이터를 이용하여 KFDRC를 확장할 계획이며, 이미 AWS를 활용하여 이 역량을 입증한 전력이 있기 때문에 성공을 확신하고 있습니다. “현재 저희 시스템은 모두 AWS를 기반으로 하여 구축되어 있습니다. 그 결과, 아무것도 없던 상태에서 시작해 1년도 채 되지 않아 몇 페타바이트에 달하는 유전체 데이터를 관리하게 되었습니다.”라고 Heath 씨는 말합니다.
또한 CHOP에서는 Amazon HealthLake를 이용하여 의료 서비스 시스템, 기술 디바이스, 직원 간 상호운용성이 향상된 덕분에 KFDRC의 협업 잠재력도 강화할 수 있었습니다. “이 프로젝트 덕분에 클라우드 기반 접근 방식이 협업을 조성하고, 소아과 부문의 다양한 희귀 질병을 다루는 많은 사람을 한데 모아 새로운 정보를 이해하고 찾아내는 데 얼마나 큰 도움이 되는지 알 수 있었습니다.”라고 Heath 씨는 말합니다.
자세한 내용은 aws.amazon.com/health를 참조하세요.
Children’s Hospital of Philadelphia(CHOP) 관련 정보
Children’s Hospital of Philadelphia는 1855년에 설립되었으며, 미국 내 최초의 소아과 전담 병원입니다. 본원은 필라델피아에 있으며, 펜실베이니아주와 뉴저지주에서 여러 다른 시설도 운영하고 있습니다.
AWS의 이점
- 연구 커뮤니티에 유전체 및 관련 임상 데이터에 대한 액세스 제공
- 1년 이내에 1.5PB에 달하는 유전체, 임상, 영상 데이터 인덱싱 완료
- KFDRC의 협업 잠재력 강화
- 연구진이 데이터 분석을 위해 가상 코호트를 시각화하도록 지원
- 확장 가능한 인프라 실현
- 참가자 5,000명에게서 얻은 2억 1,500만 개의 고유한 유전체 변이에 대해 260억 건의 발생 사례 저장
- FHIR 업계 표준 충족
사용된 AWS 서비스
Amazon Healthlake
Amazon HealthLake는 의료 및 생명 과학 회사가 대규모 쿼리 및 분석을 위해 개인 또는 환자 집단의 건강 데이터를 한눈에 볼 수 있게 해주는 HIPAA 적격 서비스입니다.
Amazon Comprehend
Amazon Comprehend는 기계 학습을 사용하여 텍스트에서 유용한 인사이트 및 관계를 찾아내는 자연어 처리(NLP) 서비스입니다.
시작하기
선도적인 의료 서비스 제공자는 이미 AWS를 사용하고 있습니다. 지금 전문가와 상담하고 AWS 클라우드로의 여정을 시작하세요.