Gilead 로고

Gilead, AWS에서 기계 학습을 사용하여 엔터프라이즈 검색 도구 개발 가속화

2022

생명 공학 회사 Gilead Sciences Inc. (Gilead)는 생명을 위협하는 질병에 걸린 환자를 위해 더 다양한 치료법을 신속하게 제공할 수 있도록 제약 개발 및 제조(PDM) 사업부 내에서 직원 생산성을 높이고 내부 데이터 관리 프로세스를 간소화하기를 원했습니다. Gilead는 이 목표를 실현하기 위해 인공 지능(AI) 및 기계 학습(ML)을 사용하여 예측 분석을 제공하고 중요한 문서, 지식, 데이터를 중앙 집중화된 단일 위치에서 검색할 수 있는 대규모 엔터프라이즈 검색 도구를 구축하기를 원했습니다. 이 도구가 각 자연어 쿼리와 관련된 결과를 일관되게 산출하기 위해서는 최대 9개 엔터프라이즈 시스템의 정형 데이터와 비정형 데이터를 모두 정리하고 지식 리포지토리의 문서를 정리할 수 있는 솔루션 세트가 필요했습니다.

Gilead의 PDM 팀은 프로젝트 일정을 가속화하기 위한 솔루션으로 Amazon Web Services(AWS)를 선택하고, ML을 기반으로 한 매우 정확한 지능형 검색 서비스인 Amazon Kendra를 도입했습니다. PDM 팀은 AWS의 지원을 받으면서 9개월 만에 데이터 레이크를 구축했고, 이후 단 3개월 만에 검색 도구를 구축해 예상했던 3년보다 훨씬 짧은 기간 내에 프로젝트를 완료했습니다. 엔터프라이즈 검색 도구를 출시한 이후, PDM의 사용자는 수동 데이터 관리 작업과 정보 검색에 걸리는 시간을 약 50% 줄여 연구, 실험 및 제약 분야에서 획기적인 발전의 동력을 제공하고 있습니다.

medical laboratory, scientist hands using microscope for chemistry ,biology test samples,examining liquid,Doctor equipment,Scientific and healthcare research background.vintage color
kr_quotemark

Amazon Kendra는 턴키 AI 솔루션입니다. 올바르게 구성하면 조직의 모든 단일 영역에 배포하면서도 간단하게 구현할 수 있습니다."

Jeremy Zhang
Gilead Sciences Inc., 데이터 과학 및 지식 관리 부문 이사

Amazon Machine Learning Solutions Lab에서 지원 받기

캘리포니아주 포스터 시티에 본사를 둔 Gilead는 HIV 및 바이러스 감염을 비롯하여 백신 기술과 제약 부문의 연구 및 개발에 특화된 기업입니다. 2021년 4월, Gilead의 제조 사업부 내의 데이터 과학 팀은 AI와 ML을 사용하여 약 25만 개의 문서와 1TB의 비정형 데이터에서 필요한 정보와 인사이트를 신속하게 도출하는 엔터프라이즈 검색 도구인 Morpheus의 개념을 완성했습니다. 데이터 사이언티스트와 엔지니어로 구성된 프로젝트 팀이 PDM 내에 구성되었습니다. 이 팀은 PDM의 연구원과 과학자들이 규제 기관, 규정 준수, 공급망 및 제조 데이터에서 보다 심층적인 인사이트를 얻어 생명을 구하는 약품을 환자에게 더 빠르게 제공하는 능력을 갖출 수 있도록 하는 작업을 전담하고 있습니다.

Morpheus 팀은 지식 검색을 위한 단일 AI 및 ML 전략을 구현할 수 있도록 여러 엔터프라이즈 시스템의 데이터를 한데 통합해야 하는 중요한 과제에 직면했습니다. Gilead의 데이터 과학 및 지식 관리 책임자인 Jeremy Zhang은 "저희는 AI 검색을 구축하는 데 필요한 데이터, 지식 및 정보를 대규모로 통합하는 인프라를 설계하고 구현함으로써 Gilead의 지식 AI 분야에서 혁신을 실현할 기회를 포착했습니다"라고 말합니다.

Morpheus의 태스크 포스는 엔터프라이즈 검색 도구를 개발하기 위해 Amazon Machine Learning Solutions Lab을 이용했습니다. 이 Lab은 조직의 팀과 ML 전문가를 서로 연결하여 조직에서 투자 수익률이 가장 높은 ML 활용 기회를 지원하기 위한 ML 솔루션을 찾고 구축하는 데 도움을 주었습니다. 이 태스크 포스는 Amazon ML Solutions Lab 팀과 협력하여 클라우드 모범 사례에 대한 이해도를 높이고, 개념 증명을 설계하고 실행하는 방법을 배웠습니다. 아울러 Amazon Kendra에 대해서도 배웠습니다. Zhang은 "Amazon Kendra는 턴키 AI 솔루션입니다. 올바르게 구성하면 조직의 모든 단일 영역에 배포하면서도 간단하게 구현할 수 있습니다"라고 말합니다. 이 팀은 전적으로 AWS를 기반으로 한 엔터프라이즈 검색 도구를 4주 안에 개발하기로 결정했습니다.

조직의 변화를 촉진할 Morpheus 애플리케이션 구축

Gilead의 PDM 팀은 업계 최고 수준의 확장성, 데이터 가용성, 보안 및 성능을 제공하는 객체 스토리지 서비스인 Amazon Simple Storage Service(S3)를 사용하여 데이터 레이크를 구축하면서 Morpheus 프로젝트에 착수했습니다. 이 데이터 레이크는 사실상 규모에 관계없이 PDM의 모든 비정형 데이터를 저장할 수 있는 중앙 리포지토리 역할을 합니다. Zhang은 "AWS에서 엔터프라이즈 검색 도구를 사용하려면 강력한 데이터 관리 기능이 필요합니다. 그래서 9개월 만에 AWS에 데이터 레이크를 구축했습니다. 보통 이 같은 데이터 레이크를 구현하려면 몇 년이 걸릴 거라고 생각하죠"라고 말합니다. 이 회사는 데이터 레이크를 AI와 ML의 기반으로 사용할 뿐만 아니라, 개발 및 제조 전반에 걸쳐 데이터를 분석하고 심층적인 인사이트를 확보하는 데에도 사용합니다. 이전에는 Gilead의 팀이 분석을 위해 IT 팀에 티켓을 제출해야 했으며, 경우에 따라 요청이 처리되는 데 최대 1년이 소요되기도 했습니다. 이제 회사는 영업일을 기준으로 며칠 내에 분석 및 AI 추론을 제공할 수 있습니다.

다음으로, PDM 팀은 Amazon SageMaker를 사용하여 누락되거나 불완전한 메타데이터를 채워 문서 도구의 검색 기능을 강화하는 데 주력했습니다. 이 서비스는 사용자가 완전관리형 인프라, 도구 및 워크플로를 사용하여 거의 모든 사용 사례별로 ML 모델을 구축, 훈련 및 배포할 수 있도록 지원합니다. Gilead는 이 솔루션을 사용하여 연구원이 몇 가지 키워드로 관련 정보를 더 쉽게 검색할 수 있도록 했습니다. 또한 이 회사는 스캔한 문서에서 텍스트, 필기 및 데이터를 자동으로 추출하는 기계 학습(ML) 서비스인 Amazon Textract도 사용합니다. Gilead는 문서에서 관련 정보를 인식하는 데 Amazon Textract를 사용하기 시작했고, 그 결과 이전의 광학 문자 인식 솔루션보다 작업당 관련 비용을 몇 배나 줄일 수 있었습니다. Zhang은 "Amazon Textract는 비용을 실질적으로 절감해줄 뿐만 아니라, 정보를 추출하는 기술적 능력이 탁월하다는 점에서도 매우 우수합니다"라고 말합니다.

또한 이 팀은 애플리케이션에 Amazon Kendra를 사용하여 데이터 레이크에서 결과를 검색합니다. 이와 관련해 Gilead는 시스템 전체에서 관련 정보를 검색하는 데 걸리는 시간을 약 50% 단축하여 직원 생산성을 높이고 팀의 워크플로를 간소화할 수 있었습니다. Zhang은 "Amazon Kendra를 사용하면서 효율성이 크게 향상되었습니다. Amazon Kendra 덕분에 우리 팀은 정확한 정보를 찾기 위해 검색해야 하는 검색 대상의 수를 줄일 수 있었습니다"라고 말합니다.

2021년 11월, 팀은 Morpheus 애플리케이션을 출시할 수 있었고, 5명으로 구성된 핵심 팀만으로 프로젝트의 첫 번째 단계를 완료했습니다. 그 이후로, 이 애플리케이션은 조직에서 변화의 촉매제가 되었습니다. 출시 3개월 만에 100명 이상의 직원이 이 엔터프라이즈 검색 도구를 채택했습니다. Zhang은 "Morpheus는 정보를 정리하고 검색하려면 도서관학이나 온톨로지를 연구해야 한다는 고정관념을 깨주었습니다. 아울러 고위 경영진에게 AI와 ML의 가치를 손쉽게 입증할 수 있도록 해주었습니다"라고 말합니다.

AI 및 ML 기술에서 더 많은 가치 창출

Gilead 내의 개발 및 제조 팀은 현재 제조 모범 사례 준수를 비롯하여, GxP 규정 준수를 실현하기 위해 데이터 레이크를 개선하는 데 힘쓰고 있으며, 2022년 6월까지 데이터 레이크 재구축을 완료할 것으로 전망하고 있습니다. 또한 이 회사는 예측 메타데이터, 개인화된 AI 및 지식 그래프를 제공하기 위해 더 많은 AI 및 ML 기술을 구축할 계획입니다. Zhang은 "Morpheus는 이러한 크기와 규모의 도구를 사용하는 것이 조직 전체에 어떻게 도움이 되는지를 잘 보여줍니다. AWS에서 AI와 ML를 통해 창출할 수 있는 차세대의 가치를 이끌어내기 위해, Gilead가 데이터 과학을 어떻게 활용해야 할지 이해하는 데 큰 도움이 됩니다"라고 말합니다.


Gilead Sciences 소개

캘리포니아주 포스터 시티에 본사를 둔 Gilead는 HIV 및 바이러스 감염과 코로나 19의 치료제를 비롯하여 백신 기술과 제약 부문의 연구 및 개발에 특화된 생명 공학 회사입니다.

AWS의 이점

  • AI와 ML을 사용하는 엔터프라이즈 검색 도구를 1년 이내에 구축
  • 서로 다른 9개 엔터프라이즈 시스템의 리포지토리 역할을 하는 데이터 레이크를 구축
  • 데이터 관리와 관련한 수작업을 줄임
  • 검색 시간을 약 50% 단축
  • 내부 워크플로를 간소화하고 직원 생산성을 제고
  • 며칠 만에 심층적인 분석 결과와 인사이트를 확보
  • 비용 절감 증대
  • 조직의 변화 촉진 

사용된 AWS 서비스

Amazon Kendra

Amazon Kendra는 기계 학습을 통해 제공되는 지능형 검색 서비스입니다. Kendra는 웹 사이트 및 애플리케이션에 대한 엔터프라이즈 검색을 재정립하는 서비스로, 원하는 콘텐츠가 여러 위치와 조직 내의 콘텐츠 리포지토리에 분산되어 있는 경우에도 직원과 고객이 이를 손쉽게 찾을 수 있게 해줍니다.

자세히 알아보기 »

Amazon SageMaker

Amazon SageMaker를 통해 데이터 사이언티스트와 개발자는 기계 학습을 위해 특별히 구축된 다양한 기능 세트를 함께 활용하여 고품질 기계 학습 모형을 빠르게 준비, 구축, 훈련 및 배포할 수 있습니다.

자세히 알아보기 »

Amazon Textract

Amazon Textract는 스캔한 문서에서 텍스트, 필기 및 데이터를 자동으로 추출하여 단순한 OCR(광학 문자 인식)을 넘어 양식과 테이블에서 데이터를 식별, 이해 및 추출하는 기계 학습 서비스입니다.

자세히 알아보기 »

Amazon Simple Storage Service(Amazon S3)

Amazon Simple Storage Service(S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.

자세히 알아보기 »


시작하기

모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다. 지금 전문가와 상담하고 AWS로의 여정을 시작하세요.