최고 데이터 책임자를 위한 Amazon DataZone

개요

Amazon DataZone은 데이터를 카탈로그로 작성하고, 데이터를 검색, 관리, 공유 및 분석할 수 있는 데이터 관리 서비스입니다. Amazon DataZone을 사용하면 계정 및 지원되는 리전 전체에서 데이터를 공유하고 액세스할 수 있습니다. Amazon DataZone을 사용하면 Amazon Redshift, Amazon Athena, AWS Glue 및 AWS Lake Formation과 같은 AWS 서비스 전반의 경험이 간소화됩니다.

사용 사례

사일로 해소

비즈니스 팀은 비즈니스 프로세스를 개선하기 위해 비즈니스 전반에 걸쳐 데이터를 효과적으로 사용할 수 있는 가시성이 필요합니다. 페타바이트 규모의 데이터가 여러 부서, 서비스, 온프레미스 데이터베이스 및 서드 파티 소스(예: 파트너 솔루션 및 공개 데이터 세트)에 분산되어 있기 때문에 모든 데이터를 파악하기가 어려울 수 있습니다. 이 데이터의 가치를 최대한 활용하려면 먼저 관리자와 데이터 관리자가 데이터에 액세스할 수 있도록 설정해야 합니다. 그러나 통제력을 유지해야 하며, 올바른 사람만이 올바른 상황에서만 데이터에 액세스할 수 있도록 해야 합니다. Amazon DataZone을 통해 이러한 개별 팀이 도메인과 비즈니스 데이터 카탈로그를 구축할 수 있도록 권한을 부여할 수 있습니다. 내장된 생성형 인공 지능(AI)과 함께 데이터를 큐레이션하여 비즈니스 데이터 카탈로그의 분류 체계를 강화하여 데이터를 더 쉽게 검색하고 이해할 수 있도록 합니다.

데이터 중심의 의사 결정

회사 내 직원(데이터 소비자)은 의사 결정을 내리기 위해 데이터 생산자로부터 정보를 발견하고 분석하기를 원합니다. 그러나 데이터를 안전하게 유지하려면 이 액세스도 제어해야 합니다. 이러한 역설로 인해 다양한 데이터, 부서 및 사용 사례를 고려하는 데이터 거버넌스 정책을 구현하기가 어렵습니다. Amazon DataZone을 통해 데이터 소비자는 필요한 정보를 찾고 소유자에게 액세스를 요청합니다. 그러면 Amazon DataZone이 데이터를 분석 서비스에 원활하게 로드할 수 있습니다. 따라서 의사 결정권자는 최신 데이터를 기반으로 의사 결정을 내리는 데 필요한 정보를 적시에 얻을 수 있습니다.

데이터 검색 및 해석 향상

데이터 소비자는 자신의 사용 사례와 관련된 데이터를 빠르고 쉽게 파악할 수 있도록 비즈니스 상황에 대한 자세한 설명과 권장 사용법에 대한 문서가 필요합니다. AI가 생성한 메타데이터를 통해 사용 사례와 관련된 더 가치 있는 데이터 세트를 찾고, 데이터 생산자와 의견을 주고받는 시간을 줄일 수 있습니다. 이 메타데이터가 풍부해지면 데이터 소비자는 데이터와 사용 사례와의 관련성을 이해할 수 있고, 의도하지 않은 목적으로 데이터를 오용하는 것을 방지할 수 있습니다. 데이터 소비자는 자신이 선택하는 데이터를 신뢰할 수 있다는 것을 알아야 합니다. 이들은 이를 위해 데이터 품질 점수를 평가하고 데이터 계보를 이해합니다.

비즈니스 이니셔티브에서 역방향으로 작업하여 데이터 액세스와 제어의 균형을 유지

이 O'Reilly 보고서를 읽고 현대적인 데이터 거버넌스가 필요한 데이터 기반 솔루션을 배포하는 방법을 알아보세요. 경영진은 규모에 따른 데이터 거버넌스 관리의 복잡성을 헤쳐나가는 데 필요한 인사이트와 지식을 얻을 수 있습니다.

동영상

AWS re:Invent 2023 - Modern data governance customer panel(53:46)
AWS re:Invent 2023 - Best practices for analytics and generative AI on AWS(50:13)
AWS re:Invent 2023 - Build an end-to-end data strategy for analytics and generative AI with Fannie Mae(56:21)

FAQ

Amazon DataZone은 어떻게 비즈니스 팀과 인프라 팀 간의 균형을 유지하나요?

Amazon DataZone은 데이터 생산자(데이터 엔지니어 및 데이터 과학자)가 주도하는 사용 플라이휠을 만듭니다. 데이터 생산자는 조직 내 다른 사람들과 데이터를 해당 컨텍스트와 함께 안전하게 공유합니다. 그런 다음 데이터 소비자(분석가)는 데이터에서 비즈니스 질문에 대한 답을 찾아 조직 내 다른 사람들과 공유합니다. 이 워크플로는 고객이 데이터 생산자가 데이터 자산을 게시, 소유 및 관리하는 분산형 데이터 소유권과 데이터 생산 및 데이터 소비를 위한 연합 거버넌스 모델을 생성하는 데 도움이 됩니다. 그러면 데이터 소비자는 데이터 소유자와 함께 승인 워크플로를 완료한 후 관심 있는 데이터에 액세스할 수 있습니다. 이렇게 하면 팀이 스스로 서비스를 제공함으로써 특정 팀에 의해 병목 현상이 발생할 가능성을 없앨 수 있습니다.