Amazon DataZone: 데이터 검색 자동화
개요
잠재적인 오류를 유발하는 데이터 카탈로그의 데이터 속성을 수동으로 입력하는 시간을 제거할 수 있습니다. 비즈니스 컨텍스트를 생성하고 데이터 세트에 대한 분석을 추천하여 데이터 검색 결과를 향상할 수 있습니다. 데이터의 출처와 변경의 영향을 받는 소스를 파악할 수 있습니다. 비즈니스 데이터 카탈로그의 데이터가 더 많고 풍부해지면 검색 경험도 향상됩니다. 데이터의 검색과 사용에 소요되는 시간이 몇 주에서 며칠로 줄어듭니다.
사용 사례
동영상
AWS re:Invent 2023 - How to build a business catalog with Amazon DataZone(21:37)
AWS re:Invent 2023 - Understand your data with business context(55:40)
FAQ
Amazon DataZone 비즈니스 데이터 카탈로그에는 어떤 종류의 정보가 있나요?
Amazon DataZone 비즈니스 데이터 카탈로그의 비즈니스 메타데이터는 비즈니스 담당자가 작성하거나 사용하는 정보를 제공하고 조직 데이터에 컨텍스트를 제공합니다. 여기에는 다음 정보가 포함될 수 있습니다.
- 소유권: 현대적인 데이터 중심 조직에서는 각 사업 분야(Line of Business, LOB)가 자체 데이터를 관리하는 분산 데이터 관리 프로세스를 사용합니다. 카탈로그는 이 소유권을 추적합니다. 따라서 이해 관계자가 비즈니스 업무의 일환으로 데이터를 찾고 데이터에 대한 액세스를 요청할 수 있습니다.
- 분류: 데이터 검색은 비즈니스 메타데이터로 지원할 수 있는 주요 태스크 중 하나입니다. 데이터 검색은 중앙에서 정의한 회사의 온톨로지 및 분류법을 사용하여 데이터 소스를 분류하고 관련된 데이터 객체를 찾을 수 있도록 돕습니다.
- 관계: Amazon DataZone 비즈니스 데이터 카탈로그를 사용하면 관계 정보를 메타데이터로 추가할 수 있습니다. 기술 데이터 세트 스키마와 마찬가지로 비즈니스 데이터 카탈로그에는 데이터베이스, 데이터 세트 및 데이터 세트 열 간의 관계 등 카탈로그 내 객체 간의 관계가 표시됩니다.
- 스키마: 설명에 대한 AI 추천은 기술 및 비즈니스 스키마를 사용하여 데이터에 대한 추천 설명과 사용법을 생성할 수 있습니다.
- 출처 및 사용: 데이터 계보와 영향 분석뿐 아니라 OpenLineage의 사용자 지정 매핑이 비즈니스 데이터 카탈로그에 연결됩니다.
Amazon DataZone을 사용하여 무엇을 카탈로그화할 수 있나요?
Amazon DataZone은 AWS Glue 데이터 카탈로그 및 Amazon Redshift에서 직접 게시된 데이터 자산을 지원합니다. 이 두 소스는 다음 위치의 데이터를 카탈로그화하는 데 사용할 수 있습니다.
- Amazon Simple Storage Service(S3) 데이터 레이크
- AWS Glue 크롤러를 통한 Amazon Relational Database Service(RDS)와 같은 다양한 AWS 목적별 데이터베이스
- Snowflake, Salesforce, Google Analytics와 같은 서드 파티 애플리케이션에서 데이터를 가져올 수 있는 100개 이상의 Amazon AppFlow 커넥터