Amazon DataZone: 통합
Amazon DataZone 통합은 네 가지 범주로 구분됩니다.
생산자 데이터 소스
AWS Glue 데이터 카탈로그 및 Amazon Redshift용 내장 데이터 소스의 데이터를 게시합니다. 다른 모든 유형의 소스의 경우 사용자 지정 자산 유형을 정의하고 Amazon DataZone 퍼블릭 API를 사용하여 해당 자산을 게시할 수 있습니다. AWS Glue Data Quality와 통합하려는 경우 일정에 따라 데이터 소스를 가져와서 데이터 품질 점수에 사용할 수 있습니다.
분석 도구
Amazon Athena 및 Amazon Redshift 쿼리 에디터와 같은 서비스를 사용하여 쿼리 에디터의 데이터로 직접 작업할 수 있습니다. 이 기능은 API를 사용하여 쉽게 확장하여 다른 서드 파티 도구를 사용자 지정할 수 있습니다. Amazon DataZone은 이러한 도구와 프로젝트 액세스 컨텍스트를 공유할 수 있습니다.
액세스 이행
AWS Lake Formation 관리형 AWS Glue 테이블과 Amazon Redshift 테이블 및 뷰에 대한 권한을 자동으로 이행하고 관리할 수 있습니다. 다른 모든 자산의 경우 Amazon DataZone은 구독 요청 또는 승인과 같은 사용자 작업과 관련된 표준 이벤트를 내보냅니다. 이 표준 이벤트를 사용하여 다른 AWS 서비스 또는 서드 파티 솔루션과 통합하여 사용자 지정 통합을 지원할 수 있습니다.
기계 학습(ML) 도구
Amazon SageMaker로 작업하여 데이터 및 ML 자산에 손쉽게 액세스할 수 있습니다. 손쉽게 ML 작업을 수행하고 새로 생성된 데이터 및 ML 자산을 비즈니스 데이터 카탈로그에 게시할 수 있습니다. Amazon SageMaker가 ML 거버넌스를 지원하는 방법에 대해 자세히 알아보세요.
데이터 레이크의 데이터 관리
AWS를 통해 세분화된 데이터 액세스 권한을 중앙에서 관리하고 그 규모를 조정할 수 있습니다.
Amazon S3 및 Amazon DataZone을 사용한 데이터 레이크의 데이터 거버넌스
효과적인 데이터 거버넌스는 데이터의 무결성과 신뢰성을 보장하는 열쇠입니다. 데이터 레이크가 조직에 중요한 이유, 데이터 거버넌스의 AWS 모델, 데이터 레이크 관리에 도움이 되는 다양한 서비스에 대해 알아보세요.
Amazon DataZone 및 AWS Glue로 메타데이터를 관리하여 데이터 환경을 통합하세요.
사용자, 엔진 및 모델에서 데이터를 검색할 수 있으려면 강력하고 종합적인 메타데이터 관리 솔루션이 필요합니다. Amazon DataZone 및 AWS Glue 데이터 카탈로그로 검색, 관리 및 분석을 간소화하세요.