Amazon DataZone: Datenerkennung automatisieren
Übersicht
Entfernen Sie die Zeit für die manuelle Eingabe von Datenattributen in den Datenkatalog, was ebenfalls zu potenziellen Fehlern führen kann. Generieren Sie den Geschäftskontext und empfehlen Sie Analysen für Datensätze, wodurch die Ergebnisse der Datenerfassung verbessert werden. Erfahren Sie, woher Ihre Daten stammen und welche Quellen von Änderungen betroffen sein werden. Mehr, umfangreichere Daten im Geschäftsdatenkatalog verbessern auch das Sucherlebnis. Reduzieren Sie Ihre Zeit für die Suche und Nutzung von Daten von Wochen auf Tage.
Anwendungsfälle
Videos
Häufig gestellte Fragen
Welche Art Informationen befinden sich im Geschäftsdatenkatalog von Amazon DataZone?
Im Amazon DataZone Katalog für Geschäftsdaten liefern Geschäftsmetadaten Informationen, die von Geschäftsleuten verfasst oder verwendet werden, und geben den Unternehmensdaten einen Kontext. Dies könnte die folgenden Informationen beinhalten:
- Eigenverantwortung: Moderne datenorientierte Organisationen verwenden einen verteilten Datenverwaltungsprozess, bei dem die Geschäftsbereiche (LOBs) für die Verwaltung ihrer eigenen Daten verantwortlich sind. In einem Katalog werden die Eigentumsverhältnisse erfasst, sodass interessierte Parteien im Rahmen ihrer Geschäftsaufgaben nach Daten suchen und Zugriff darauf beantragen können.
- Klassifizierung: Die Datenermittlung ist eine wichtige Aufgabe, die Geschäftsmetadaten unterstützen können. Datenerkennung verwendet zentral definierte Unternehmens-Ontologien und Taxonomien, um Datenquellen zu klassifizieren, und hilft Ihnen, relevante Datenobjekte zu finden.
- Beziehungen: Sie können den Amazon-DataZone-Geschäftsdatenkatalog verwenden, um Beziehungsinformationen als Metadaten hinzuzufügen. Wie bei einem technischen Datensatzschema zeigt der Geschäftsdatenkatalog Beziehungen zwischen Objekten im Katalog, z. B. zwischen Datenbanken, Datensätzen und ihren Spalten.
- Schema: KI-Empfehlungen für Beschreibungen können das technische und geschäftliche Schema verwenden, um empfohlene Beschreibungen und Verwendungen für Daten zu generieren.
- Herkunft und Verbrauch: Im Geschäftsdatenkatalog besteht eine Verknüpfung mit Analysen von Datenherkunft und -wirkung sowie mit benutzerdefinierten Mappings von OpenLineage.
Was kann ich mit Amazon DataZone katalogisieren?
Amazon DataZone unterstützt Datenbestände, die direkt aus dem AWS-Glue-Datenkatalog und Amazon Redshift veröffentlicht wurden. Diese beiden Quellen können verwendet werden, um Daten an den folgenden Orten zu katalogisieren:
- Amazon-Simple-Storage-Service-Data-Lakes (Amazon S3)
- Viele der speziell von AWS entwickelten Datenbanken, wie Amazon Relational Database Service (Amazon RDS), werden über einen AWS-Glue-Crawler bereitgestellt
- Über 100 Amazon-AppFlow-Konnektoren zur Einbindung von Daten aus Drittanbieteranwendungen wie Snowflake, Salesforce und Google Analytics