Présentation
La solution de streaming de données pour Amazon MSK vous permet de capturer des données en streaming à l'aide d'Amazon Managed Streaming for Apache Kafka (Amazon MSK), un service de stockage extrêmement évolutif capable de gérer un volume de données élevé provenant des producteurs de données. Un producteur peut représenter des milliers de sources de données, chacune générant des données de diffusion en continu (streaming) qui soumettent simultanément des enregistrements de petites tailles (en kilo-octets).
En outre, les données de streaming sont variées : fichiers journaux générés par les clients à l'aide d'applications mobiles ou Web, achats en ligne, activité des joueurs, informations provenant de réseaux sociaux, de salles de marché ou de services géospatiaux, télémétrie d'appareils ou d'instruments connectés dans des centres de données.
Cette solution AWS fournit quatre modèles AWS CloudFormation dans lesquels les données circulent à travers les producteurs, le stockage en continu, les consommateurs et les destinations. Comme pour la solution Streaming Data Solution for Amazon Kinesis, les modèles sont configurés de manière à appliquer les meilleures pratiques pour surveiller les fonctionnalités et sécuriser les données à l'aide de tableaux de bord et d'alarmes.
Avantages
Détails techniques
Vous pouvez déployer automatiquement cette architecture à l’aide du guide d’implémentation et des modèles AWS CloudFormation qui l’accompagnent.
-
Option 1
-
Option 2
-
Option 3
-
Option 4
-
Option 1
-
Modèle AWS CloudFormation utilisant Amazon Managed Streaming for Apache Kafka (Amazon MSK)
Étape 1
Ce modèle AWS CloudFormation déploie un cluster Amazon Managed Streaming for Apache Kafka (MSK).
Étape 2
Un groupe d'utilisateurs Amazon Cognito est utilisé pour contrôler qui peut invoquer les méthodes de l'API REST.À propos de ce déploiementDate de publication- Date de publication
Options de déploiementPrêt à vous lancer ?Déployer cette solution en la lançant dans votre console AWS -
Option 2
-
Modèle AWS CloudFormation utilisant Amazon MSK et AWS Lambda
Étape 1
Ce modèle CloudFormation déploie une fonction AWS Lambda qui traite les enregistrements dans une rubriques Apache Kafka. La fonction par défaut est une application Node.js qui enregistre les messages reçus. Elle peut être personnalisée pour répondre aux besoins de votre entreprise.À propos de ce déploiementDate de publication- Date de publication
Options de déploiementPrêt à vous lancer ?Déployer cette solution en la lançant dans votre console AWS -
Option 3
-
Modèle AWS CloudFormation utilisant Amazon MSK, AWS Lambda et Amazon Kinesis Data Firehose
Étape 1
Une fonction Lambda traitant les enregistrements dans une rubrique Apache Kafka.Étape 2
Un flux de diffusion Amazon Kinesis Data Firehose qui met en mémoire les données avant de les envoyer à leur destination.Étape 3
Un compartiment Amazon Simple Storage Service (Amazon S3) qui stocke tous les événements d'origine provenant du cluster Amazon MSK.À propos de ce déploiementDate de publication- Date de publication
Options de déploiementPrêt à vous lancer ?Déployer cette solution en la lançant dans votre console AWS -
Option 4
-
Modèle AWS CloudFormation utilisant Amazon MSK, service géré Amazon pour Apache Flink et Amazon S3
Étape 1
Un bloc-notes service géré Amazon pour Apache Flink Studio qui lit les événements d'un sujet existant dans un cluster Amazon MSK.Étape 2
Un compartiment S3 stocke la sortie.À propos de ce déploiementDate de publication- Date de publication
Options de déploiementPrêt à vous lancer ?Déployer cette solution en la lançant dans votre console AWS
Rubriques connexes
Cet article explique les modèles et les solutions qui peuvent être utilisés pour sauvegarder les rubriques MSK sur S3, ce qui permet aux clients de réduire les paramètres de rétention des données à long terme dans MSK. Certains clients stockent des données à long terme dans MSK pour les charges de travail de l'analyse des données et du Machine Learning. Nous partageons un modèle permettant de simplifier cette architecture en transférant les données des rubriques dans S3 et d'utiliser S3 pour l'analyse et le ML.
Ce cours d'autoformation porte sur le processus de planification des solutions d'analyse des données et sur les divers processus d'analytique des données connexes.