Verarbeitung von Big Data und Datenanalytik – Amazon EMR – Preise

Amazon EMR auf Amazon EC2

Diese Preise gelten für Amazon-EMR-Anwendungen, die auf Amazon-EMR-Clustern mit Amazon-EC2-Instances ausgeführt werden.

Der Amazon-EMR-Preis gilt zusätzlich zum Amazon-EC2-Preis (der Preis für die zugrunde liegenden Server) und zum Amazon-Elastic-Block-Store (Amazon EBS)-Preis (wenn Amazon EBS-Volumes angefügt werden). Auch diese werden sekundengenau, mit einem Minimum von einer Minute, in Rechnung gestellt. Sie können aus einer Vielzahl von EC2-Preisoptionen wählen, einschließlich On-Demand-Angeboten (siehe unten), Reserved-Instances mit ein- und dreijähriger Laufzeit, Capacity Savings Plans sowie Spot-Instances. Bei Spot-Instances handelt es sich um eine freie EC2-Kapazität, die zu einem Preisnachlass von bis zu 90 % im Vergleich zu On-Demand-Preisen verfügbar ist. Sehen Sie sich Preiseinsparungen für Spot-Instances gegenüber On-Demand an, indem Sie auf der Seite „Spot Instance Advisor“ nach „Von EMR unterstützte Instance-Typen“ filtern.

Amazon EMR in Amazon EKS

Diese Preise gelten für Amazon EMR auf Amazon-EKS-Clustern.

Der Preis für Amazon EMR gilt zusätzlich zu den Preisen für Amazon EKS oder andere Services, die mit EKS genutzt werden. Sie können EKS auf AWS entweder mit EC2 oder AWS Fargate ausführen. Wenn Sie EC2 (einschließlich mit verwalteten EKS-Knotengruppen) verwenden, bezahlen Sie für AWS-Ressourcen (z. B. EC2-Instances oder EBS-Volumes), die Sie zur Ausführung Ihrer Kubernetes-Worker-Knoten erstellen. Detaillierte Preisinformationen finden Sie auf der Preisseite für EC2. Wenn Sie AWS Fargate benutzen, werden die Preise anhand der vCPU- und Arbeitsspeicherressourcen berechnet, die für die Zeitdauer des Container-Image-Downloads verwendet werden, bis der EKS-Pod beendet wird, aufgerundet auf die nächste Sekunde. Es wird immer mindestens 1 Minute berechnet. Detaillierte Preisinformationen finden Sie auf der Preisseite für AWS Fargate.

Die Preise für Amazon EMR auf Amazon EKS werden auf der Grundlage der vCPU- und Speicherressourcen berechnet, die vom Zeitpunkt des Beginns des Downloads Ihres EMR-Anwendungsimages bis zur Beendigung des EKS Pods verwendet werden, aufgerundet auf die nächste Sekunde. Die Preise basieren auf der angeforderten vCPU und den Speicherressourcen für die Aufgabe oder den Pod.

Amazon EMR auf AWS Outposts

Amazon EMR bei AWS-Outposts-Preisen entspricht den cloudbasierten-Instances von EMR. Weitere Details zu AWS-Outposts-Preisen finden Sie auf der AWS Outposts Preisseite.

Amazon EMR Serverless

Diese Preise beziehen sich auf EMR Serverless.

Bei EMR Serverless fallen keine Vorabkosten an und Sie zahlen nur für die genutzten Ressourcen. Sie zahlen für die vCPU-, Arbeitsspeicher- und Speicherressourcen, die Ihre Anwendungen verbrauchen.

Mit EMR Serverless können Sie Anwendungen unter Verwendung einer Open-Source-Frameworkversion erstellen und Aufträge an die Anwendung übertragen. Im Rahmen der Auftrags-Spezifikation können Sie außerdem ein Minimum und ein Maximum gleichzeitiger Worker, sowie Minimum und Maximum der von genutzter vCPU-Kapazität, Arbeitsspeicher und Speicher für jeden Worker definieren. EMR fügt automatisch Worker hinzu oder entfernt sie wieder, je nachdem was die Anforderungen des Auftrags im von Ihnen spezifizierten Rahmen sind. Die drei Dimensionen Rechenleistung, Arbeitsspeicher und Speicher für Worker können unabhängig voneinander konfiguriert werden. Sie können zwischen 1 vCPU, 2 vCPU, 4 vCPU, 8 vCPU und 16 vCPU pro Worker, Arbeitsspeicher von 2 GB bis 120 GB pro Worker in Schritten von 1 GB bis 8 GB wählen. Für Speicheroptionen können Sie zwischen 20 GB und 200 GB pro Worker als Standardspeicher wählen oder zwischen 20 GB und 2 TB pro Worker für die Zufallswiedergabe optimierten Speicher wählen.

Ihnen werden aggregierte vCPU, Arbeitsspeicher und Speicher-Ressourcen von Beginn der Ausführung des Workloads bis zu seinem Abschluss in Rechnung gestellt. Diese Zeit wird dabei auf eine Sekunde aufgerundet, beträgt jedoch minimal eine Minute. Wenn Sie ihre Anwendung so einrichten, dass Worker bei Beginn der Anwendung starten, starten die Worker, wenn Sie ihre Anwendung starten und werden beendet, wenn sie die Anwendung stoppen oder die Anwendung nicht arbeitet.

Hinweis: Bei der Verwendung von benutzerdefinierten Images werden Ihnen die gesamten vCPU-, Arbeitsspeicher- und Speicherressourcen berechnet, die ab dem Zeitpunkt, an dem EMR Serverless mit dem Herunterladen des Images beginnt, bis zum Stoppen der Worker verbraucht werden, aufgerundet auf die nächste Sekunde mit einem Minimum von 1 Minute.

Preisdetails (Computing und Arbeitsspeicher)

Die Preise basieren auf den aggregierten vCPU-, Arbeitsspeicher- und Speicherressourcen, die von allen aggregierten Workern verwendet wurden.

Linux/x86
Linux/ARM

Linux/x86
Linux/ARM

Preisdetails (flüchtiger Speicher)

Standardspeicher: Die ersten 20 GB flüchtiger Speicher stehen standardmäßig für alle Worker zur Verfügung – Sie zahlen nur für zusätzlichen Speicher, den Sie pro Worker konfigurieren.

Zufallswiedergabe-optimierter Speicher: Sie zahlen für den gesamten konfigurierten Speicher pro Worker, einschließlich der ersten 20 GB.

Unterstützte Worker-Konfigurationen

CPU	Arbeitsspeicherwerte	Flüchtiger Speicher
1 vCPU	Min. 2 GB und Max. 8 GB, in 1-GB-Schritten	20–200 GB
2 vCPU	Min. 4 GB und Max. 16 GB, in 1-GB-Schritten	20–200 GB
4 vCPU	Min. 8 GB und Max. 30 GB, in 1-GB-Schritten	20–200 GB
8 vCPU	Min. 16 GB und Max. 60 GB, in 4-GB-Schritten	20–200 GB
16 vCPU	Min. 32 GB und Max. 120 GB, in 8-GB-Schritten	20–200 GB

Dauer

Die Dauer wird ab dem Zeitpunkt berechnet, an dem ein Worker bereit ist, Ihre Workload auszuführen, bis zu dem Zeitpunkt, an dem er stoppt, aufgerundet auf die nächste Sekunde mit einem Minimum von 1 Minute.

Zusätzliche Gebühren

Es können Ihnen zusätzliche Gebühren entstehen, wenn Ihre Anwendungen andere AWS-Services nutzen. Wenn Ihre Anwendung beispielsweise Amazon Simple Storage Service (S3) zum Speichern und Verarbeiten von Daten verwendet, werden Ihnen die Amazon-S3-Standardtarife berechnet. Wenn Sie Daten aus Quellen wie Amazon S3, Amazon Relational Database Service (RDS) oder Amazon Redshift verschieben, werden Ihnen Standardgebühren für Anfragen und Datenübertragungen berechnet. Wenn Sie Amazon CloudWatch nutzen, werden Ihnen Standardtarife für CloudWatch Logs und CloudWatch-Ereignisse berechnet.

Amazon EMR WAL

Dieser Preis gilt für Amazon EMR in EC2-Clustern mit Apache-HBase-Anwendungen, die Amazon EMR WAL verwenden. Apache HBase Write Ahead Log ermöglicht das Aufzeichnen aller Änderungen an Daten in einem dateibasierten Speicher. Mit Amazon EMR auf EC2 können Sie Ihre vorausschauenden Apache-HBase-Protokolle in den Amazon EMR WAL schreiben, einer dauerhaft verwalteten Speicherebene, die Ihren Cluster überdauert. Für den Fall, dass Ihr Cluster oder in den seltenen Fällen, dass die Availability Zone fehlerhaft oder nicht mehr verfügbar ist, können Sie einen neuen Cluster erstellen. Verweisen Sie ihn auf dasselbe Amazon-S3-Stammverzeichnis und den Amazon-EMR-WAL-Workspace und stellen Sie die Daten im WAL innerhalb weniger Minuten automatisch wieder her. Weitere Informationen finden Sie in der Dokumentation zu Amazon EMR WAL.

Sie zahlen für das, was Sie für die EMR WAL verwenden. Wenn Sie über einen aktiven Cluster verfügen, der für die Verwendung der WAL konfiguriert ist, werden Ihnen die Gebühren für den EMR WAL Speicher basierend auf der Nutzung als EMR-WAL-WALHours, für Schreibvorgänge als WriteRequestGiB und für Lesevorgänge als ReadRequestGiB in Rechnung gestellt.

EMR-WAL-WALHours: EMR WAL erstellt eine WAL pro Apache-HBase-Region. Wenn nach der Beendigung Ihres Clusters noch Daten im EMR WAL vorhanden sind, die nicht in Amazon S3 übertragen wurden, können Sie die Daten wiederherstellen, indem Sie einen Wiederherstellungscluster starten. Oder Sie wählen die Bereinigung des WAL, indem Sie einen temporären Cluster erstellen und die EMR-WAL-CLI zur Löschung der EMR-WAL-Ressourcen verwenden. Wenn Sie die EMR-WAL-Daten nicht explizit löschen, speichert EMR WAL die Daten und berechnet Ihnen alle nicht gelöschten Daten 30 Tage lang. Ein Beispiel finden Sie unten.

ReadRequestGiB und WriteRequestGiB: Diese beiden Dimensionen gelten für die Lese- und Schreibanfragen. Apache-HBase-API-Aufrufe zum Schreiben von Daten in Ihre Tabelle in einem Cluster mit EMR WAL werden als WriteRequestGiB in Rechnung gestellt. EMR-WAL-Schreibvorgänge werden für alle Apache-HBase-Schreibvorgänge ausgeführt, z. B. für `Put`-Vorgänge. Apache-HBase-API-Aufrufe zum Lesen von Daten aus Ihrer EMR WAL während Apache-HBase-Wiederherstellungsvorgängen werden als ReadRequestGiB in Rechnung gestellt. Lese- und Schreibvorgänge werden je nach Artikelgröße und EMR-Rechnungen mit mindestens 1 Byte berechnet.

Preisbeispiele

Beispiel 1: EMR auf EC2

Die Preisgestaltung basiert auf der Preisgestaltung für US-East-1.

Angenommen, Sie betreiben eine Amazon EMR-Anwendung, die auf Amazon EC2 bereitgestellt wird und dass Sie eine c4.2xlarge EC2-Instance als Hauptknoten und zwei c4.2xlarge EC2-Instances als Core-Knoten verwenden. Es werden sowohl für EMR- als auch für die EC2-Knoten Gebühren anfallen. Wenn sie zwei Monate lang mit voller Nutzung ausgeführt werden, und On-Demand-Preise für EC2 verwenden, lauten die Gebühren wie folgt:

Hauptknoten:

EMR-Gebühren = 1 Instance x 0,105 USD pro Stunde x (100 / 100 genutzt/Monat) x 730 Stunden in einem Monat = 76,65 USD (EMR-Hauptknoten-Gebühren) EC2-Gebühren = 1 Instance x 0,398 USD pro Stunde x 730 in einem Monat = 290,54 USD (EC2-Hauptknoten-Gebühren)

Core-Knoten:

EMR-Gebühren = 2 Instances x 0,105 USD pro Stunde x (100 / 100 genutzt/Monat) x 730 Stunden in einem Monat = 153,30 USD (EMR-Core-Knoten-Gebühren)

EC2-Gebühren = 2 Instances x 0,398 USD pro Stunde x 730 Stunden in einem Monat = 581,08 USD (EC2-Core-Knoten-Gebühren)

Gesamtgebühren = 76,65 USD + 290,54 USD + 153,30 USD + 581,08 USD = 1 101,57 USD

Beispiel 2: EMR auf EKS

Die Preisgestaltung basiert auf der Preisgestaltung für US-East-1.

Angenommen, Sie betreiben eine Amazon-EMR-Spark-Anwendung, die auf Amazon EKS bereitgestellt wird. In diesem Fall bezieht EKS seine Rechenkapazität über r5.2xlarge EC2-Instances (8 vCPU, 64 GB RAM). Nehmen wir an, dass der EKS-Cluster über 100 Knoten mit insgesamt 800 vCPU und 6.400 GB Gesamtspeicher verfügt. Nehmen wir an, dass diese Anwendung 100 VCPUs und 300 GB Speicher für 30 Minuten nutzt.

Amazon-EMR-Uplift-Gesamtgebühren für die Aufgabe:

Gesamt-Uplift auf vCPU = (100 * 0,01012 USD * 0,5) = (Anzahl der vCPU * Rate pro vCPU-Stunden * Job-Laufzeit in Stunden) = 0,506 USD

Gesamter Uplift auf Speicher = ( 300 * 0,00111125 USD *0,5) = (genutzter Speicher * Rate pro GB-Stunde * Job-Laufzeit in Stunden) = 0,1667 USD

Gesamt-EMR-Uplift für die EMR-Aufgabe = 0,6727 USD

Weitere Kosten

Sie zahlen 0,10 USD pro Stunde für jeden Amazon EKS-Cluster, den Sie erstellen. Sie können einen einzelnen Amazon EKS-Cluster für die Ausführung verschiedener Anwendungen verwenden, wenn Sie von den Kubernetes-Namespaces und den IAM-Sicherheitsrichtlinien profitieren. Sie können EKS auf AWS entweder mit Amazon EC2 oder AWS Fargate ausführen.

Wenn Sie Amazon EC2 benutzen (einschließlich mit Amazon EKS verwalteter Knotengruppen), zahlen Sie für AWS-Ressourcen (z. B. EC2-Instances oder Amazon EBS Volumes), die Sie für den Betrieb Ihrer Kubernetes-Arbeitsknoten erstellen. Sie zahlen nur für das, was Sie tatsächlich nutzen. Es fallen weder Mindestgebühren noch Vorausleistungen an. Detaillierte Preisinformationen finden Sie auf der Preisseite für EC2.

Wenn Sie AWS Fargate benutzen, werden die Preise anhand der vCPU- und Arbeitsspeicherressourcen berechnet, die für die Zeitdauer des Container-Image-Downloads verwendet werden, bis der Amazon EKS-Pod beendet wird, aufgerundet auf die nächste Sekunde. Es wird immer mindestens 1 Minute berechnet. Detaillierte Preisinformationen finden Sie auf der Preisseite für AWS Fargate.

Beispiel 3: EMR Serverless

Nehmen wir an, sie übertragen einen Spark-Job an EMR Serverless. Nehmen wir an der Job ist so konfiguriert, dass er ein Minimum von 25 Workern nutzt und ein Maximum von 75 Workern, jeder von ihnen mit 4vCPU und 30 GB Arbeitsspeicher konfiguriert. Beachten Sie, dass kein zusätzlicher flüchtiger Speicher konfiguriert wurde. Wenn Ihr Job für 30 Minuten läuft und 25 Worker (oder 100 vCPU) nutzt und für 15 Minuten automatisch um weitere 50 Worker hochskaliert wurde (200 weitere vCPU):

Gesamte vCPU-Stundenkosten = (100 x 0,052624 USD x 0,5) + (200 x 0,052624 USD x 0,25) = (Anzahl der vCPU * Tarif pro vCPU-Stunden * Job-Laufzeit in Stunden) = 5,2624 USD

Gesamt GB-Stunden = (750 x 0,0057785 USD x 0,5) + (1500 x 0,0057785 USD x 0,25) = (Gesamter konfigurierter Arbeitsspeicher in GB x Tarif pro GB-Stunde x Job-Laufzeit in Stunden) = 4,333875 USD

EMR Serverless Gesamtkosten = 9,596275 USD

Zusätzliche Kosten: Wenn Ihre Anwendung andere AWS-Services, wie zum Beispiel Amazon S3, verwendet hat, werden Ihnen hierfür die Standard-S3-Tarife berechnet.

Beispiel 4: EMR WAL

Angenommen, Sie erstellen einen neuen Amazon-EMR-Cluster mit Apache HBase und entscheiden sich für die vollständige Sicherung Ihres Clusters in der Region USA Ost (Nord-Virginia). Da es sich um eine neue Anwendung handelt, wissen Sie nicht, wie der Datenverkehr sich verhalten wird. Nehmen Sie der Einfachheit halber an, dass Ihr Benutzer 10 HBase-Tabellen einschließlich Systemtabellen und 2 HBase-Regionen pro Tabelle erstellt hat und dass diese jedes Mal, wenn ein Benutzer mit Ihrer Anwendung interagiert, 1 KiB an Daten schreiben.

Für einen Zeitraum von 10 Tagen erhalten Sie nur wenig Datenverkehr zu Ihrer Anwendung, was zu 10 000 Schreibvorgängen pro Tag führt. An 11. Tag jedoch steigt der Datenverkehr Ihrer Anwendung auf 2 500 000 Schreibvorgänge an diesem Tag. Sie entscheiden sich auch dafür, gleichzeitig Ihren benutzerdefinierten Code auf Ihrem Cluster zu aktualisieren und am 11. Tag eine geplante nächtliche Ausfallzeit für Ihre Endbenutzer einzulegen. Gehen wir davon aus, dass dies zu 1 000 000 Lesevorgängen aus der EMR WAL für HBase-Wiederherstellungsvorgänge führt. Ihre Anwendung skaliert, um Ihren Benutzern ein nahtloses Erlebnis zu bieten. Bis zum Ende des Monats stellt sich für Ihre Anwendung dann ein gleichmäßigeres Datenverkehrsmuster von 50 000 Schreibvorgängen pro Tag ein.

Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

Zeitrahmen – (Tag des Monats)	Gesamtsumme Schreibvorgänge	Gesamtsumme Lesevorgänge	EMR-WAL-Nutzung
1–10	100 000 Schreibvorgänge (10 000 Schreibvorgänge x 10 Tage)
11	2 500 000 Schreibvorgänge	1 000 000 Lesevorgänge
12–30	950 000 Schreibvorgänge (50 000 Schreibvorgänge x 19 Tage)
Gesamtsumme Monat	3 550 000 Schreibvorgänge	1 000 000 Lesevorgänge
Monatsrechnung	0,30 USD (0,0883 USD pro GiB an EMR-WAL-Schreibanfragen x 3,55 Millionen KiB-Schreibvorgänge/1 048 576 KiB/GiB)	0,08 USD (0,0883 USD pro GiB an EMR-WAL-Leseanfragen x 1 Million KiB-Lesevorgänge/1 048 576 KiB/GiB)	25,92 USD (0,0018 USD pro WAL pro Stunde EMR-WAL-Nutzung x Nutzung von 10 HBase-Tabellen x 2 HBase-Regionen pro HBase-Tabelle x 1 WAL pro HBase-Region x 30 Tage x 24 Stunden oder Nutzung von 14 400 EMR-WAL-WALHours)

Für den Monat beläuft sich Ihre Rechnung auf 26,52 USD, was insgesamt 0,38 USD für WriteRequestGiB und WriteRequestGiB sowie 25,92 USD für EMR-WAL-WALHours beinhaltet.

Weitere Ressourcen zur Preiskalkulation

AWS-Preisrechner

Berechnen Sie Ihre monatlichen Nutzungskosten für AWS auf einfache Art und Weise

Erhalten Sie Unterstützung bei der Preisberechnung

Kontaktieren Sie AWS-Spezialisten, um ein personalisiertes Angebot zu erhalten

Informationen zu den ersten Schritten

Besuchen Sie die Amazon EMR-Einstiegsseite

Weitere Informationen

Für ein kostenloses Konto registrieren

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent.

Registrieren

Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit dem Erstellen mit Amazon EMR in der AWS-Managementkonsole.

Anmelden

Wählen Sie Ihre Cookie-Einstellungen aus

Amazon EMR – Preise

Warum EMR?

AWS Pricing Calculator

Amazon EMR auf Amazon EC2

Amazon EMR in Amazon EKS

Amazon EMR auf AWS Outposts

Amazon EMR Serverless

Amazon EMR WAL