ProdukteMachine LearningAWS HealthOmics › AWS HealthOmics – Preise

 

 

Übersicht

AWS HealthOmics unterstützt Kunden dabei, wissenschaftliche Durchbrüche mit einer vollständig verwalteten Infrastruktur für Bioinformatik und Wirkstoffforschung zu beschleunigen, die darauf ausgelegt ist, Workflows und Speicher in großem Umfang abzuwickeln. Mit HealthOmics zahlen Sie nur für das, was Sie nutzen, und es fallen keine HealthOmics-Lizenzkosten an.

HealthOmics bietet zwei Arten von Workflows. Private Workflows sind benutzerdefinierte Workflows, die es Ihnen ermöglichen, Ihre eigenen Bioinformatik-Skripte mitzubringen, die in den am häufigsten verwendeten Workflow-Sprachen geschrieben sind. Die Preise für private Workflows basieren auf den Rechen- und Dateisystemressourcen, die für jede Ausführung angefordert werden. Ready2Run-Workflows sind vorgefertigte Bioinformatik-Pipelines, die auf gängigen Branchenanalysen basieren. Sie zahlen einen festen Preis pro Ausführung.

HealthOmics bietet zwei Arten von Speichern an. Referenz- und Sequenzspeicher sind Datenspeicher für Objekte, die Tiering, Komprimierung und Metadatenkatalogisierung verwenden, um eine kostengünstige Speicherung und Organisation von Bioinformatik-Daten zu ermöglichen. Die Preisgestaltung basiert auf der gespeicherten Objektgröße und der Datenebene. Varianten- und Annotationsspeicher sind Null-ETL-Speicher, die Schlüsseldaten aus Bioinformatik-Daten extrahieren, um einen Data Lake zu erstellen, der für die Suche und Kohortenerstellung optimiert ist. Die Preisgestaltung basiert auf der Speichergröße der extrahierten Informationen.

Sie können Workflows und Datenspeicher je nach Bedarf zusammen oder getrennt verwenden. Wenn Sie bereit sind, eine Nutzungsvereinbarung für drei oder fünf Jahre einzugehen, kontaktieren Sie uns bitte für ermäßigte Preise.

Preise nach Typ erkunden

Mit AWS HealthOmics zahlen Sie nur für das, was Sie nutzen. Erkunden Sie unten die Preise nach Typen.

Kostenloses Kontingent

Im Rahmen des kostenlosen AWS-Kontingents können Sie AWS HealthOmics zum Einstieg kostenlos verwenden. Bei der Registrierung erhalten AWS-Neukunden bis zu 275 omics.m.xlarge (oder gleichwertig) Instance-Stunden und 49 000 Gigabyte-Stunden Ausführungsspeicher für die Ausführung privater Workflows, 1 500 Gigabase-Monate aktiven Speicher und Archivspeicher im Sequenzspeicher sowie 200 Gigabyte-Monate Speicher im Variantenspeicher. Ihre Nutzung des kostenlosen Kontingents wird jeden Monat für alle Regionen (außer der AWS-GovCloud-Regionen) berechnet und automatisch auf die Rechnung angewandt. Nicht genutzter monatlicher Verbrauch wird nicht übertragen. Es gelten Einschränkungen, weitere Informationen finden Sie in den Angebotsbedingungen.

 

Nutzung eines kostenlosen Kontingents pro Monat für die ersten 2 Monate

AWS-HealthOmics-Workflows

Private Workflows: 275 omics.m.xlarge-Instance-Stunden oder gleichwertige Datenverarbeitungs-Instances und 49 000 GB-Stunden Ausführungsspeicher

Healthomics-Datenspeicher Sequenzspeicher: 1 500 Gigabase-Monate in der aktiven Speicherklasse und 1 500 Gigabase-Monate in der Archivspeicherklasse

Variantenspeicher: 200 Gigabyte-Monate

AWS-Kunden erhalten jeden Monat 100 GB ausgehende Datenübertragung in das Internet, die für alle AWS-Services und -Regionen (außer China und GovCloud) gilt.

Preise für private Workflows

Private Workflows sind benutzerdefinierte Workflows, die Sie auf der Grundlage Ihrer bevorzugten Workflow-Sprache für den Betrieb von Bioinformatik- oder Arzneimittelforschungs-Pipelines definieren. Es fallen zwei Komponenten an: Workflow-Task-Instances und Ausführungsspeicher.

Die Omics-Instance, die für jede Aufgabe in Ihrem Workflow verwendet wird, wird Ihnen in Rechnung gestellt. Jede Aufgabe in Ihrem Workflow wird der kleinsten verfügbaren Omics-Instance zugeordnet, die die für die Aufgabe angeforderten vCPUs, Speicher und/oder GPUs erfüllt. So wird beispielsweise eine Aufgabe, die für die Verwendung von 8 CPUs und 60 GB RAM definiert ist, für die Ausführung dem Instance-Typ omics.r.2xlarge zugeordnet. Healthomics stellt immer genau die angeforderten Ressourcen zur Verfügung. In diesem Beispiel stehen 8 CPUs und 60 GiB RAM für die Aufgabe zur Verfügung. Aufgaben werden in Schritten von 1 Sekunde in Rechnung gestellt. Es gibt jedoch einen Mindestschwellenwert für die Abrechnung von 60 Sekunden pro Aufgabe. Falls Sie keine vCPUs oder keinen Arbeitsspeicher für eine Aufgabe angeben, stellt Healthomics automatisch den kleinsten verfügbaren Instance-Typ, omics.c.large, für diese Aufgaben bereit. Außerdem werden Ihnen keine Kosten für die mit der Datenbereitstellung verbundene Datenverarbeitung (d. h. Importe und Exporte) in Rechnung gestellt und es fallen keine AZ-übergreifenden Gebühren an.

Für Ausführungsspeicher können Sie ein statistisch bereitgestelltes Dateisystem mit höherem Dateisystemdurchsatz wählen, oder ein Dateisystem, das dynamisch skaliert. Statischer Ausführungsspeicher ist in den folgenden Größen verfügbar: 1 200 GiB, 2 400 GiB und danach in Schritten von 2 400 GiB, wobei die bereitgestellte Mindestgröße 1 200 GiB beträgt. Dynamischer Ausführungsspeicher skaliert mit der Nutzung und erfordert keine Mindestanforderung an die Speicherbereitstellung.

Es werden Ihnen nur Ressourcen in Rechnung gestellt, solange sich die Ausführung im Status wird ausgeführt befindet. Für Ausführungen im Status „ausstehend“, „starten“ oder „beenden“ fallen keine Gebühren an. Bei abgebrochenen oder fehlgeschlagenen Ausführungen werden Ihnen alle Ressourcen in Rechnung gestellt, die bis zum Zeitpunkt des Abbruchs oder des Fehlers verbraucht wurden.

Sie können Ihre Gesamtkosten für jede Ausführung auf Ihrer AWS-Rechnung einsehen, sodass Sie Ihre Kosten schnell und einfach ermitteln können. HealthOmics bietet auch ein Open-Source-Tool zur Ausführungsanalyse, mit dem Sie Betriebsressourcen, Kosten und Leistung optimieren können. Wenn Sie Produktionsabläufe in großem Maßstab ausführen möchten und bereit sind, eine Nutzungsdauer von drei oder fünf Jahren einzugehen, kontaktieren Sie uns bitte für ermäßigte Preise.

 

Ready2Run-Workflows – Preise

Ready2Run-Workflows sind vorkonfigurierte Workflows, die von branchenführenden Drittanbieter-Softwareunternehmen wie NVIDIA, Sentieon, Element Biosciences und Ultima zusammen mit gängigen Open-Source-Pipelines wie den GATK-Workflows des Broad Institute und AlphaFold zur Vorhersage der Proteinstruktur entwickelt wurden. Sie können einfach Ready2Run-Workflows verwenden, um Ihre Daten zu verarbeiten, ohne die Software-Tools oder Workflow-Skripts verwalten zu müssen. Ready2Run-Workflows werden pro Ausführung verrechnet, und Ihnen wird dieselbe Pauschalgebühr berechnet, wenn die Ausführungen erfolgreich abgeschlossen werden, unabhängig von der Laufzeit. Wenn die Ausführung abgebrochen wird oder nicht innerhalb der ersten Stunde erfolgreich abgeschlossen werden kann, wird die Gebühr pro Ausführung auf der Grundlage der ersten Nutzungsstunde anteilig berechnet. Ausführungen, die länger als 1 Stunde dauern, werden mit dem vollen Preis der Ausführung in Rechnung gestellt. Für Sentieon-Ready2Run-Workflows ist ein separates Abonnement erforderlich, das bei Sentieon gekauft wurde. Ein kostenloses zweiwöchiges Testabonnement wird von Sentieon automatisch ohne zusätzliche Kosten für Erstbenutzer von Sentieon Ready2Run zur Verfügung gestellt. Detaillierte Informationen zu den verfügbaren Ready2Run-Workflows, einschließlich Eingabeparametern, Workflow-Diagrammen und geschätzten Laufzeiten, finden Sie in der HealthOmics-Konsole.

Preise für Datenspeicher

Die HealthOmics-Datenspeicher sind verwaltete, auffindbare, zugängliche, interoperable und wiederverwendbare (FAIR) Speicher für umfangreiche Probendaten mit automatischer Datenkomprimierung und optimierter Varianten-/Annotationsabfragbarkeit.

Der Sequenzspeicher sorgt durch nutzungsorientiertes Tiering und Komprimierung für Kosteneinsparungen. Gespeicherte Objekte sind aus Gründen der Organisation und Auffindbarkeit unter Lesesätzen gruppiert. Wenn Sie Daten im Sequenzspeicher speichern, zahlen Sie pro Gigabase pro Monat. Eine Gigabase ist eine Milliarde Basen aus Ihren importierten Sequenzdateien (wie FASTQ, BAM und CRAM). Sie zahlen pro gespeicherter Gigabase, sodass Sie sich keine Gedanken über optimale Dateiformate oder Komprimierungstechniken machen müssen. AWS HealthOmics optimiert dies für Sie. Auf Daten im Sequenzspeicher kann auf zwei Arten zugegriffen werden: 1/ Durch Lesen, Schreiben und Aktualisieren von Healthomics-APIs und durch Lesen über S3-APIs. Für den Zugriff über HealthOmics-APIs zahlen Sie für GET-Anfragen an Ihre Lesesatzobjekte. Alle anderen HealthOmics-Anfragetypen in Lesesätzen sind kostenlos. 2/ Über S3 APIs auflisten und abrufen. Für den Zugriff über S3-APIs werden COPY- und LIST-Anfragen getrennt von allen anderen Anforderungstypen in Rechnung gestellt. In unserem Blog erfahren Sie, wie die Kosten für den Healthomics-Sequenzspeicher im Vergleich zu alternativen Speicheroptionen abschneiden: https://aws.amazon.com/blogs/industries/store-omics-data-cost-effectively-at-any-scale-with-aws-healthomics/

Die Varianten- und Annotationsspeicher verwenden Zero-ETL, um Varianten- und Annotationsdaten für Abfragen, Kohortierungen und Analysen mit AWS-Services wie Amazon Athena und Amazon SageMaker vorzubereiten. Eingesetzte Dateien werden von HealthOmics verarbeitet und in abfrageoptimierte Formate umgewandelt. Sie können eine beliebige Menge an Varianten- und Annotationsdaten speichern und zahlen nur für das, was gespeichert wird. Die in Rechnung gestellte Datengröße ist definiert als die Größe der Daten nach der Aufnahme und Transformation. Auf die Daten im Varianten- und Annotationsspeicher wird in der Regel über andere AWS-Services zugegriffen. Wenn Sie jedoch die Daten in anderen Services abfragen und analysieren, zahlen Sie für die Nutzung dieser Services.

Die Analytik-Daten von AWS-HealthOmics werden für eine Mindestspeicherdauer von 30 Tagen berechnet. Für Daten, die vor Ablauf von 30 Tagen gelöscht werden, fällt eine anteilige Gebühr in Höhe der Speichergebühr für die verbleibenden Tage an. 

Preisbeispiele

  • Eine Bioinformatikerin möchte einen Nextflow-Workflow in AWS-HealthOmics-Workflows in der Region USA Ost (Nord-Virginia) ausführen. Sie hat drei Aufgaben im Workflow. Der erste reserviert 16 vCPUs und 30 GB Speicher und benötigt 3 Stunden für die Ausführung. Der zweite benötigt 32 vCPUs und 160 GB Speicher und seine Ausführung dauert 2 Stunden. Die dritte reserviert 4 vCPU und 10 GB Speicher und seine Ausführung dauert 10 Minuten. Der Kunde registriert den Workflow und ruft die StartRun-API mit dem Standard-Dateisystem von 1 200 GB auf. Ihre Gesamtkosten betragen:
    Aufgabe 1 (omics.c.4xlarge): 0,9180 USD/Std. x 3 Std. = 2,754 USD
    Aufgabe 2 (omics.r.8xlarge): 2,7216 USD/Std. x 2 Std. = 5,4432 USD
    Aufgabe 3 (omics.m.xlarge): 0,2592 USD/Std.) x 1/6 Std.) = 0,0432 USD
    Statischer Ausführungsspeicher: 0,0001918 USD/GB-Stunde x (1 200 GB x (3 Std. + 2 Std. + 1/6 Std.)) = 1,18916 USD
    Gesamt: 9,42956 USD

  • Ein Bioinformatiker entwickelt einen neuen WDL-Workflow in AWS HealthOmics in der Region USA Ost (Nord-Virginia). Sie hat zwei Aufgaben im Workflow. Die erste reserviert 16 vCPUs und 30 GB Arbeitsspeicher und benötigt 3,5 Stunden zur Ausführung. Die zweite erfordert 32 vCPUs und 160 GB Arbeitsspeicher und dauert 2,25 Stunden. Der Kunde registriert den Workflow und ruft die StartRun-API mit dem dynamischen Dateisystem auf. Im Laufe der 5,75-stündigen Workflow-Ausführung wächst das Dateisystem linear von 0 GB auf 1 043 GB, was einem Dateispeicher von insgesamt 3 000 GB/Std. entspricht. Ihre Gesamtkosten betragen:
    Aufgabe 1 (omics.c.4xlarge): 0,9180 USD/Std. x 3,5 Std. = 3,213 USD
    Aufgabe 2 (omics.r.8xlarge): 2,7216 USD/Std. x 2,25 Std. = 6,1236 USD
    Dynamischer Ausführungsspeicher: 0,0004110 USD/GB-Stunde x 3 000 GB-Stunden = 1,233 USD
    Gesamt: 10,5696 USD

  • Ein Informatiker möchte den GATK-BP Germline fq2vcf für den 30-fachen Genom-Ready2Run-Workflow in der Region USA Ost (Nord-Virginia) für 3 Proben ausführen. Der Kunde gibt seine Daten ein und ruft die StartRun-API für jedes Beispiel auf. Die Kosten für die 3 Ausführungen betragen:
    GATK-BP Germline fq2vcf für 30 genome Ready2Run-Workflow: 10,00 USD/Ausführung x 3 = 30,00 USD
    Insgesamt: 30,00 USD

  • Eine Initiative zur Sequenzierung der Population beginnt mit der Sequenzierung von Individuen aus einer Biobank, für die Daten erfasst wurden. Sie wählten dafür die Region EU West (Irland). Sie sequenzieren 100 000 Individuen mit jeweils 130 Gigabasen, 50 Gigabyte, und speichern die Rohdaten der Sequenzierung im AWS-HealthOmics-Speicher. In den nächsten 5 Jahren verbleiben sie nach den 30 Tagen nach dem Import in der Archivspeicherklasse und werden im Durchschnitt zweimal aufgerufen, wobei sie 30 Tage lang in die aktive Speicherklasse wechseln. Sie verwenden S3-APIs für den Zugriff auf die Dateien. Jedes Genom wird in 500 Teilen heruntergeladen, was 500 GET-API-Aufrufe erzeugt. Die Gesamtkosten über fünf Jahre für ein einzelnes Genom betragen:
    Aktivspeicherklasse: 0,005769 USD Gigabase/Monat x 130 Gigabases x 90 Tage = 2,22 USD
    Archivspeicherklasse: 0,001154 USD Gigabase/Monat x 130 Gigabases x (1825 - 90) Tage = 8,56 USD.
    S3-GET-APIs: 0,0004 USD/1 000 API-Aufrufe x (2 x 500 API-Aufrufe) = 0,0004 USD
    Gesamtkosten über 5 Jahre: 2,22 USD + 8,56 USD + 0,0004 USD = 10,78 USD (oder 2,15 USD/Jahr)

  • Ein Datenwissenschaftler hat 3 202 Variant Call Format (VCF)-Dateien, die er in Amazon Athena in der Region USA Ost (Nord-Virginia) analysieren möchte. Er erstellt einen Variantenspeicher und nimmt diese Dateien über die Amazon-HealthOmics-APIs auf. Die aufgenommenen Daten sind 1,5 TB groß. Im Laufe des nächsten Monats führt er 1 000 Abfragen in Athena aus, um Allelhäufigkeiten für verschiedene Unterpopulationen zu berechnen, wobei jede im Durchschnitt 50 GB verbraucht. Seine monatlichen Gesamtkosten betragen:
    Variantenspeicher: 0,035 GB/Monat x (1 024 GB/TB x 1,5 TB) = 53,76 USD
    Amazon Athena: 5 USD/TB x 1 000 x 50 / 1 024 = 244,14 USD

Datenübertragungspreise

Sie zahlen für die gesamte Bandbreite aus HealthOmics. Datenübertragungsgebühren fallen nicht für Daten an, die an AWS-Services innerhalb derselben AWS-Region wie der Datenspeicher übertragen werden. Die folgenden Preise basieren auf bei AWS HealthOmics ein- und ausgehenden Datenübertragungen (über das öffentliche Internet)†††. Erfahren Sie mehr über Preise für AWS Direct Connect. Für Datenübertragungen von mehr als 500 TB/Monat wenden Sie sich bitte an uns.

Die Preiskontingente gelten für Ihre gesamte ausgehende Datenübertragung in das Internet aus allen AWS-Services.

††† Ausgehende Datenübertragungen können sich von den Daten unterscheiden, die Ihre Anwendung empfängt, falls Sie die Verbindung vorzeitig beenden. Beispiel: Sie fordern ein Objekt mit 10 GB an und beenden die Verbindung, nachdem die ersten 2 GB der Daten empfangen wurden. AWS HealthOmics versucht das Streaming von Daten zu stoppen. Dies geschieht jedoch nicht sofort. In diesem Beispiel kann die ausgehende Datenübertragung also 3 GB betragen (1 GB mehr als die empfangenen 2 GB). Daher werden Ihnen in diesem Fall für die ausgehende Datenübertragung 3 GB in Rechnung gestellt.