Von den Proben zu den Antworten mit Illumina und AWS

2021

In den letzten zehn Jahren hat sich die Genomik von einem Spezialgebiet der Forschung zu einem leistungsfähigen klinischen Instrument entwickelt, das eine neue Ära des patientenorientierten Gesundheitswesens eingeleitet hat. Die Genomsequenzierung und -analyse sind einfacher, billiger und umfassender geworden, so dass es nun für Kliniker realistisch ist, Gentests für einzelne Patienten anzuordnen, und für Forscher, Tausende von Proben zu untersuchen, um Zusammenhänge zwischen genetischen Variationen und menschlichen Krankheiten herzustellen. Während die Sequenzierung des ersten menschlichen Genoms Jahrzehnte in Anspruch nahm, können Wissenschaftler heute ein ganzes menschliches Genom in weniger als 24 Stunden effizient sequenzieren.

Illumina hat es sich zur Aufgabe gemacht, die Genomik zu nutzen, um die menschliche Gesundheit zu verbessern. Als AWS-Partner hat das Unternehmen den technologischen Fortschritt in der Genomik gefördert, indem es sich von einem Anbieter von Sequenzierungsinstrumenten zu einem Komplettanbieter von Genomiklösungen entwickelt hat und seit 2013 Softwarelösungen in Amazon Web Services (AWS) bereitstellt. Die von AWS unterstützten Softwarelösungen von Illumina senken die Einstiegshürden und helfen Forschern, jeden Tag neue Entdeckungen zu machen, die die Arzneimittelforschung und vieles mehr fördern.

„Die Genomikindustrie expandiert in alle Richtungen, von direkten Konsumententests bis hin zu personalisierten Krebsimpfstoffen“, erklärt Susan Tousi, Chief Commercial Officer von Illumina. „Illumina hat sich zum Ziel gesetzt, den Zugriff auf Genomik-Technologien rund um die Welt zu demokratisieren. Wir haben von Anfang an mit AWS zusammengearbeitet, um unseren Kunden die Antworten zu geben, die sie brauchen. In den letzten zehn Jahren haben wir unser in AWS verfügbares Softwareportfolio erweitert, um eine nahtlose, ganzheitliche Suite von Lösungen anzubieten, die sofort bereitgestellt oder an spezifische Anforderungen angepasst werden können.“

Virtuelles AWS-Symposium für das Gesundheitswesen und Biowissenschaften 2021: Illumina
kr_quotemark

Wir liefern einen kompletten Workflow – von der Probenvorbereitung bis zur Tertiäranalyse – in der sicheren AWS-Umgebung. Mit diesem Workflow können alle vor und nach der Sequenzierung generierten Informationen aggregiert und analysiert werden.“

Rami Mehio
Vice President of Bioinformatics and Instrument Software, Illumina

Ein vollständiger Workflow für die Genomik der nächsten Generation beginnt mit der Entnahme, Aufbereitung und Sequenzierung der Probe – das ist aber nur der Anfang. Danach folgt die schwere bioinformatische Arbeit, die mit der Qualitätskontrolle der Rohdaten, der Datenvorverarbeitung und der Ausrichtung beginnt. Wissenschaftler können dann Sekundäranalysen wie Variantenaufrufe durchführen und schließlich fortgeschrittene Tertiäranalysen je nach ihren Interessen durchführen. Diese tertiären Analysen können phylogenetische Annotation, Genotyp-Phänotyp-Assoziationen und vieles mehr umfassen. Für Forscher und Kliniker, die keine Bioinformatik-Experten sind, kann die Durchführung jedes einzelnen Schritts auf einer separaten Plattform schnell überfordernd werden.

Illumina rationalisiert diesen gesamten genomischen Workflow für seine Kunden und bietet integrierte Lösungen für jeden Schritt. BaseSpace TM Clarity LIMS (Laboratory Information Management Systems) unterstützt Genomik-Kunden von Anfang an bei der Verfolgung von Proben und der Optimierung von Sequenzierungs-Workflows. Sequenziergeräte können Daten direkt in die Illumina Connected Analytics (ICA)-Plattform hochladen, wo Benutzer Datensätze verwalten und Analysetools innerhalb der Plattform in AWS nutzen können. Die DRAGEN TM Bio-IT-Plattform liefert genaue, ultraschnelle Sekundäranalyseergebnisse. Gleichzeitig integriert die BaseSpace Correlation Engine die Datensätze und Abfragen von Einzelpersonen in ein Repository mit frei zugänglichen und kontrolliert zugänglichen öffentlichen Datensätzen, um eine Vielzahl von Tertiäranalysen zu ermöglichen.

Die Daten für diese Plattformen werden auf Amazon Simple Storage Service (Amazon S3) gespeichert, einem skalierbaren Objektspeicher-Service. Illumina-Kunden können ihre Analysen mit DRAGEN auf Amazon Elastic Compute Cloud (Amazon EC2), einem Webservice, der sichere, anpassbare Computing-Kapazitäten in der Cloud bereitstellt, erheblich beschleunigen.

„Wir liefern einen kompletten Workflow – von der Probenvorbereitung bis zur Tertiäranalyse – in der sicheren AWS-Umgebung. Durch diesen Workflow können alle vor und nach der Sequenzierung generierten Informationen zu aggregiert und zu analysiert werden“, erklärt Rami Mehio, Vice President of Software and Bioinformatics bei Illumina. „Das ist sehr hilfreich für Kunden, die Proben über einen längeren Zeitraum verfolgen, ihre Daten mit öffentlich zugänglichen Datenbanken abgleichen und Erkenntnisse für schnellere Ergebnisse gewinnen wollen.“

Während fortgeschrittene Benutzer die Möglichkeit haben, Tools wie ICA und DRAGEN an ihre Bedürfnisse anzupassen, um Nischenforschung zu betreiben, bietet Illumina auch End-to-End-Cloud-Lösungen mit sofort einsatzbereiten Funktionen für spezielle Zwecke an. Dazu gehören die TruSight TM Software Suite, eine Softwarelösung für die Variantenanalyse zur Aufdeckung seltener Krankheitseinblicke, und TruSight Oncology 500, ein fein abgestimmter Sequenzierungstest zur Analyse von Tumoren und zur Identifizierung von Biomarkern für die Immunonkologie.

„Wir verwenden die starken AWS-Tools als Rückgrat, was uns erlaubt, uns auf die Entwicklung genomikspezifischer Algorithmen zu konzentrieren“, sagt Mehio. „Wenn sich die Bedürfnisse von Forschern und Klinikern ändern, können wir problemlos neue Funktionen und Versionen unserer Produkte bereitstellen.“

Kostenreduzierung durch Einsparungen in AWS

Seit seiner Gründung hat Illumina die Kosten der Genomiktechnologie in einem Tempo gesenkt, das über dem Mooreschen Gesetz liegt. Im Jahr 2001 kostete die Sequenzierung eines einzigen menschlichen Genoms über 100 Millionen USD; 20 Jahre später kostet sie nur noch 600 USD.

„Wir wollen den Zugriff auf Genomik-Technologien demokratisieren; die Weitergabe von Kosteneinsparungen an unsere Kunden ist ein wichtiger Teil dieser Bemühungen“, sagt Tousi. „Die Kosten sollten kein entscheidender Faktor für Forschung oder klinische Anwendungen sein – die Sequenzierung und Analyse sollten ausschließlich nach der voraussichtlichen möglichen Verwendung der Daten durchgeführt werden.“

Die Amazon-S3-Speicherklassen können entsprechend den unterschiedlichen Datenanforderungen angepasst werden, was Illumina dabei hilft, für die maximale Kosteneinsparungen zu optimieren. Durch die Speicherung von Petabytes an Daten mit seltenem Zugriff in Amazon S3 Glacier Deep Archive sparen Illumina-Kunden über 90 Prozent der Speicherkosten. In ähnlicher Weise läuft DRAGEN auf F1-Instances von Amazon EC2, die erschwingliches, beschleunigtes Computing bieten, das die von Illumina benötigten parallelen Vorgänge unterstützen kann. F1-Instances bieten anpassbare Hardwarebeschleunigung mit Field-Programmable Gate Arrays (FPGAs) von DRAGEN. Zur Skalierung von DRAGEN über F1-Instances hinweg benutzte das Unternehmen AWS Batch, einen vollständig verwalteten Batch-Verarbeitungs-Service, der Workloads für Batch-Computing plant, programmiert und ausführt.

„AWS bietet uns verschiedene Optionen, um Geschwindigkeit, Flexibilität und Kosten zu optimieren und auf den Anwendungsfall und die Bedürfnisse des Endkunden einzugehen“, sagt Mehio. „Einige Benutzer möchten genetische Analysen so schnell wie möglich durchführen, während einige akademische Benutzer sich vielleicht dafür entscheiden, etwas Geschwindigkeit zu opfern, um dafür die Kosten zu senken und Forschungsgeld zu sparen. Durch den Einsatz verschiedener F1-Instance-Typen und Speicheroptionen bleiben unsere Benutzer flexibel und können je nach Bedarf hoch- und niederskalieren.“

Illumina senkt die Kosten für seine Kunden auch dadurch, dass viele Computing-Aufträge seiner Plattformen auf Spot-Instances von Amazon EC2 ausgeführt werden, die im Vergleich zu On-Demand-Preisen mit einem Rabatt von bis zu 90 Prozent erhältlich sind.  „Unsere Kunden haben allein im vergangenen Jahr Hunderttausende von Stunden mit Spot-Instances verwendet, was ihnen erhebliche Kosteneinsparungen beschert hat“, sagt Tousi.

Kosteneinsparungen und technische Vorteile können Hand in Hand gehen. Illumina hat vor kurzem die Tertiäranalyse Correlation Engine auf AWS migriert, um Kosten zu sparen und gleichzeitig die Dateneingabepipelines um das Sechsfache zu skalieren, damit die Wissensdatenbank schneller wächst und leistungsfähiger wird.

Sichere Lösungen für die Skalierung der globalen Genomik

Menschliche Genomdaten können mit sehr persönlichen Gesundheitsinformationen in Verbindung gebracht werden – deshalb stellen Datenschutzverletzungen für Organisationen des Gesundheitswesens weltweit ein immer größeres Risiko dar. Aus diesem Grund ist Sicherheit für Illumina und seine Kunden, von denen viele immer strengere Vorschriften zur Datenverwaltung einhalten müssen, von größter Bedeutung.

„Sicherheit steht bei uns an erster Stelle – sie ist für alle unsere Handlungen von zentraler Wichtigkeit“, sagt Tousi. „Wir können uns auf das AWS-Modell der geteilten Verantwortung verlassen – es stellt sicher, dass unsere grundlegende Cloud-Infrastruktur die Sicherheit und Compliance auf Unternehmensniveau aufrechterhält. Indem wir Amazon-EC2-Regionen global nutzen, können wir Computing und Daten kombinieren, Kunden in allen Regionen unterstützen und ihnen gleichzeitig erlauben, die Datenhoheit zu behalten.“

AWS unterstützt Tausende von Sicherheitsstandards und Compliance-Zertifizierungen, darunter HIPAA, DSGVO, ISO 27001 und ISO 13485, und hilft Kunden, Compliance-Anforderungen in ihren genomischen Workflows zu erfüllen. Illumina bietet seinen Kunden zusätzliche Sicherheit, indem es die Datenverwaltung in der Amazon Virtual Private Cloud (Amazon VPC) anbietet, die andere AWS-Ressourcen in einem logisch isolierten, benutzerdefinierten virtuellen Netzwerk launcht, das die Daten der verschiedenen Kunden voneinander trennt.

Diese globale Skalierbarkeit und Bereitstellung erleichtert eine sinnvolle Zusammenarbeit sowohl bei langfristigen Projekten als auch bei der schnellen Reaktion auf Krisen. Weltweit haben Forscher im Jahr 2020 und in der ersten Hälfte des Jahres 2021 mehr als 371 000 COVID-19-bezogene Proben mit den COVID-19 BaseSpace-Apps von Illumina verarbeitet. „Wenn unsere Kunden dies nur On-Premises tun gekönnt hätten, wären wir auf ernsthafte Einschränkungen gestoßen. Die Cloud war in diesem Fall tatsächlich der Schlüssel für die globale Pandemiebekämpfung auf dieser Ebene“, sagt Tousi.

Entwicklung der Zukunft der Genomik und der Biotechnologie

Mit der Entwicklung großer Populationsgenetik-Initiativen und dem zunehmenden Zugriff auf leistungsstarke Analysesoftwarelösungen wie ICA nutzt Illumina die Möglichkeiten von „Big Data“ in der Genomik, um Kunden bei der Gewinnung umfassender Erkenntnisse aus großen Mengen von Sequenzierdaten zu unterstützen. Diese Projekte werden eine neue Ära der personalisierten Genomik einleiten und es den Forschern ermöglichen, Zusammenhänge zwischen Genen und Gesundheitsergebnissen herzustellen, die bei kleineren Proben nicht erkennbar waren.

Illumina-Plattformen helfen der Forschung auch beim nahtlosen Übergang in eine multiautomatische Zukunft. Die cloudbasierte Single-Cell-RNA-Pipeline von DRAGEN beispielsweise erlaubt es Wissenschaftlern, die Genexpression in einzelnen Zellen zu annotieren. Mit der DRAGEN-Beschleunigung kann die Plattform drei Zellproben gleichzeitig und parallel in etwa 53 Minuten verarbeiten.

„Mit ICA, DRAGEN und anderen in AWS bereitgestellten Tools können wir Lösungen anbieten, mit denen Kunden beliebige Datentypen, einschließlich NGS- und Gesundheitsdaten, aggregieren können, um neue Informationen aus diesen großen Kohorten zu extrahieren und die menschliche Gesundheit in großem Maßstab zu verbessern“, sagt Mehio.

Weitere Informationen

Erfahren Sie, wie AWS andere führende biowissenschaftliche Organisationen in ihrem Bestreben unterstützt, die menschliche Gesundheit zu verbessern.   


Über Illumina

Illumina entwickelt, produziert und vermarktet integrierte Systeme für die Analyse genetischer Variationen und biologischer Funktionen.

Vorteile von AWS

  • Erleichterter Zugriff auf optimierte, vereinheitlichte, anpassbare Proben-zu-Analyse-Workflows
  • Drastisch reduzierte Computing- und Speicherkosten mit Spot-Instances von Amazon EC2 und Amazon S3 Glacier
  • Weltweite Bereitstellung eines robusten Portfolios von Genomiklösungen in einer sicheren und konformen Umgebung
  • Beschleunigte Forschung und geförderte Zusammenarbeit mit Kunden weltweit bei der Bearbeitung von über 371 000 COVID-19-Proben

Genutzte AWS-Services

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ist ein Web-Service, der sichere, skalierbare Rechenkapazitäten in der Cloud bereitstellt. Der Service ist darauf ausgelegt, Web-Scale-Cloud-Computing für Entwickler zu erleichtern.

Weitere Informationen »

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.


Weitere Informationen »

AWS Virtual Private Cloud

Amazon Virtual Private Cloud (Amazon VPC) ist ein Service, mit dem Sie AWS-Ressourcen in einem logisch isolierten virtuellen Netzwerk starten können, das Sie definieren.

Weitere Informationen »

Amazon EC2-Spot-Instances

Mit Amazon EC2 Spot-Instances können Sie die Vorteile nicht genutzter EC2-Kapazitäten in der AWS Cloud nutzen. Spot-Instances sind mit einem Rabatt von bis zu 90 % im Vergleich zum On-Demand-Preis verfügbar.

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in die AWS Cloud.