Warum Amazon-EC2-Trn1-Instances?
Amazon Elastic Compute Cloud (EC2)-Trn1-Instances, die von AWS-Trainium-Chips unterstützt werden, wurden speziell für das leistungsstarke Deep Learning (DL)-Training generativer KI-Modelle, einschließlich großer Sprachmodelle (LLMs) und latenter Diffusionsmodelle, entwickelt. Trn1-Instances bieten Einsparungen von bis zu 50 % der Kosten gegenüber anderen vergleichbaren Amazon-EC2-Instances. Sie können Trn1-Instances verwenden, um mehr als 100 B Parameter-DL- und generative KI-Modelle für eine Vielzahl von Anwendungen wie Textzusammenfassung, Codegenerierung, Fragenbeantwortung, Bild- und Videogenerierung, Empfehlungen und Betrugserkennung zu trainieren.
Das AWS-Neuron-SDK hilft Entwicklern, Modelle auf AWS Trainium zu trainieren und Modelle auf AWS-Inferentia-Chips bereitzustellen. Es lässt sich nativ in Frameworks wie PyTorch und TensorFlow integrieren, sodass Sie Ihren vorhandenen Code und Ihre Workflows weiterhin verwenden können, um Modelle auf Trn1-Instances zu trainieren. Informationen zur aktuellen Neuron-Unterstützung für Frameworks und Bibliotheken für Machine Learning (ML), Modellarchitekturen und Hardwareoptimierungen finden Sie in der Neuron-Dokumentation.
Einführung von Amazon-EC2-Trn1-Instances, die von AWS Trainium unterstützt werden
Vorteile
Funktionen
Empfehlungen von Kunden und Partnern
Hier sind einige Beispiele dafür, wie Kunden und Partner ihre Geschäftsziele mit Amazon-EC2-Trn1-Instances erreicht haben.
-
Databricks
Mehr als 10 000 Unternehmen weltweit - darunter Comcast, Condé Nast und über 50 % der Fortune 500 - vertrauen auf die Databricks, um ihre Daten, Analysen und KI zu vereinheitlichen.
-
Stockmark Co., Ltd
Mit dem Ziel, „den Mechanismus der Wertschöpfung neu zu erfinden und die Menschheit voranzubringen“, unterstützt Stockmark viele Unternehmen bei der Gründung und dem Aufbau innovativer Unternehmen, indem es modernste Technologie zur Verarbeitung natürlicher Sprache bereitstellt.
-
RICOH
RICOH bietet Arbeitsplatzlösungen und Dienstleistungen für die digitale Transformation an, um den Informationsfluss in Unternehmen zu verwalten und zu optimieren.
-
HeliXon
-
Money Forward, Inc.
Money Forward, Inc. bietet Unternehmen und Privatpersonen eine offene und faire Finanzplattform.
-
Magic
Magic ist ein integriertes Produkt- und Forschungsunternehmen, das KI entwickelt und sich wie ein Kollege anfühlt, der die Welt produktiver macht.
-
Cactus Communications
CACTUS bietet eine Reihe von Produkten und Lösungen für Forscher und Organisationen, die die Art und Weise verbessern, wie Forschung finanziert, veröffentlicht, kommuniziert und entdeckt wird.
-
Watashiha
Watashiha bietet einen innovativen und interaktiven KI-Chatbot-Service, „OGIRI AI“, an, der Humor beinhaltet, um auf eine Frage sofort eine lustige Antwort zu geben.
-
PyTorch
-
Hugging Face
-
Amazon
Erste Schritte
Produktdetails
Instance-Größe | Trainium-Chips |
Beschleuniger Arbeitsspeicher (GB) |
vCPUs | Instance Arbeitsspeicher (GiB) |
Lokal NVMe Speicher (TB) |
Netzwerk Bandbreite (Gbit/s) |
EFA und RDMA Support |
EBS Bandbreite (Gbit/s) |
On-Demand Preis pro Stunde |
1 Jahr Reserved Instance Wirksam Stündlich* |
3 Jahre Reserved Instance Wirksam Stündlich* |
trn1.2xlarge | 1 | 32 | 8 | 32 | 0,5 | Bis zu 12,5 | Nein | Bis zu 20 | 1,34 USD | 0,79 USD | 0,4744 USD |
trn1.32xlarge | 16 | 512 | 128 | 512 | 8 | 800 | Ja | 80 | 21,50 USD | 12,60 USD | 7,59 USD |
trn1n.32xlarge |
16 | 512 | 128 | 512 | 8 | 1 600 | Ja | 80 | 24,78 USD | 14,52 USD | 8,59 USD |