Định giá Amazon Bedrock

Tổng quan về giá cả

Amazon Bedrock là một dịch vụ được quản lý toàn phần cung cấp sự lựa chọn các mô hình nền tảng (FM) hiệu suất cao thông qua một API đơn lẻ, cùng với một loạt tính năng bạn cần để xây dựng các ứng dụng AI tạo sinh với khả năng bảo mật, quyền riêng tư và AI có trách nhiệm.

Khi sử dụng Amazon Bedrock, bạn sẽ bị tính phí suy luận và tùy chỉnh mô hình. Bạn có thể chọn trong số hai gói định giá dành cho suy luận: 1. Theo yêu cầu và hàng loạt: Chế độ này cho phép bạn sử dụng FM trên cơ sở thanh toán theo mức sử dụng mà không phải thực hiện bất kỳ cam kết thời hạn nào dựa trên thời gian. 2. Thông lượng cung cấp: Chế độ này cho phép bạn cung cấp đủ thông lượng để đáp ứng các yêu cầu về hiệu năng của ứng dụng thay cho cam kết thời hạn dựa trên thời gian.

Mô hình định giá

Theo yêu cầu và hàng loạt

Với chế độ Theo nhu cầu, bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết thời hạn dựa trên thời gian. Đối với các mô hình tạo văn bản, bạn bị tính phí cho mỗi token đầu vào được xử lý và mọi token đầu ra được tạo. Đối với các mô hình nhúng, bạn bị tính phí cho mỗi token đầu vào được xử lý. Một token bao gồm một vài ký tự và đề cập đến đơn vị văn bản cơ bản mà mô hình học để hiểu dữ liệu đầu vào và câu lệnh của người dùng. Đối với các mô hình tạo hình ảnh, bạn sẽ bị tính phí cho mỗi hình ảnh được tạo.

Suy luận liên khu vực: Chế độ Theo nhu cầu cũng hỗ trợ khả năng suy luận liên khu vực đối với một số mô hình. Chế độ này cho phép các nhà phát triển quản lý lưu lượng truy cập đột biến một cách liền mạch bằng cách sử dụng điện toán trên các Khu vực AWS khác nhau và đạt giới hạn thông lượng cao hơn cùng khả năng phục hồi nâng cao. Không tính thêm phí khi sử dụng suy luận liên khu vực và giá được tính dựa trên khu vực nơi bạn thực hiện yêu cầu (khu vực nguồn).

Với chế độ Hàng loạt, bạn có thể cung cấp tập hợp câu lệnh dưới dạng một tệp đầu vào duy nhất và nhận phản hồi dưới dạng một tệp đầu ra duy nhất, cho phép bạn thu thập cùng lúc các dự đoán quy mô lớn. Các phản hồi được xử lý và lưu trữ trong vùng lưu trữ Amazon S3 để bạn có thể truy cập chúng sau. Amazon Bedrock cung cấp các mô hình nền tảng (FM) được chọn lọc từ những nhà cung cấp AI hàng đầu như Anthropic, Meta, Mistral AI và Amazon để suy luận hàng loạt với mức giá thấp hơn 50% so với giá suy luận theo yêu cầu. Vui lòng tham khảo danh sách mô hình tại đây.

Tối ưu hóa độ trễ (Xem trước công khai)

Suy luận được tối ưu hóa độ trễ cho các mô hình nền tảng trong Amazon Bedrock mang lại thời gian phản hồi nhanh hơn cho các mô hình và giúp cải thiện khả năng phản hồi cho các ứng dụng AI tạo sinh của bạn. Bạn có thể sử dụng suy luận tối ưu hóa độ trễ cho mô hình Claude 3.5 Haiku của Anthropic và các mô hình Llama 3.1 405B và 70B của Meta. Theo xác minh của Anthropic, với suy luận tối ưu hóa độ trễ trên Amazon Bedrock, Claude 3.5 Haiku chạy nhanh hơn trên AWS so với bất kỳ nơi nào khác. Ngoài ra, với suy luận tối ưu hóa độ trễ trong Bedrock, Llama 3.1 405B và 70B chạy nhanh hơn trên AWS so với bất kỳ nhà cung cấp dịch vụ đám mây lớn nào khác. Tìm hiểu thêm tại đây.

Thông lượng cung cấp

Với chế độ Thông lượng được cung cấp, bạn có thể mua các đơn vị mô hình cho một mô hình cơ sở hoặc tùy chỉnh cụ thể. Chế độ Thông lượng được cung cấp được thiết kế chủ yếu cho khối lượng công việc suy luận nhất quán lớn cần thông lượng được đảm bảo. Các mô hình tùy chỉnh chỉ có thể được truy cập bằng Thông lượng được cung cấp. Một đơn vị mô hình cung cấp một thông lượng nhất định, được đo bằng số lượng token đầu vào hoặc đầu ra tối đa được xử lý trong mỗi phút. Với cách định giá Thông lượng được cung cấp, bạn bị tính phí theo giờ và có thể linh hoạt lựa chọn giữa các thời hạn cam kết 1 tháng hoặc 6 tháng.

Nhập mô hình tùy chỉnh

Tính năng Nhập mô hình tùy chỉnh cho phép bạn tận dụng các khoản đầu tư trước đây của mình vào tùy chỉnh mô hình trong Amazon Bedrock và sử dụng các mô hình này theo cách được quản lý toàn phần như với các mô hình nền tảng hiện được lưu trữ của Bedrock. Bạn có thể nhập trọng số tùy chỉnh cho các kiến trúc mô hình được hỗ trợ và cung cấp mô hình tùy chỉnh bằng chế độ Theo nhu cầu. Việc nhập mô hình tùy chỉnh vào Bedrock không phát sinh khoản phí nào. Khi bạn nhập một mô hình, bạn sẽ có thể truy cập mô hình đó theo nhu cầu mà không phải thực hiện bất kỳ hành động nào trong mặt phẳng điều khiển. Bạn chỉ bị tính phí cho suy luận mô hình, dựa trên số lượng bản sao mô hình tùy chỉnh cần thiết để phục vụ khối lượng suy luận của bạn và thời lượng hoạt động của mỗi bản sao mô hình, được tính phí theo khoảng thời gian 5 phút. Bản sao mô hình là một phiên bản duy nhất của một mô hình đã nhập và sẵn sàng phục vụ các yêu cầu suy luận. Giá cho mỗi bản sao mô hình mỗi phút phụ thuộc vào các yếu tố như kiến trúc, độ dài ngữ cảnh, Khu vực AWS, phiên bản đơn vị điện toán (thế hệ phần cứng) và được phân bậc theo kích cỡ bản sao mô hình.

Mô hình trên Marketplace

Amazon Bedrock Marketplace cho phép bạn khám phá, thử nghiệm và sử dụng hơn 100 mô hình nền tảng phổ biến, mới nổi và chuyên biệt trong Bedrock. Các mô hình trên Amazon Bedrock Marketplace được triển khai đến các điểm cuối, nơi bạn có thể chọn số lượng phiên bản và loại phiên bản mong muốn cũng như cấu hình chính sách tự động điều chỉnh quy mô để đáp ứng nhu cầu của khối lượng công việc. Đối với mô hình độc quyền, bạn sẽ phải trả mức giá phần mềm do nhà cung cấp mô hình đặt (theo giờ, có thể lập hóa đơn theo mức tăng tính bằng giây hoặc theo yêu cầu) và giá cơ sở hạ tầng dựa trên phiên bản bạn chọn. Bạn có thể xem các mức giá này trước khi đăng ký sử dụng mô hình của nhà cung cấp cũng như ở phần liệt kê mô hình trong AWS Marketplace. Đối với mô hình được cung cấp công khai, bạn chỉ phải trả mức giá cơ sở hạ tầng dựa trên phiên bản do bạn lựa chọn. Tìm hiểu thêm tại đây.

Tùy chỉnh và tối ưu hóa

Tùy chỉnh mô hình

Với Amazon Bedrock, bạn có thể tùy chỉnh FM với dữ liệu của mình để cung cấp các phản hồi phù hợp cho những tác vụ cụ thể và bối cảnh kinh doanh của bạn. Bạn có thể tinh chỉnh các mô hình có dữ liệu được gắn nhãn hoặc tiếp tục huấn luyện trước với dữ liệu không được gắn nhãn. Để tùy chỉnh mô hình tạo văn bản, bạn bị tính phí đào tạo mô hình dựa trên tổng số token được mô hình xử lý (số lượng token trong kho dữ liệu đào tạo x số giai đoạn) và phí lưu trữ mô hình được tính mỗi tháng cho mỗi mô hình. Một giai đoạn là một lần đọc toàn bộ tập dữ liệu đào tạo của bạn trong quá trình tinh chỉnh hoặc đào tạo trước liên tục. Các suy luận sử dụng mô hình tùy chỉnh được tính phí theo gói Thông lượng được cung cấp và yêu cầu bạn mua Thông lượng được cung cấp. Một đơn vị mô hình được cung cấp mà không cần thời hạn cam kết để suy luận trên mô hình tùy chỉnh. Bạn sẽ bị tính phí cho số giờ bạn sử dụng trong đơn vị mô hình đầu tiên để suy luận mô hình tùy chỉnh. Nếu muốn tăng thông lượng của mình vượt quá một đơn vị mô hình, bạn phải mua thời hạn cam kết 1 tháng hoặc 6 tháng.

Chắt lọc mô hình

Với tính năng Chắt lọc mô hình của Amazon Bedrock, bạn chỉ cần trả tiền cho những gì bạn sử dụng. Việc tạo dữ liệu tổng hợp được tính dựa trên cách định giá theo nhu cầu của mô hình giáo viên đã chọn. Việc tinh chỉnh mô hình học viên được tính theo mức giá tùy chỉnh mô hình. Vì mô hình được chắt lọc là một mô hình tùy chỉnh, nên các suy luận sử dụng mô hình tùy chỉnh sẽ được tính phí theo gói Thông lượng được cung cấp và yêu cầu khách hàng mua Thông lượng được cung cấp.

Lưu câu lệnh vào bộ nhớ đệm

Với tính năng lưu câu lệnh vào bộ nhớ đệm trên Amazon Bedrock, bạn có thể lưu vào bộ nhớ đệm ngữ cảnh lặp đi lặp lại ở các lệnh gọi API để giảm chi phí và độ trễ phản hồi. Câu lệnh thường chứa ngữ cảnh hoặc tiền tố phổ biến như cuộc hội thoại dài, nhiều lượt, nhiều ví dụ và hướng dẫn chi tiết để tinh chỉnh hành vi của mô hình. Khi sử dụng API Amazon Bedrock hiện có, bạn có thể chỉ định tiền tố câu lệnh mà bạn muốn lưu trong năm phút vào bộ nhớ đệm theo tài khoản AWS cụ thể. Trong thời gian đó, bất kỳ yêu cầu nào có tiền tố trùng khớp đều nhận được chiết khấu lên đến 90% cho các token được lưu trong bộ nhớ đệm và cải thiện độ trễ lên đến 85%. Giá cả và các cải tiến hiệu năng sẽ thay đổi tùy theo mô hình và độ dài câu lệnh, nhưng bộ nhớ đệm luôn tách biệt với tài khoản AWS của bạn.

Công cụ

Quy tắc bảo vệ

Quy tắc bảo vệ của Amazon Bedrock giúp bạn thực hiện các biện pháp bảo vệ tùy chỉnh và chính sách AI có trách nhiệm cho các ứng dụng AI tạo sinh của bạn. Quy tắc bảo vệ cung cấp các biện pháp bảo vệ an toàn tùy chỉnh bổ sung bên cạnh những biện pháp bảo vệ ban đầu do FM cung cấp. Quy tắc bảo vệ của Amazon Bedrock là tính năng AI có trách nhiệm duy nhất được cung cấp bởi một nhà cung cấp đám mây lớn, giúp khách hàng xây dựng và tùy chỉnh các biện pháp bảo vệ tính an toàn, quyền riêng tư và tính trung thực cho các ứng dụng AI tạo sinh của họ trong một giải pháp duy nhất. Tính năng này hoạt động với tất cả các mô hình FM trong Amazon Bedrock cũng như các mô hình tinh chỉnh. Quy tắc bảo vệ của Bedrock cũng có thể được tích hợp với Tác tử và Cơ sở kiến thức dành cho Amazon Bedrock để xây dựng các ứng dụng AI tạo sinh phù hợp với các chính sách AI có trách nhiệm của bạn. Ngoài ra, Quy tắc bảo vệ còn cung cấp API ApplyGuardrail để giúp đánh giá thông tin đầu vào của người dùng và phản hồi của mô hình được tạo bởi bất kỳ FM tùy chỉnh hoặc bên thứ ba nào bên ngoài Bedrock.

Cơ sở kiến thức và Tự động hóa dữ liệu

Cơ sở kiến thức Amazon Bedrock là một quy trình Tạo có kết hợp truy xuất thông tin ngoài (RAG) được quản lý toàn phần để giúp khách hàng tạo ra các ứng dụng AI tạo sinh tùy chỉnh, bảo mật, có độ trễ thấp và độ chính xác cao bằng cách kết hợp thông tin theo ngữ cảnh từ các nguồn dữ liệu của chính khách hàng. Cơ sở kiến thức hỗ trợ các nguồn dữ liệu khác nhau, bao gồm S3 và Confluence, Salesforce và SharePoint, trong bản xem trước. Cơ sở kiến thức cũng cung cấp khả năng tải nhập tài liệu để truyền liên tục dữ liệu. Cơ sở kiến thức Bedrock chuyển đổi dữ liệu phi cấu trúc thành các phần nhúng, lưu trữ trong cơ sở dữ liệu véc-tơ và cho phép truy xuất từ các kho dữ liệu đa dạng. Cơ sở kiến thức cũng tích hợp với Kendra để truy xuất có quản lý và hỗ trợ truy xuất dữ liệu có cấu trúc bằng khả năng chuyển ngôn ngữ tự nhiên thành SQL.

Tính năng Tự động hóa dữ liệu của Amazon Bedrock giúp chuyển đổi nội dung đa phương thức, phi cấu trúc thành các định dạng dữ liệu có cấu trúc cho các trường hợp sử dụng như xử lý tài liệu thông minh, phân tích video và RAG. Tính năng Tự động hóa dữ liệu của Bedrock có thể tạo nội dung Đầu ra tiêu chuẩn bằng cách sử dụng các cài đặt mặc định được xác định trước dành cho phương thức cụ thể, ví dụ như mô tả từng cảnh của video, bản chép lời âm thanh hoặc phân tích tài liệu tự động. Khách hàng cũng có thể tạo Đầu ra tùy chỉnh bằng cách chỉ định yêu cầu về đầu ra trong Kế hoạch chi tiết dựa trên lược đồ dữ liệu của riêng mình mà sau đó họ có thể dễ dàng tải vào cơ sở dữ liệu hoặc kho dữ liệu hiện có. Thông một tiện ích tích hợp với Cơ sở kiến thức, tính năng Tự động hóa dữ liệu của Bedrock cũng có thể được sử dụng để phân tích cú pháp nội dung cho các ứng dụng RAG, cải thiện độ chính xác và mức độ liên quan của kết quả bằng cách bao gồm thông tin được nhúng trong cả hình ảnh và văn bản.

Tác tử

Tác tử Amazon Bedrock cung cấp cho bạn khả năng xây dựng và cấu hình các tác tử tự trị trong ứng dụng của mình. Những tác tử này sẽ kết nối an toàn với các nguồn dữ liệu của công ty bạn và tăng cường yêu cầu của người dùng với thông tin phù hợp để tạo ra phản hồi chính xác. Bạn có thể tạo ứng dụng một tác tử hoặc nhiều tác tử chỉ với vài bước đơn giản, đẩy nhanh thời gian cần thiết để xây dựng các ứng dụng AI tạo sinh. Các tác tử này hỗ trợ giải thích mã để tự động tạo và thực thi mã cũng như trả về quyền kiểm soát, cho phép bạn xác định một lược đồ hành động và lấy lại quyền kiểm soát bất cứ khi nào tác tử gọi hành động. Ngoài ra, Tác tử của Amazon Bedrock có thể giữ lại bộ nhớ qua các tương tác, cung cấp trải nghiệm người dùng được cá nhân hóa và liền mạch hơn.

Luồng

Luồng Amazon Bedrock là tính năng tạo và thực thi quy trình làm việc của Bedrock cho các ứng dụng AI tạo sinh. Tính năng này tăng tốc cho quá trình tạo, kiểm thử và triển khai các quy trình làm việc AI tạo sinh do người dùng xác định thông qua trình dựng trực quan và một bộ API. Tính năng này cũng cho phép bạn liên kết liền mạch các mô hình nền tảng mới nhất, Câu lệnh, Tác tử, Cơ sở kiến thức, Quy tắc bảo vệ và các dịch vụ AWS (chẳng hạn như Amazon Lex, AWS Lambda, Amazon S3) cùng với logic kinh doanh để xây dựng quy trình làm việc AI tạo sinh. Bạn có thể dễ dàng kiểm thử và lập phiên bản quy trình làm việc của mình và chạy trong môi trường phi máy chủ an toàn thông qua giao diện trực quan hoặc API mà không cần phải xây dựng cơ sở hạ tầng riêng.

Đánh giá

Đánh giá mô hình: Với tính năng đánh giá mô hình của Amazon Bedrock, bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết mức tối thiểu về số lượng câu lệnh hoặc phản hồi . Đối với đánh giá tự động (theo lập trình), bạn chỉ trả tiền cho suy luận từ lựa chọn mô hình của bạn trong đánh giá. Điểm số thuật toán được tạo tự động được cung cấp mà không tính thêm phí. Trong Bản xem trước công khai cho đánh giá tự động (Mô hình/LLM-as-a-judge (LLM làm công cụ đánh giá)), bạn chỉ trả tiền cho suy luận từ mô hình trình tạo và mô hình trình đánh giá mà bạn chọn. Trong tác vụ đánh giá mô hình LLM-as-a-judge (LLM làm công cụ đánh giá), các chỉ số tích hợp sẵn sử dụng mẫu câu lệnh đánh giá của hệ thống dành riêng cho từng chỉ số và mô hình đánh giá có sẵn, sẽ bị tính phí trong mức sử dụng token của bạn. Các câu lệnh đánh giá cũng có sẵn trong tài liệu AWS công khai để đảm bảo tính minh bạch. Đối với đánh giá của con người, trong đó bạn sử dụng nhóm làm việc riêng của mình, bạn sẽ bị tính phí suy luận mô hình trong quá trình đánh giá và khoản phí 0,21 USD cho mỗi nhiệm vụ do người hoàn thành. Tác vụ của con người được định nghĩa là việc một phiên bản nhân viên con người gửi bản đánh giá về một lời nhắc duy nhất cùng các phản hồi suy luận liên quan trong giao diện người dùng đánh giá của con người. Giá cả giống nhau cho dù bạn có một hay hai mô hình trong công việc đánh giá, và cũng giống nhau bất kể bạn đưa vào bao nhiêu số liệu đánh giá và phương pháp xếp hạng. Phí cho các tác vụ của con người sẽ xuất hiện trong phần Amazon SageMaker trong hóa đơn AWS của bạn và giống nhau đối với tất cả Khu vực AWS. Không có phí riêng cho lực lượng lao động, vì lực lượng lao động do chính bạn cung cấp. Đối với đánh giá do AWS quản lý, giá được tùy chỉnh cho nhu cầu đánh giá của bạn trong một tương tác riêng tư khi làm việc với nhóm đánh giá chuyên gia AWS.

Đánh giá cơ sở kiến thức của Amazon Bedrock (đánh giá RAG): Với Đánh giá cơ sở kiến thức của Amazon Bedrock (đánh giá RAG), bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết mức tối thiểu về số lượng câu lệnh hoặc phản hồi. Trong Bản xem trước công khai, bạn chỉ trả tiền cho suy luận từ mô hình trình tạo và mô hình trình đánh giá mà bạn chọn (tác vụ đánh giá sử dụng LLM-as-a-judge (LLM làm công cụ đánh giá)), cũng như bất kỳ khoản phí nào phát sinh từ việc sử dụng Cơ sở kiến thức trong tác vụ đánh giá theo định giá cho Cơ sở kiến thức của Amazon Bedrock. Trong tác vụ Đánh giá cơ sở kiến thức (đánh giá RAG), các chỉ số tích hợp sẵn sử dụng mẫu câu lệnh đánh giá của hệ thống dành riêng cho từng chỉ số và mô hình đánh giá có sẵn, sẽ bị tính phí trong mức sử dụng token của bạn. Các câu lệnh đánh giá cũng có sẵn trong tài liệu AWS công khai để đảm bảo tính minh bạch. Một vài chỉ số bao hàm quá trình suy luận mô hình đánh giá trên ngữ cảnh được truy xuất từ Cơ sở kiến thức hoặc các câu trả lời đúng của bạn ngoài câu lệnh đầu vào, điều này ảnh hưởng đến chi phí liên quan đến từng chỉ số – bạn có thể tìm thêm thông tin về từng chỉ số trong tài liệu AWS công khai về đánh giá.

Chi tiết định giá

Mức giá phụ thuộc vào phương thức, nhà cung cấp và mô hình. Vui lòng chọn nhà cung cấp mô hình để xem mức giá chi tiết.

Amazon Bedrock cung cấp các mô hình nền tảng (FM) được chọn lọc từ những nhà cung cấp AI hàng đầu như Anthropic, Meta, Mistral AI và Amazon để suy luận hàng loạt với mức giá thấp hơn 50% so với giá suy luận theo yêu cầu. Vui lòng tham khảo danh sách mô hình tại đây.

AI21 Labs

AI21 Labs

Định giá theo nhu cầu

Mô hình của AI21 Labs	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra
Jamba 1.5 Large	0,002 USD	0,008 USD
Jamba 1.5 Mini	0,0002 USD	0,0004 USD
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic-2 Ultra	0,0188 USD	0,0188 USD
Jamba-Instruct	0,0005 USD	0,0007 USD

Amazon
- Amazon Nova
- Amazon Titan
- Amazon khác
- Amazon Nova
- Amazon Nova
  
  Định giá cho Mô hình hiểu biết
  
  Định giá cho các mô hình Tạo nội dung sáng tạo
- Amazon Titan
- Amazon Titan
- Amazon khác
Anthropic

Anthropic

Định giá theo nhu cầu và theo loạt

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)	Giá cho mỗi 1.000 token đầu vào (ghi bộ nhớ đệm)	Giá cho mỗi 1.000 token đầu vào (đọc bộ nhớ đệm)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,0008 USD	0,004 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD	Không áp dụng	Không áp dụng
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD	Không áp dụng	Không áp dụng
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	Không áp dụng	Không áp dụng
Claude 2.1	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng	Không áp dụng	Không áp dụng
Claude 2.0	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng	Không áp dụng	Không áp dụng
Claude Instant	0,0008 USD	0,0024 USD	Không áp dụng	Không áp dụng	Không áp dụng	Không áp dụng
*Claude 3 Opus hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)
**Định giá cho Claude 3.5 Sonnet áp dụng cho từng phiên bản của Claude 3.5 Sonnet (v1 và v2) – Claude 3.5 Sonnet v2 hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)

Các mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)	Giá cho mỗi 1.000 token đầu vào (ghi bộ nhớ đệm)	Giá cho mỗi 1.000 token đầu vào (đọc bộ nhớ đệm)
Claude 3.5 Sonnet**	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD	0,00375 USD	0,0003 USD
Claude 3.5 Haiku	0,001 USD	0,005 USD	0,0005 USD	0,0025 USD	0,001 USD	0,00008 USD
Claude 3 Opus*	0,015 USD	0,075 USD	0,0075 USD	0,0375 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 2.1	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng
Claude 2.0	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng
Claude Instant	0,0008 USD	0,0024 USD	Không áp dụng	Không áp dụng
*Claude 3 Opus hiện đã có ở Khu vực Miền Tây Hoa Kỳ (Oregon)
**Giá cho Claude 3.5 Sonnet áp dụng cho từng phiên bản của Claude 3.5 Sonnet (v1 và v2) - Claude 3.5 Sonnet v2 hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)

Khu vực: Châu Âu (London)

Các mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Khu vực: Châu Âu (Zurich)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Khu vực: Nam Mỹ (Sao Paolo)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Khu vực: Canada (Miền Trung)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Khu vực: Châu Á Thái Bình Dương (Mumbai)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Khu vực: Châu Á Thái Bình Dương (Sydney)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Khu vực: Châu Á Thái Bình Dương (Tokyo)

Mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)
Claude Instant	0,0008 USD	0,0024 USD	Không áp dụng	Không áp dụng
Claude 2.0/2.1	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD

Khu vực: Châu Á Thái Bình Dương (Singapore)

Các mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)
Claude Instant	0,0008 USD	0,0024 USD	0,0004 USD	0.0012 USD
Claude 2.0/2.1	0,008 USD	0,024 USD	0,004 USD	0,012 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	Không áp dụng	Không áp dụng

Khu vực: Châu Âu (Paris)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3 Haiku

0,00025 USD

0,00125 USD

0,000125 USD

0,000625 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

0,0015 USD

0,0075 USD

Khu vực: Châu Âu (Frankfurt)

Mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra	Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)	Giá cho mỗi 1.000 token đầu ra (theo loạt)
Claude Instant	0,0008 USD	0,0024 USD	Không áp dụng	Không áp dụng
Claude 2.0/2.1	0,008 USD	0,024 USD	Không áp dụng	Không áp dụng
Claude 3 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3.5 Sonnet	0,003 USD	0,015 USD	0,0015 USD	0,0075 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD	0,000125 USD	0,000625 USD

Khu vực: Châu Á Thái Bình Dương (Seoul)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

Không áp dụng

Claude 3 Haiku

0,00025 USD

0,00125 USD

Không áp dụng

Khu vực: Miền Đông Hoa Kỳ (Ohio)

Các mô hình của Anthropic

Giá cho mỗi 1.000 token đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt)

Giá cho mỗi 1.000 token đầu ra (theo loạt)

Claude 3.5 Sonnet

0,003 USD

0,015 USD

Không áp dụng

Claude 3 Haiku

0,00025 USD

0,00125 USD

Không áp dụng

Khu vực: AWS GovCloud (Miền Tây Hoa Kỳ) và AWS GovCloud (Miền Đông Hoa Kỳ)

Các mô hình của Anthropic	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra
Claude 3.5 Sonnet	0,0036 USD	0,018 USD
Claude 3 Haiku	0,0003 USD	0,0015 USD

Suy luận tối ưu hóa độ trễ

Khu vực: Miền Đông Hoa Kỳ (Ohio)

	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra
Claude 3.5 Haiku	0,001 USD	0,005 USD

Định giá thông lượng được cung cấp

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Mô hình của Anthropic	Giá mỗi giờ cho mỗi mô hình không có cam kết	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Mô hình của Anthropic	Giá mỗi giờ cho mỗi mô hình không có cam kết	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Khu vực: Châu Á Thái Bình Dương (Tokyo)

Mô hình của Anthropic	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Khu vực: Châu Âu (Frankfurt)

Mô hình của Anthropic	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Vui lòng liên hệ với đội ngũ phụ trách tài khoản AWS của bạn để biết thêm thông tin chi tiết về các đơn vị mô hình.

Cohere

Cohere

Định giá theo nhu cầu

Mô hình của Cohere	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra
Command	0,0015 USD	0,0020 USD
Command-Light	0,0003 USD	0,0006 USD
Command R+	0,0030 USD	0,0150 USD
Command R	0,0005 USD	0,0015 USD
Embed – tiếng Anh	0,0001 USD	Không áp dụng
Embed – Đa ngôn ngữ	0,0001 USD	Không áp dụng

Mô hình của Cohere	Giá cho mỗi 1.000 truy vấn**
Rerank 3.5	2,00 USD
**Bạn bị tính phí cho số truy vấn, trong đó mỗi truy vấn có thể chứa tối đa 100 khúc tài liệu. Nếu truy vấn chứa hơn 100 khúc tài liệu, thì sẽ được tính là nhiều truy vấn. Ví dụ: nếu một yêu cầu chứa 350 tài liệu, yêu cầu đó sẽ được coi là 4 truy vấn. Xin lưu ý rằng mỗi tài liệu chỉ có thể chứa tối đa 500 token (bao gồm truy vấn và tổng số token của tài liệu) và nếu độ dài token lớn hơn 512 token, thì sẽ được chia thành nhiều tài liệu.

Định giá tùy chỉnh (tinh chỉnh)

Mô hình của Cohere	Giá đào tạo 1.000 token	Giá để lưu trữ từng mô hình tùy chỉnh mỗi tháng	Giá suy luận từ mô hình tùy chỉnh cho mỗi đơn vị mô hình mỗi giờ (với cách định giá Thông lượng được cung cấp không cam kết)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Cohere Command-Light	0,001 USD	1,95 USD	8,56 USD

*Tổng số token được đào tạo = số token trong kho dữ liệu đào tạo x số giai đoạn

Giá của thông lượng được cung cấp

Mô hình của Cohere	Giá mỗi giờ cho mỗi mô hình không có cam kết	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command – Light	8,56 USD	6,85 USD	4,11 USD
Embed – tiếng Anh	7,12 USD	6,76 USD	6,41 USD
Embed – Đa ngôn ngữ	7,12 USD	6,76 USD	6,41 USD

Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình.

Meta Llama

Meta Llama

Llama 3.3

Định giá theo nhu cầu và theo loạt

Llama 3.2

Định giá theo nhu cầu và theo loạt

Llama 3.1

Định giá theo nhu cầu và theo loạt

Định giá tùy chỉnh mô hình (tinh chỉnh)

Định giá Thông lượng được cung cấp

Llama 3

Định giá theo nhu cầu

Llama 2

Định giá theo nhu cầu

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Mô hình của Meta	Giá cho mỗi 1.000 token đầu vào	Giá cho mỗi 1.000 token đầu ra
Llama 2 Chat (13B)	0,00075 USD	0,001 USD
Llama 2 Chat (70B)	0,00195 USD	0,00256 USD

Định giá tùy chỉnh mô hình (tinh chỉnh)

Mô hình của Meta	Giá đào tạo 1.000 token	*Giá lưu trữ từng mô hình tùy chỉnh mỗi tháng**	Giá suy luận từ mô hình tùy chỉnh cho 1 đơn vị mô hình mỗi giờ (với cách định giá Thông lượng được cung cấp không cam kết)
Llama 2 Pretrained (13B)	0,00149 USD	1,95 USD	23,50 USD
Llama 2 Pretrained (70B)	0,00799 USD	1,95 USD	23,50 USD

*Lưu trữ mô hình tùy chỉnh = 1,95 USD

Giá của thông lượng được cung cấp

Mô hình của Meta	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng
Llama 2 Pretrained và Chat (13B)	21,18 USD	13,08 USD
Llama 2 Pretrained (70B)	21,18 USD	13,08 USD

*Các mô hình Llama 2 Pre-trained chỉ được cung cấp trong thông lượng được cung cấp sau khi tùy chỉnh.

Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình.

Mistral AI
Mistral AI
Stability AI

Stability AI

Định giá theo nhu cầu

Mô hình của Stability AI	Giá cho mỗi hình ảnh được tạo
Stable Diffusion 3.5 Large	0,08 USD
Stable Image Core	0,04 USD
Stable Diffusion 3 Large	0,08 USD
Stable Image Ultra	0,14 USD

Khả năng tạo mô hình hình ảnh trước đây do Stability AI cung cấp được định giá cho mỗi hình ảnh, tùy thuộc vào số bước và độ phân giải hình ảnh.

Mô hình của Stability AI	Độ phân giải hình ảnh	Giá cho mỗi hình ảnh được tạo với chất lượng tiêu chuẩn (từ 50 bước trở xuống)	Giá cho mỗi hình ảnh được tạo với chất lượng cao (trên 50 bước)
SDXL 1.0	Tối đa 1024 x 1024	0,04 USD	0,08 USD

Giá của thông lượng được cung cấp

Mô hình của Stability AI	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng*	Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng*
SDXL 1.0	49,86 USD	46,18 USD

*Bao gồm suy luận cho các mô hình cơ sở và tùy chỉnh

Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình.

Hiện tại, tính năng tùy chỉnh mô hình (tinh chỉnh) không được hỗ trợ cho các mô hình của Stability AI trên Amazon Bedrock.

Nhập mô hình tùy chỉnh

Nhập mô hình tùy chỉnh

Llama
Llama đa phương thức
Mistral
Mixtral
Flan

Llama

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Phiên bản đơn vị mô hình tùy chỉnh	v1.0
Giá cho mỗi đơn vị mô hình tùy chỉnh/phút*	0,0785 USD
Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh	1,95 USD

Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Llama 3.1 8B 128K yêu cầu 2 Đơn vị mô hình tùy chỉnh, mô hình Llama 3.1 70B 128k yêu cầu 8 Đơn vị mô hình tùy chỉnh.
*Được tính phí theo mỗi khoảng thời gian 5 phút

Llama đa phương thức

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Phiên bản đơn vị mô hình tùy chỉnh	v1.0
Giá cho mỗi đơn vị mô hình tùy chỉnh/phút*	0,0785 USD
Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh	1,95 USD

Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Llama 3.2 11B 128K yêu cầu 4 Đơn vị mô hình tùy chỉnh.
*Được tính phí theo mỗi khoảng thời gian 5 phút

Mistral

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Phiên bản đơn vị mô hình tùy chỉnh	v1.0
Giá cho mỗi đơn vị mô hình tùy chỉnh/phút*	0,0785 USD
Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh	1,95 USD

Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Mistral 7B 32K yêu cầu 1 Đơn vị mô hình tùy chỉnh.
*Được tính phí theo mỗi khoảng thời gian 5 phút

Mixtral

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Phiên bản đơn vị mô hình tùy chỉnh	v1.0
Giá cho mỗi đơn vị mô hình tùy chỉnh/phút*	0,0785 USD
Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh	1,95 USD

Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Mixtral 8x7B 32K yêu cầu 4 Đơn vị mô hình tùy chỉnh.
*Được tính phí theo mỗi khoảng thời gian 5 phút

Flan

Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

Phiên bản đơn vị mô hình tùy chỉnh	v1.0
Giá cho mỗi đơn vị mô hình tùy chỉnh/phút*	0,0785 USD
Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh	1,95 USD

Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Flan-T5 XL 512 yêu cầu 1 Đơn vị mô hình tùy chỉnh.
*Được tính phí theo mỗi khoảng thời gian 5 phút

Định giá suy luận theo nhu cầu:
Bạn sẽ bị tính phí theo các khoảng thời gian 5 phút cho thời gian bản sao mô hình của bạn hoạt động, bắt đầu từ lệnh gọi thành công đầu tiên. Giới hạn thông lượng và chạy đồng thời tối đa cho mỗi bản sao mô hình phụ thuộc vào các yếu tố như hỗn hợp token đầu vào/đầu ra, loại phần cứng, kích cỡ mô hình, kiến trúc, việc tối ưu hóa suy luận và được xác định trong quy trình nhập mô hình.

Bedrock tự động điều chỉnh quy mô số lượng bản sao mô hình tùy thuộc vào kiểu sử dụng của bạn. Nếu không có lệnh gọi trong khoảng thời gian 5 phút, Bedrock sẽ giảm quy mô theo tài nguyên xuống 0 và tăng quy mô trở lại khi bạn gọi mô hình của mình. Trong khi tăng quy mô trở lại, bạn có thể gặp phải thời gian khởi động nguội (khoảng vài chục giây) tùy thuộc vào kích cỡ mô hình. Bedrock cũng tăng số lượng bản sao mô hình nếu khối lượng suy luận của bạn liên tục vượt quá giới hạn chạy đồng thời của một bản sao mô hình. Lưu ý: Theo mặc định, có thể tăng đến tối đa 3 bản sao mô hình thông qua Hạn mức dịch vụ cho mỗi tài khoản trên mỗi mô hình được nhập.

Công cụ định giá (chi tiết)

Luồng
Cơ sở kiến thức
Quy tắc bảo vệ
Đánh giá mô hình
Tự động hóa dữ liệu

Luồng
Luồng Amazon Bedrock

Chi phí được tính dựa trên số lượng chuyển tiếp nút cần thiết để thực thi ứng dụng của bạn. Luồng Bedrock đếm một chuyển tiếp nút mỗi khi một nút trong quy trình làm việc của bạn được thực thi. Bạn phải trả phí theo tổng số lần chuyển tiếp nút trên tất cả luồng.

Tất cả phí được tính theo ngày và lập hóa đơn theo tháng, bắt đầu từ ngày 1 tháng 2 năm 2025.

Giá cho mỗi 1.000 lần chuyển tiếp nút

0,035 USD

Phụ phí

Bạn có thể phải trả thêm phí nếu việc thực thi của quy trình làm việc ứng dụng của bạn sử dụng các dịch vụ AWS khác hoặc truyền dữ liệu. Ví dụ: nếu quy trình làm việc của bạn gọi chính sách Quy tắc bảo vệ của Amazon Bedrock, bạn sẽ phải trả phí cho số đơn vị văn bản được xử lý bởi chính sách.
Cơ sở kiến thức
Truy xuất dữ liệu có cấu trúc (Tạo SQL)

Truy xuất dữ liệu có cấu trúc được tính phí cho mỗi yêu cầu tạo truy vấn SQL. Truy vấn SQL được tạo sẽ dùng để truy xuất dữ liệu từ các kho chứa dữ liệu có cấu trúc.

Các mô hình Rerank

Các mô hình Rerank được thiết kế để cải thiện mức độ liên quan và độ chính xác của các phản hồi trong các ứng dụng Tạo có kết hợp truy xuất thông tin ngoài (RAG). Chúng được tính phí trên mỗi truy vấn.

**Bạn bị tính phí cho số truy vấn, trong đó mỗi truy vấn có thể chứa tối đa 100 khúc tài liệu. Nếu truy vấn chứa hơn 100 khúc tài liệu, thì sẽ được tính là nhiều truy vấn. Ví dụ: nếu một yêu cầu chứa 350 tài liệu, yêu cầu đó sẽ được coi là 4 truy vấn. Xin lưu ý rằng mỗi tài liệu chỉ có thể chứa tối đa 512 token (bao gồm truy vấn và tổng số token của tài liệu) và nếu độ dài token lớn hơn 512 token, thì sẽ được chia thành nhiều tài liệu. Một truy vấn tương đương với một đơn vị tìm kiếm.
Quy tắc bảo vệ

Giá cho mỗi 1.000 lần chuyển tiếp nút
0,035 USD

Quy tắc bảo vệ của Amazon Bedrock

Chính sách quy tắc bảo vệ*	Giá mỗi 1.000 đơn vị văn bản**
Bộ lọc nội dung (nội dung văn bản)****	0,15 USD
Chủ đề bị từ chối	0,15 USD
Kiểm tra nền tảng theo ngữ cảnh***	0,1 USD
Bộ lọc thông tin nhạy cảm (PII)	0,1 USD
Bộ lọc thông tin nhạy cảm (biểu thức chính quy)	Miễn phí
Bộ lọc từ	Miễn phí

Định giá theo nhu cầu

* Mỗi chính sách quy tắc bảo vệ đều không bắt buộc và có thể được kích hoạt dựa trên các yêu cầu của ứng dụng. Phí sẽ được tính dựa trên loại chính sách dùng trong quy tắc bảo vệ. Ví dụ: nếu quy tắc bảo vệ được cấu hình theo bộ lọc nội dung và chủ đề bị từ chối, thì hai chính sách này sẽ bị tính phí, đồng thời sẽ không có khoản phí nào liên quan đến các bộ lọc thông tin nhạy cảm.

**Một đơn vị văn bản có thể chứa lên đến 1000 ký tự. Nếu văn bản đầu vào nhiều hơn 1000 ký tự, thì dữ liệu đó được xử lý dưới dạng nhiều đơn vị văn bản, mỗi đơn vị chứa 1000 ký tự trở xuống. Ví dụ: nếu đầu vào văn bản chứa 5600 ký tự thì sẽ bị tính phí 6 đơn vị văn bản.

***Kiểm tra nền tảng theo ngữ cảnh sử dụng nguồn tham chiếu và truy vấn để xác định xem phản hồi của mô hình có dựa trên nguồn tham chiếu và có liên quan đến truy vấn hay không. Tổng số đơn vị văn bản tính phí được tính bằng cách kết hợp tất cả các ký tự trong nguồn tham chiếu, truy vấn và phản hồi của mô hình.

****Định giá cho các bộ lọc nội dung để phát hiện và lọc nội dung hình ảnh độc hại sẽ được công bố khi tính năng này được cung cấp rộng rãi.

Đánh giá mô hình

Đánh giá mô hình

Đánh giá mô hình được tính phí cho hoạt động suy luận từ mô hình mà bạn chọn. Điểm số thuật toán được tạo tự động được cung cấp mà không tính thêm phí. Đối với đánh giá của con người, trong đó bạn sử dụng luồng công việc riêng của mình, bạn sẽ bị tính phí suy luận mô hình trong quá trình đánh giá và khoản phí 0,21 USD cho mỗi nhiệm vụ do người hoàn thành.

Model

Giá cho mỗi 1.000 mã thông báo đầu vào

Giá cho mỗi 1.000 token đầu ra

Giá cho mỗi tác vụ của con người

Mô hình được chọn để đánh giá

Dựa trên mô hình được chọn

0,21 USD

Tự động hóa dữ liệu
Tự động hóa dữ liệu
- Cơ sở kiến thức dành cho Amazon Bedrock cung cấp tích hợp Tự động hóa dữ liệu của Bedrock để cung cấp các phản hồi có liên quan và chính xác hơn cho dữ liệu đa phương thức. Khi thiết lập Cơ sở kiến thức, bạn có thể chọn Tự động hóa dữ liệu của Bedrock làm phương pháp phân tích cú pháp để phân tích và trích xuất thông tin chuyên sâu có ý nghĩa từ hình ảnh hoặc tài liệu, có thể bao gồm các số liệu, biểu đồ và sơ đồ. Trong quá trình xử lý, Tự động hóa dữ liệu của Bedrock trích xuất thông tin hữu ích từ các tài liệu và hình ảnh đã tải nhập, sau đó được sử dụng trong các bước Cơ sở kiến thức tiếp theo để phân đoạn, nhúng và lưu trữ. Khi được tích hợp với Cơ sở kiến thức, Tự động hóa dữ liệu của Bedrock cung cấp và tính phí cho đầu ra chuẩn hóa.

Ví dụ về định giá

AI21 labs

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Jurrasic-2 Mid của AI21 để tóm tắt đầu vào gồm 10000 token văn bản đầu vào thành đầu ra gồm 2000 token.

Tổng chi phí phát sinh = 10000 token/1000 * 0,0125 USD + 2000 token/1000 * 0,0125 USD = 0,15 USD
Amazon

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Amazon Titan Text Lite để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 1.000 token.

Tổng chi phí phát sinh hàng giờ = 2.000 token/1.000 * 0,0003 USD + 1.000 token/1.000 * 0,0004 USD = 0,001 USD.

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình cơ sở của Trình tạo hình ảnh Amazon Titan để tạo 1000 hình ảnh cỡ 1024 x 1024 với chất lượng tiêu chuẩn.

Tổng chi phí phát sinh = 1.000 hình ảnh * 0,01 USD trên mỗi hình ảnh = 10 USD

Giá tùy chỉnh (tinh chỉnh và đào tạo trước liên tục)

Nhà phát triển ứng dụng tùy chỉnh mô hình Trình tạo hình ảnh Amazon Titan bằng 1000 cặp hình ảnh – văn bản. Sau khi đào tạo, nhà phát triển sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (kỳ hạn cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

Chi phí hàng tháng phát sinh cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,005 USD * 500 * 64), trong đó 0,005 USD là giá mỗi hình ảnh nhìn thấy, 500 là số bước và 64 là kích cỡ loạt + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Giá của thông lượng được cung cấp

Nhà phát triển ứng dụng mua hai đơn vị mô hình Amazon Titan Text Express với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

Tổng chi phí phát sinh hàng tháng = 2 đơn vị mô hình * 18,40 USD/giờ * 24 giờ * 31 ngày = 27.379,20 USD

Nhà phát triển ứng dụng mua một đơn vị mô hình của mô hình Trình tạo hình ảnh Amazon Titan cơ sở với cam kết 1 tháng.

Tổng chi phí phát sinh = 1 đơn vị mô hình * 16,2 USD * 24 giờ * 31 ngày = 12.052,8 USD
Anthropic

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock trong Khu vực Miền Tây Hoa Kỳ (Oregon): yêu cầu tới mô hình Claude của Anthropic để tóm tắt đầu vào gồm 11.000 token văn bản đầu vào thành đầu ra gồm 4.000 token.

Tổng chi phí phát sinh = 11.000 token/1000 * 0,008 USD + 4.000 token/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Giá của thông lượng được cung cấp

Nhà phát triển ứng dụng mua một đơn vị mô hình Claude Instant của Anthropic trong Khu vực Miền Tây Hoa Kỳ (Oregon):

Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 39,6 USD * 24 giờ * 31 ngày = 29.462,4 USD
Cohere

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Command của Cohere để tóm tắt đầu vào gồm 6.000 token văn bản đầu vào thành đầu ra gồm 2.000 token.

Tổng chi phí phát sinh = 6.000 token/1.000 * 0,0015 USD + 2.000 token/1.000 * 0,0020 USD = 0,013 USD

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Command – Light của Cohere để tóm tắt đầu vào gồm 6.000 token văn bản đầu vào thành đầu ra gồm 2.000 token.

Tổng chi phí phát sinh = 6.000 token/1000 * 0,0003 USD + 2.000 token/1000 * 0,0006 USD = 0,003 USD

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Embed tiếng Anh hoặc đa ngôn ngữ của Cohere để tạo ra các phần nhúng cho 10000 token đầu vào.

Tổng chi phí phát sinh = 10000 token/1000 * 0,0001 USD = 0,001 USD

Giá tùy chỉnh (tinh chỉnh)

Nhà phát triển ứng dụng tùy chỉnh mô hình Command của Cohere bằng 1000 token dữ liệu. Sau khi đào tạo, hãy sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

Chi phí phát sinh hàng tháng cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,004 USD * 1000) + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (49,5 USD) = 55,45 USD

Chi phí phát sinh hàng tháng cho thông lượng được cung cấp (cam kết 1 tháng) của mô hình tùy chỉnh = 39,6 USD

Giá của thông lượng được cung cấp

Nhà phát triển ứng dụng mua một đơn vị mô hình Command của Cohere với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 39,6 USD * 24 giờ * 31 ngày = 29.462,4 USD
Meta Llama

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Llama 2 Chat (13B) của Meta để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 500 token.

Tổng chi phí phát sinh = 2.000 token/1000 * 0,00075 USD + 500 token/1000 * 0,001 USD = 0,002 USD

Giá tùy chỉnh (tinh chỉnh)

Nhà phát triển ứng dụng tùy chỉnh mô hình Llama 2 Pre-trained (70B) bằng 1000 token dữ liệu. Sau khi đào tạo, hãy sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

Chi phí phát sinh hàng tháng cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,00799 USD * 1000) + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (23,5 USD) = 33,44 USD

Chi phí phát sinh hàng tháng cho thông lượng được cung cấp (cam kết 1 tháng) của mô hình tùy chỉnh = 21,18 USD

Giá của thông lượng được cung cấp

Nhà phát triển ứng dụng mua một đơn vị mô hình Llama 2 của Meta với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 21,18 USD * 24 giờ * 31 ngày = 15.757,92 USD
Mistral AI

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mistral 7B để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 1000 token.

Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,00015 USD + 1000 token/1.000 * 0,0002 USD = 0,0005 USD

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mixtral 8x7B để tóm tắt đầu vào gồm 2000 token văn bản đầu vào thành đầu ra gồm 1000 token.

Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,00045 USD + 1000 token/1000 * 0,0007 USD = 0,0016 USD

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mistral Large để tóm tắt dữ liệu đầu vào gồm 2000 token văn bản đầu vào thành đầu ra gồm 1000 token.

Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,008 USD + 1000 token/1.000 * 0,024 USD = 0,04 USD
Stability AI

Định giá theo nhu cầu

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình SDXL để tạo hình ảnh cỡ 512 x 512 với kích thước bước là 70 (chất lượng cao).

Tổng chi phí phát sinh = 1 hình ảnh * 0,036 USD mỗi hình ảnh = 0,036 USD

Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình SDXL 1.0 để tạo hình ảnh cỡ 1024 x 1024 với kích thước bước là 70 (chất lượng cao).

Tổng chi phí phát sinh = 1 hình ảnh * 0,08 USD mỗi hình ảnh = 0,08 USD

Giá của thông lượng được cung cấp

Nhà phát triển ứng dụng mua một đơn vị mô hình của SDXL 1.0 với cam kết 1 tháng.

Tổng chi phí phát sinh = 1 * 49,86 USD * 24 giờ * 31 ngày = 37.095,84 USD

Đánh giá mô hình

Ví dụ về đánh giá mô hình 1:

Tập dữ liệu này chứa 50 câu lệnh và nhà phát triển yêu cầu một nhân viên đánh giá mỗi tập hợp phản hồi-câu lệnh (có thể cấu hình trong quá trình tạo công việc đánh giá dưới dạng thông số “nhân viên trên mỗi câu lệnh”).

Sẽ có 50 tác vụ trong công việc đánh giá này (một tác vụ cho mỗi bộ phản hồi-câu lệnh cho mỗi nhân viên). 50 câu lệnh kết hợp với 5000 token đầu vào và các phản hồi liên quan kết hợp với 15.000 token cho Anthropic Claude Instant và 20000 token cho Anthropic Claude 2.1.

Các khoản phí sau đây phát sinh cho công việc đánh giá mô hình này:

Mục	Số lượng token đầu vào	Giá cho mỗi 1.000 token đầu vào	Chi phí đầu vào	Số lượng token đầu ra	Giá cho mỗi 1.000 token đầu ra	Chi phí đầu ra	Số tác vụ của con người	Giá cho mỗi tác vụ của con người	Chi phí tác vụ của con người	Tổng
Suy luận Claude Instant	5.000	0,0008 USD	0,004 USD	15000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5000	0,008 USD	0,04 USD	20000	0,024 USD	0,48 USD				0,52 USD
Tác vụ do con người thực hiện							50	0,21 USD	10,50 USD	10,50 USD
Tổng										11,06 USD

Ví dụ về đánh giá mô hình 2:

Định giá theo nhu cầu
Nhà phát triển ứng dụng gửi tập dữ liệu dành cho đánh giá mô hình do con người thực hiện bằng Anthropic Claude 2.1 và Anthropic Claude Instant tại Khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia).

Tập dữ liệu này chứa 50 câu lệnh và nhà phát triển yêu cầu hai nhân viên đánh giá mỗi tập hợp phản hồi-câu lệnh (có thể cấu hình trong quá trình tạo công việc đánh giá dưới dạng thông số “nhân viên trên mỗi câu lệnh”). Sẽ có 100 tác vụ trong công việc đánh giá này (1 tác vụ cho mỗi bộ phản hồi-câu lệnh cho mỗi nhân viên: 2 nhân viên x 50 tập hợp phản hồi câu lệnh = 100 tác vụ của con người).

50 câu lệnh kết hợp với 5000 token đầu vào và các phản hồi liên quan kết hợp với 15000 token cho Anthropic Claude Instant và 20000 token cho Anthropic Claude 2.1.

Các khoản phí sau đây phát sinh cho công việc đánh giá mô hình này:

Mục	Số lượng token đầu vào	Giá cho mỗi 1.000 token đầu vào	Chi phí đầu vào	Số lượng token đầu ra	Giá cho mỗi 1.000 token đầu ra	Chi phí đầu ra	Số tác vụ của con người	Giá cho mỗi tác vụ của con người	Chi phí tác vụ của con người	Tổng
Suy luận Claude Instant	5.000	0.0008 USD	0,0040 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5000	0,008 USD	0,0400 USD	20000	0,024 USD	0,48 USD				0,52 USD
Tác vụ do con người thực hiện							100	0,21 USD	21,00 USD	21,00 USD
Tổng										21,56 USD

Quy tắc bảo vệ của Amazon Bedrock

Ví dụ 1: Chatbot hỗ trợ khách hàng
Một nhà phát triển ứng dụng tạo một chatbot hỗ trợ khách hàng và sử dụng các bộ lọc nội dung để chặn nội dung gây hại và các chủ đề bị từ chối nhằm lọc các truy vấn và phản hồi không mong muốn.

Chatbot phục vụ 1000 truy vấn của người dùng mỗi giờ. Mỗi truy vấn người dùng có độ dài đầu vào trung bình là 200 ký tự và nhận được phản hồi FM gồm 1500 ký tự.

Mỗi truy vấn của người dùng gồm 200 ký tự tương ứng với 1 đơn vị văn bản.

Mỗi phản hồi FM gồm 1.500 ký tự tương ứng với 2 đơn vị văn bản.

Đơn vị văn bản được xử lý mỗi giờ = (1 + 2) * 1000 truy vấn = 3000 đơn vị văn bản

Tổng chi phí phát sinh mỗi giờ cho bộ lọc nội dung và chủ đề bị từ chối = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Ví dụ 2: Tóm tắt bản chép lời trung tâm cuộc gọi
Một nhà phát triển ứng dụng tạo một ứng dụng để tóm tắt bản ghi cuộc trò chuyện giữa người dùng và nhân viên hỗ trợ. Ứng dụng đó sử dụng bộ lọc thông tin nhạy cảm để biên tập thông tin nhận dạng cá nhân (PII) trong các bản tóm tắt được tạo cho 10000 cuộc hội thoại.

Mỗi bản tóm tắt được tạo có trung bình 3.500 ký tự tương ứng với 4 đơn vị văn bản.

Tổng chi phí phát sinh để tóm tắt 10000 cuộc hội thoại = 10000 * 4 * (0,1 USD / 1000) = 4 USD

Mục	Số lượng token đầu vào	Giá cho mỗi 1.000 token đầu vào	Chi phí đầu vào	Số lượng token đầu ra	Giá cho mỗi 1.000 token đầu ra	Chi phí đầu ra	Số tác vụ của con người	Giá cho mỗi tác vụ của con người	Chi phí tác vụ của con người	Tổng
Suy luận Claude Instant	5.000	0,0008 USD	0,004 USD	15000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5000	0,008 USD	0,04 USD	20000	0,024 USD	0,48 USD				0,52 USD
Tác vụ do con người thực hiện							100	0,21 USD	21,00 USD	21,00 USD
Tổng										21,56 USD

Nhập mô hình tùy chỉnh

Ví dụ định giá: Nhà phát triển ứng dụng nhập mô hình tùy chỉnh thuộc loại Llama 3.1 có kích cỡ thông số 8B với độ dài chuỗi 128K ở khu vực us-east-1 và xóa mô hình sau 1 tháng. Hoạt động này yêu cầu 2 Đơn vị mô hình tùy chỉnh. Vì vậy, mức giá mỗi phút sẽ là 0,1570 USD vì cần có 2 Đơn vị mô hình tùy chỉnh. Chi phí lưu trữ mô hình cho 2 Đơn vị mô hình tùy chỉnh sẽ là 3,90 USD mỗi tháng.

Việc nhập mô hình không phát sinh khoản phí nào. Lệnh gọi thành công đầu tiên diễn ra vào lúc 8:03 sáng và việc đo lường sẽ bắt đầu vào thời điểm này. Các khoàng thời gian đo lường 5 phút là từ 8:03 sáng - 8:07 sáng; 8:07 sáng - 8:11 sáng, v.v. Nếu có ít nhất một lệnh gọi trong bất kỳ khoảng thời gian 5 phút nào, khoảng thời gian đó sẽ được coi là hoạt động để tính phí. Nếu không có lệnh gọi từ 8:07 sáng đến 8:11 sáng, việc đo lường sẽ dừng lại vào lúc 8:11 sáng. Trong trường hợp này, hóa đơn sẽ được tính như sau: 0,1570 USD * 5 phút * 3 khoảng thời gian năm phút = 2,355 USD.
Cơ sở kiến thức dành cho Amazon Bedrock

Ví dụ về định giá 1 (Xếp hạng lại bằng mô hình Amazon Rerank 1.0)

Trong một tháng, bạn thực hiện 2 triệu yêu cầu đối với API Rerank bằng mô hình Amazon Rerank 1.0 – 1 triệu yêu cầu với mỗi yêu cầu chứa ít hơn 100 tài liệu và do đó mỗi yêu cầu sẽ bị tính phí tương đương một yêu cầu. 1 triệu yêu cầu còn lại chứa 120-150 tài liệu và do đó mỗi yêu cầu sẽ được tính phí tương đương 2 yêu cầu.

Giá cho một yêu cầu = 0,001 USD
Tổng mức phí = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USD

Ví dụ về định giá 2: (Truy xuất dữ liệu có cấu trúc)

Một nhà phát triển ứng dụng tạo một chatbot hỗ trợ để truy vấn dữ liệu có cấu trúc được lưu trữ trong Amazon Redshift. Nhà phát triển tạo Cơ sở kiến thức Bedrock và kết nối với Amazon Redshift. Chatbot phục vụ 10000 truy vấn người dùng mỗi giờ. Mỗi truy vấn người dùng sẽ có mức giá 0,002 USD cho mỗi API GenerateQuery để tạo SQL từ truy vấn người dùng.

Tổng chi phí phát sinh cho việc tạo SQL mỗi giờ = 0,002 USD * 10000 = 20 USD.
Tổng chi phí phát sinh trong tháng = 20 USD * 24 * 30 = 1440 USD
Luồng

Ví dụ: Tóm tắt tin tức
Một nhà phát triển ứng dụng tạo ra một luồng để tự động hóa việc tóm tắt tin tức cho các nhà giao dịch. Luồng này bao gồm một nút Đầu vào tiếp nhận vị trí S3 và một nút truy xuất S3 để truy xuất 10 tệp bao gồm các bài báo từ 10 hãng tin lớn trong S3 (2 lần chuyển tiếp nút). Sau đó, luồng này sử dụng một nút trình lặp để gọi một mô hình với một nút câu lệnh để tóm tắt từng tệp (+ 10 tệp x 2 lần chuyển tiếp nút). Sau đó, luồng thu thập tất cả các kết quả bằng cách sử dụng một nút bộ thu thập, ghi kết quả vào S3 bằng nút lưu trữ S3 và hoàn tất trong một nút Đầu ra (+ 3 lần chuyển tiếp nút). Họ chạy luồng này mỗi nữa tiếng/mỗi ngày trong tuần.

Số lần chuyển tiếp nút/lần thực thi luồng là: 2+1+10*2 + 3 = 25 lần chuyển tiếp nút/thực thi luồng

Số lần thực thi luồng mỗi tháng là: 24 giờ * 2 * 5 ngày * 4 tuần = 960 lần thực thi luồng mỗi tháng.

Tổng hóa đơn hàng tháng là: 25 * 960 * 0,035 USD/1000 = 0,84 USD

Phụ phí
Hóa đơn cũng sẽ bao gồm các khoản phí bổ sung cho các dịch vụ AWS được sử dụng trong quá trình thực thi quy trình làm việc, bao gồm việc sử dụng Amazon S3 trong các nút truy xuất và lưu trữ và sử dụng mô hình nền tảng Amazon Bedrock trong nút câu lệnh.
Tự động hóa dữ liệu

Ví dụ về định giá 1:
Giả sử bạn xử lý một tài liệu 1.000 trang bằng Đầu ra tùy chỉnh BDA. Tất cả 1.000 trang được xử lý bằng cách sử dụng kế hoạch chi tiết 1 có 15 trường. Giá mỗi trang cho bất kỳ kế hoạch chi tiết nào có 30 trường trở xuống là 0,040 USD. Tổng chi phí là 40 USD.

Tổng số trang đã xử lý = 1.000
Giá mỗi trang cho kế hoạch chi tiết có ít hơn 30 trường = 0,040 USD
Tổng mức phí = 1.000 * 0,040 USD = 40 USD

Ví dụ về định giá 2:
Giả sử bạn xử lý 2 tài liệu bằng Đầu ra tùy chỉnh BDA. Tài liệu 1 có 40 trang và được xử lý bằng cách sử dụng kế hoạch chi tiết 1 có 20 trường. Tài liệu 2 có 10 trang và được xử lý bằng cách sử dụng kế hoạch chi tiết 2, có 40 trường. Giá mỗi trang của kế hoạch chi tiết 1 là 0,040 USD vì chứa 30 trường trở xuống. Giá mỗi trang của kế hoạch chi tiết 2 là 0,045 USD. Chi phí xử lý cho Tài liệu 1 sử dụng kế hoạch chi tiết 1 là 1,60 USD. Chi phí xử lý cho Tài liệu 2 sử dụng kế hoạch chi tiết 2 là 0,45 USD. Tổng chi phí xử lý cả hai tài liệu sẽ là 2,05 USD.

Tổng số trang đã xử lý = 50
Giá mỗi trang cho Kế hoạch chi tiết 1 có ít hơn 30 trường = 0,040 USD
Giá mỗi trang cho Kế hoạch chi tiết 2 có 40 trường = 0,040 USD + (số trường bổ sung trên 30 * 0,0005 USD mỗi trường)
Số trường bổ sung trên 30 = 40 - 30 = 10
Giá mỗi trang cho Kế hoạch chi tiết 2 có 40 trường = 0,040 USD + (10 * 0,0005 USD mỗi trường) = 0,045 USD
Phí cho Tài liệu 1 sử dụng Kế hoạch chi tiết 1 = 40 trang x 0,040 USD mỗi trang = 1,6 USD
Phí cho Tài liệu 2 sử dụng Kế hoạch chi tiết 2 = 10 trang x 0,045 USD mỗi trang = 0,45 USD
Tổng phí = Phí cho Tài liệu 1 + Phí cho Tài liệu 2 = 1,6 USD + 0,45 USD = 2,05 USD

Ví dụ về định giá 3:
Giả sử bạn xử lý video 60 phút bằng Đầu ra tiêu chuẩn BDA. Giá mỗi phút cho đầu ra tiêu chuẩn video là 0,050 USD. Tổng chi phí phải trả là 3,00 USD.

Tổng số phút được xử lý = 60
Giá mỗi phút cho đầu ra tiêu chuẩn video = 0,050 USD
Tổng mức phí = 60 * 0,050 USD = 3,00 USD

Ví dụ về định giá 4:
Giả sử bạn xử lý 2.000 hình ảnh bằng Đầu ra tùy chỉnh BDA. 1.000 hình ảnh đầu tiên được xử lý bằng cách sử dụng kế hoạch chi tiết 1, trong đó có 10 trường. 1.000 trang cuối cùng được xử lý bằng cách sử dụng kế hoạch chi tiết 2, trong đó có 40 trường. Giá mỗi hình ảnh cho kế hoạch chi tiết 1 là 0,005 USD, vì chứa 30 trường trở xuống. Giá mỗi hình ảnh của kế hoạch chi tiết 2 là 0,01 USD. Chi phí xử lý cho 1.000 hình ảnh đầu tiên sử dụng kế hoạch chi tiết 1 là 5,00 USD. Chi phí xử lý cho 1.000 hình ảnh thứ hai sử dụng kế hoạch chi tiết 2 là 10,00 USD. Tổng chi phí xử lý tất cả 2.000 hình ảnh sẽ là 15,00 USD

Chi phí cho 1000 hình ảnh đầu tiên = 1.000 hình ảnh * 0,005 USD mỗi hình ảnh = 5,00 USD
Chi phí cho 1.000 hình ảnh thứ hai = 1.000 hình ảnh * (0,005 USD + (số trường bổ sung trên 30 * 0,0005 USD cho mỗi trường))
= 1.000 * (0,005 USD + ((40-30)*0,0005 USD))
= 1.000 * (0,005 USD + (10*0,0005 USD)) = 10,00 USD
Tổng chi phí = 5,00 USD + 10,00 USD = 15,00 USD

Ví dụ về định giá 5:
Giả sử bạn muốn sử dụng Đầu ra tiêu chuẩn Tự động hóa dữ liệu của Bedrock để xử lý 15.000 phút ghi âm cuộc họp trong tổ chức của bạn. Tổng chi phí xử lý tất cả 15.000 phút âm thanh sẽ là 90 USD.

Tổng số phút được xử lý = 15.000 phút
Tổng phí = 15.000 phút × 0,006 USD = 90 USD

Ví dụ về định giá 6:
Giả sử bạn thiết lập Cơ sở kiến thức Bedrock để sử dụng Tự động hóa dữ liệu của Bedrock làm trình phân tích cú pháp và sau đó tải nhập một tài liệu 1000 trang. Lưu ý rằng việc tích hợp Cơ sở kiến thức Bedrock và Tự động hóa dữ liệu của Bedrock sử dụng đầu ra tiêu chuẩn. Giá mỗi trang cho đầu ra tiêu chuẩn là 0,010 USD. Tổng chi phí phải trả là 10 USD.

Tổng số trang đã xử lý = 1.000
Giá mỗi trang cho đầu ra tiêu chuẩn = 0,010 USD
Tổng mức phí = 1.000 * 0,010 USD = 10 USD

Định giá Amazon Bedrock

Tổng quan về giá cả

Mô hình định giá

Theo yêu cầu và hàng loạt

Tối ưu hóa độ trễ (Xem trước công khai)

Thông lượng cung cấp

Nhập mô hình tùy chỉnh

Mô hình trên Marketplace

Tùy chỉnh và tối ưu hóa

Tùy chỉnh mô hình

Chắt lọc mô hình

Lưu câu lệnh vào bộ nhớ đệm

Công cụ

Quy tắc bảo vệ

Cơ sở kiến thức và Tự động hóa dữ liệu

Tác tử

Luồng

Đánh giá

Chi tiết định giá

AI21 Labs

Amazon Nova

Định giá cho Mô hình hiểu biết

Định giá cho các mô hình Tạo nội dung sáng tạo

Amazon Titan

Anthropic

Cohere

Meta Llama

Mistral AI

Stability AI

Nhập mô hình tùy chỉnh

Công cụ định giá (chi tiết)

Luồng Amazon Bedrock

Quy tắc bảo vệ của Amazon Bedrock

Đánh giá mô hình

Tự động hóa dữ liệu

Ví dụ về định giá

AI21 labs

Amazon

Định giá theo nhu cầu

Giá tùy chỉnh (tinh chỉnh và đào tạo trước liên tục)

Giá của thông lượng được cung cấp

Anthropic

Định giá theo nhu cầu

Giá của thông lượng được cung cấp

Cohere

Định giá theo nhu cầu

Giá tùy chỉnh (tinh chỉnh)

Meta Llama

Định giá theo nhu cầu

Giá tùy chỉnh (tinh chỉnh)

Giá của thông lượng được cung cấp

Mistral AI

Định giá theo nhu cầu

Stability AI

Định giá theo nhu cầu

Giá của thông lượng được cung cấp

Đánh giá mô hình

Ví dụ về đánh giá mô hình 1:

Ví dụ về đánh giá mô hình 2:

Quy tắc bảo vệ của Amazon Bedrock

Nhập mô hình tùy chỉnh

Cơ sở kiến thức dành cho Amazon Bedrock

Luồng

Tự động hóa dữ liệu

Ngừng hỗ trợ cho Internet Explorer