Định giá Amazon Bedrock

Tổng quan về giá cả

Amazon Bedrock là một dịch vụ được quản lý toàn phần cung cấp sự lựa chọn các mô hình nền tảng (FM) hiệu suất cao thông qua một API đơn lẻ, cùng với một loạt tính năng bạn cần để xây dựng các ứng dụng AI tạo sinh với khả năng bảo mật, quyền riêng tư và AI có trách nhiệm.

Khi sử dụng Amazon Bedrock, bạn sẽ bị tính phí suy luận và tùy chỉnh mô hình. Bạn có thể chọn trong số hai gói định giá dành cho suy luận: 1. Theo yêu cầu và hàng loạt: Chế độ này cho phép bạn sử dụng FM trên cơ sở thanh toán theo mức sử dụng mà không phải thực hiện bất kỳ cam kết thời hạn nào dựa trên thời gian. 2. Thông lượng cung cấp: Chế độ này cho phép bạn cung cấp đủ thông lượng để đáp ứng các yêu cầu về hiệu năng của ứng dụng thay cho cam kết thời hạn dựa trên thời gian.

Mô hình định giá

Với chế độ Theo nhu cầu, bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết thời hạn dựa trên thời gian. Đối với các mô hình tạo văn bản, bạn bị tính phí cho mỗi token đầu vào được xử lý và mọi token đầu ra được tạo. Đối với các mô hình nhúng, bạn bị tính phí cho mỗi token đầu vào được xử lý. Một token bao gồm một vài ký tự và đề cập đến đơn vị văn bản cơ bản mà mô hình học để hiểu dữ liệu đầu vào và câu lệnh của người dùng. Đối với các mô hình tạo hình ảnh, bạn sẽ bị tính phí cho mỗi hình ảnh được tạo.

Suy luận liên khu vực: Chế độ Theo nhu cầu cũng hỗ trợ khả năng suy luận liên khu vực đối với một số mô hình. Chế độ này cho phép các nhà phát triển quản lý lưu lượng truy cập đột biến một cách liền mạch bằng cách sử dụng điện toán trên các Khu vực AWS khác nhau và đạt giới hạn thông lượng cao hơn cùng khả năng phục hồi nâng cao. Không tính thêm phí khi sử dụng suy luận liên khu vực và giá được tính dựa trên khu vực nơi bạn thực hiện yêu cầu (khu vực nguồn).

Với chế độ Hàng loạt, bạn có thể cung cấp tập hợp câu lệnh dưới dạng một tệp đầu vào duy nhất và nhận phản hồi dưới dạng một tệp đầu ra duy nhất, cho phép bạn thu thập cùng lúc các dự đoán quy mô lớn. Các phản hồi được xử lý và lưu trữ trong vùng lưu trữ Amazon S3 để bạn có thể truy cập chúng sau. Amazon Bedrock cung cấp các mô hình nền tảng (FM) được chọn lọc từ những nhà cung cấp AI hàng đầu như Anthropic, Meta, Mistral AI và Amazon để suy luận hàng loạt với mức giá thấp hơn 50% so với giá suy luận theo yêu cầu. Vui lòng tham khảo danh sách mô hình tại đây.

Suy luận được tối ưu hóa độ trễ cho các mô hình nền tảng trong Amazon Bedrock mang lại thời gian phản hồi nhanh hơn cho các mô hình và giúp cải thiện khả năng phản hồi cho các ứng dụng AI tạo sinh của bạn. Bạn có thể sử dụng suy luận tối ưu hóa độ trễ cho mô hình Claude 3.5 Haiku của Anthropic và các mô hình Llama 3.1 405B và 70B của Meta. Theo xác minh của Anthropic, với suy luận tối ưu hóa độ trễ trên Amazon Bedrock, Claude 3.5 Haiku chạy nhanh hơn trên AWS so với bất kỳ nơi nào khác. Ngoài ra, với suy luận tối ưu hóa độ trễ trong Bedrock, Llama 3.1 405B và 70B chạy nhanh hơn trên AWS so với bất kỳ nhà cung cấp dịch vụ đám mây lớn nào khác. Tìm hiểu thêm tại đây.

Với chế độ Thông lượng được cung cấp, bạn có thể mua các đơn vị mô hình cho một mô hình cơ sở hoặc tùy chỉnh cụ thể. Chế độ Thông lượng được cung cấp được thiết kế chủ yếu cho khối lượng công việc suy luận nhất quán lớn cần thông lượng được đảm bảo. Các mô hình tùy chỉnh chỉ có thể được truy cập bằng Thông lượng được cung cấp. Một đơn vị mô hình cung cấp một thông lượng nhất định, được đo bằng số lượng token đầu vào hoặc đầu ra tối đa được xử lý trong mỗi phút. Với cách định giá Thông lượng được cung cấp, bạn bị tính phí theo giờ và có thể linh hoạt lựa chọn giữa các thời hạn cam kết 1 tháng hoặc 6 tháng.

Tính năng Nhập mô hình tùy chỉnh cho phép bạn tận dụng các khoản đầu tư trước đây của mình vào tùy chỉnh mô hình trong Amazon Bedrock và sử dụng các mô hình này theo cách được quản lý toàn phần như với các mô hình nền tảng hiện được lưu trữ của Bedrock. Bạn có thể nhập trọng số tùy chỉnh cho các kiến trúc mô hình được hỗ trợ và cung cấp mô hình tùy chỉnh bằng chế độ Theo nhu cầu. Việc nhập mô hình tùy chỉnh vào Bedrock không phát sinh khoản phí nào. Khi bạn nhập một mô hình, bạn sẽ có thể truy cập mô hình đó theo nhu cầu mà không phải thực hiện bất kỳ hành động nào trong mặt phẳng điều khiển. Bạn chỉ bị tính phí cho suy luận mô hình, dựa trên số lượng bản sao mô hình tùy chỉnh cần thiết để phục vụ khối lượng suy luận của bạn và thời lượng hoạt động của mỗi bản sao mô hình, được tính phí theo khoảng thời gian 5 phút. Bản sao mô hình là một phiên bản duy nhất của một mô hình đã nhập và sẵn sàng phục vụ các yêu cầu suy luận. Giá cho mỗi bản sao mô hình mỗi phút phụ thuộc vào các yếu tố như kiến trúc, độ dài ngữ cảnh, Khu vực AWS, phiên bản đơn vị điện toán (thế hệ phần cứng) và được phân bậc theo kích cỡ bản sao mô hình.

Amazon Bedrock Marketplace cho phép bạn khám phá, thử nghiệm và sử dụng hơn 100 mô hình nền tảng phổ biến, mới nổi và chuyên biệt trong Bedrock. Các mô hình trên Amazon Bedrock Marketplace được triển khai đến các điểm cuối, nơi bạn có thể chọn số lượng phiên bản và loại phiên bản mong muốn cũng như cấu hình chính sách tự động điều chỉnh quy mô để đáp ứng nhu cầu của khối lượng công việc. Đối với mô hình độc quyền, bạn sẽ phải trả mức giá phần mềm do nhà cung cấp mô hình đặt (theo giờ, có thể lập hóa đơn theo mức tăng tính bằng giây hoặc theo yêu cầu) và giá cơ sở hạ tầng dựa trên phiên bản bạn chọn. Bạn có thể xem các mức giá này trước khi đăng ký sử dụng mô hình của nhà cung cấp cũng như ở phần liệt kê mô hình trong AWS Marketplace. Đối với mô hình được cung cấp công khai, bạn chỉ phải trả mức giá cơ sở hạ tầng dựa trên phiên bản do bạn lựa chọn. Tìm hiểu thêm tại đây.

Tùy chỉnh và tối ưu hóa

Với Amazon Bedrock, bạn có thể tùy chỉnh FM với dữ liệu của mình để cung cấp các phản hồi phù hợp cho những tác vụ cụ thể và bối cảnh kinh doanh của bạn. Bạn có thể tinh chỉnh các mô hình có dữ liệu được gắn nhãn hoặc tiếp tục huấn luyện trước với dữ liệu không được gắn nhãn. Để tùy chỉnh mô hình tạo văn bản, bạn bị tính phí đào tạo mô hình dựa trên tổng số token được mô hình xử lý (số lượng token trong kho dữ liệu đào tạo x số giai đoạn) và phí lưu trữ mô hình được tính mỗi tháng cho mỗi mô hình. Một giai đoạn là một lần đọc toàn bộ tập dữ liệu đào tạo của bạn trong quá trình tinh chỉnh hoặc đào tạo trước liên tục. Các suy luận sử dụng mô hình tùy chỉnh được tính phí theo gói Thông lượng được cung cấp và yêu cầu bạn mua Thông lượng được cung cấp. Một đơn vị mô hình được cung cấp mà không cần thời hạn cam kết để suy luận trên mô hình tùy chỉnh. Bạn sẽ bị tính phí cho số giờ bạn sử dụng trong đơn vị mô hình đầu tiên để suy luận mô hình tùy chỉnh. Nếu muốn tăng thông lượng của mình vượt quá một đơn vị mô hình, bạn phải mua thời hạn cam kết 1 tháng hoặc 6 tháng.

Với tính năng Chắt lọc mô hình của Amazon Bedrock, bạn chỉ cần trả tiền cho những gì bạn sử dụng. Việc tạo dữ liệu tổng hợp được tính dựa trên cách định giá theo nhu cầu của mô hình giáo viên đã chọn. Việc tinh chỉnh mô hình học viên được tính theo mức giá tùy chỉnh mô hình. Vì mô hình được chắt lọc là một mô hình tùy chỉnh, nên các suy luận sử dụng mô hình tùy chỉnh sẽ được tính phí theo gói Thông lượng được cung cấp và yêu cầu khách hàng mua Thông lượng được cung cấp.

Với tính năng lưu câu lệnh vào bộ nhớ đệm trên Amazon Bedrock, bạn có thể lưu vào bộ nhớ đệm ngữ cảnh lặp đi lặp lại ở các lệnh gọi API để giảm chi phí và độ trễ phản hồi. Câu lệnh thường chứa ngữ cảnh hoặc tiền tố phổ biến như cuộc hội thoại dài, nhiều lượt, nhiều ví dụ và hướng dẫn chi tiết để tinh chỉnh hành vi của mô hình. Khi sử dụng API Amazon Bedrock hiện có, bạn có thể chỉ định tiền tố câu lệnh mà bạn muốn lưu trong năm phút vào bộ nhớ đệm theo tài khoản AWS cụ thể. Trong thời gian đó, bất kỳ yêu cầu nào có tiền tố trùng khớp đều nhận được chiết khấu lên đến 90% cho các token được lưu trong bộ nhớ đệm và cải thiện độ trễ lên đến 85%. Giá cả và các cải tiến hiệu năng sẽ thay đổi tùy theo mô hình và độ dài câu lệnh, nhưng bộ nhớ đệm luôn tách biệt với tài khoản AWS của bạn.

Công cụ

Quy tắc bảo vệ của Amazon Bedrock giúp bạn thực hiện các biện pháp bảo vệ tùy chỉnh và chính sách AI có trách nhiệm cho các ứng dụng AI tạo sinh của bạn. Quy tắc bảo vệ cung cấp các biện pháp bảo vệ an toàn tùy chỉnh bổ sung bên cạnh những biện pháp bảo vệ ban đầu do FM cung cấp. Quy tắc bảo vệ của Amazon Bedrock là tính năng AI có trách nhiệm duy nhất được cung cấp bởi một nhà cung cấp đám mây lớn, giúp khách hàng xây dựng và tùy chỉnh các biện pháp bảo vệ tính an toàn, quyền riêng tư và tính trung thực cho các ứng dụng AI tạo sinh của họ trong một giải pháp duy nhất. Tính năng này hoạt động với tất cả các mô hình FM trong Amazon Bedrock cũng như các mô hình tinh chỉnh. Quy tắc bảo vệ của Bedrock cũng có thể được tích hợp với Tác tử và Cơ sở kiến thức dành cho Amazon Bedrock để xây dựng các ứng dụng AI tạo sinh phù hợp với các chính sách AI có trách nhiệm của bạn. Ngoài ra, Quy tắc bảo vệ còn cung cấp API ApplyGuardrail để giúp đánh giá thông tin đầu vào của người dùng và phản hồi của mô hình được tạo bởi bất kỳ FM tùy chỉnh hoặc bên thứ ba nào bên ngoài Bedrock.

Cơ sở kiến thức Amazon Bedrock là một quy trình Tạo có kết hợp truy xuất thông tin ngoài (RAG) được quản lý toàn phần để giúp khách hàng tạo ra các ứng dụng AI tạo sinh tùy chỉnh, bảo mật, có độ trễ thấp và độ chính xác cao bằng cách kết hợp thông tin theo ngữ cảnh từ các nguồn dữ liệu của chính khách hàng. Cơ sở kiến thức hỗ trợ các nguồn dữ liệu khác nhau, bao gồm S3 và Confluence, Salesforce và SharePoint, trong bản xem trước. Cơ sở kiến thức cũng cung cấp khả năng tải nhập tài liệu để truyền liên tục dữ liệu. Cơ sở kiến thức Bedrock chuyển đổi dữ liệu phi cấu trúc thành các phần nhúng, lưu trữ trong cơ sở dữ liệu véc-tơ và cho phép truy xuất từ các kho dữ liệu đa dạng. Cơ sở kiến thức cũng tích hợp với Kendra để truy xuất có quản lý và hỗ trợ truy xuất dữ liệu có cấu trúc bằng khả năng chuyển ngôn ngữ tự nhiên thành SQL.

Tính năng Tự động hóa dữ liệu của Amazon Bedrock giúp chuyển đổi nội dung đa phương thức, phi cấu trúc thành các định dạng dữ liệu có cấu trúc cho các trường hợp sử dụng như xử lý tài liệu thông minh, phân tích video và RAG. Tính năng Tự động hóa dữ liệu của Bedrock có thể tạo nội dung Đầu ra tiêu chuẩn bằng cách sử dụng các cài đặt mặc định được xác định trước dành cho phương thức cụ thể, ví dụ như mô tả từng cảnh của video, bản chép lời âm thanh hoặc phân tích tài liệu tự động. Khách hàng cũng có thể tạo Đầu ra tùy chỉnh bằng cách chỉ định yêu cầu về đầu ra trong Kế hoạch chi tiết dựa trên lược đồ dữ liệu của riêng mình mà sau đó họ có thể dễ dàng tải vào cơ sở dữ liệu hoặc kho dữ liệu hiện có. Thông một tiện ích tích hợp với Cơ sở kiến thức, tính năng Tự động hóa dữ liệu của Bedrock cũng có thể được sử dụng để phân tích cú pháp nội dung cho các ứng dụng RAG, cải thiện độ chính xác và mức độ liên quan của kết quả bằng cách bao gồm thông tin được nhúng trong cả hình ảnh và văn bản.

Tác tử Amazon Bedrock cung cấp cho bạn khả năng xây dựng và cấu hình các tác tử tự trị trong ứng dụng của mình. Những tác tử này sẽ kết nối an toàn với các nguồn dữ liệu của công ty bạn và tăng cường yêu cầu của người dùng với thông tin phù hợp để tạo ra phản hồi chính xác. Bạn có thể tạo ứng dụng một tác tử hoặc nhiều tác tử chỉ với vài bước đơn giản, đẩy nhanh thời gian cần thiết để xây dựng các ứng dụng AI tạo sinh. Các tác tử này hỗ trợ giải thích mã để tự động tạo và thực thi mã cũng như trả về quyền kiểm soát, cho phép bạn xác định một lược đồ hành động và lấy lại quyền kiểm soát bất cứ khi nào tác tử gọi hành động. Ngoài ra, Tác tử của Amazon Bedrock có thể giữ lại bộ nhớ qua các tương tác, cung cấp trải nghiệm người dùng được cá nhân hóa và liền mạch hơn.

Luồng Amazon Bedrock là tính năng tạo và thực thi quy trình làm việc của Bedrock cho các ứng dụng AI tạo sinh. Tính năng này tăng tốc cho quá trình tạo, kiểm thử và triển khai các quy trình làm việc AI tạo sinh do người dùng xác định thông qua trình dựng trực quan và một bộ API. Tính năng này cũng cho phép bạn liên kết liền mạch các mô hình nền tảng mới nhất, Câu lệnh, Tác tử, Cơ sở kiến thức, Quy tắc bảo vệ và các dịch vụ AWS (chẳng hạn như Amazon Lex, AWS Lambda, Amazon S3) cùng với logic kinh doanh để xây dựng quy trình làm việc AI tạo sinh. Bạn có thể dễ dàng kiểm thử và lập phiên bản quy trình làm việc của mình và chạy trong môi trường phi máy chủ an toàn thông qua giao diện trực quan hoặc API mà không cần phải xây dựng cơ sở hạ tầng riêng.

Đánh giá mô hình: Với tính năng đánh giá mô hình của Amazon Bedrock, bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết mức tối thiểu về số lượng câu lệnh hoặc phản hồi . Đối với đánh giá tự động (theo lập trình), bạn chỉ trả tiền cho suy luận từ lựa chọn mô hình của bạn trong đánh giá. Điểm số thuật toán được tạo tự động được cung cấp mà không tính thêm phí. Trong Bản xem trước công khai cho đánh giá tự động (Mô hình/LLM-as-a-judge (LLM làm công cụ đánh giá)), bạn chỉ trả tiền cho suy luận từ mô hình trình tạo và mô hình trình đánh giá mà bạn chọn. Trong tác vụ đánh giá mô hình LLM-as-a-judge (LLM làm công cụ đánh giá), các chỉ số tích hợp sẵn sử dụng mẫu câu lệnh đánh giá của hệ thống dành riêng cho từng chỉ số và mô hình đánh giá có sẵn, sẽ bị tính phí trong mức sử dụng token của bạn. Các câu lệnh đánh giá cũng có sẵn trong tài liệu AWS công khai để đảm bảo tính minh bạch. Đối với đánh giá của con người, trong đó bạn sử dụng nhóm làm việc riêng của mình, bạn sẽ bị tính phí suy luận mô hình trong quá trình đánh giá và khoản phí 0,21 USD cho mỗi nhiệm vụ do người hoàn thành. Tác vụ của con người được định nghĩa là việc một phiên bản nhân viên con người gửi bản đánh giá về một lời nhắc duy nhất cùng các phản hồi suy luận liên quan trong giao diện người dùng đánh giá của con người. Giá cả giống nhau cho dù bạn có một hay hai mô hình trong công việc đánh giá, và cũng giống nhau bất kể bạn đưa vào bao nhiêu số liệu đánh giá và phương pháp xếp hạng. Phí cho các tác vụ của con người sẽ xuất hiện trong phần Amazon SageMaker trong hóa đơn AWS của bạn và giống nhau đối với tất cả Khu vực AWS. Không có phí riêng cho lực lượng lao động, vì lực lượng lao động do chính bạn cung cấp. Đối với đánh giá do AWS quản lý, giá được tùy chỉnh cho nhu cầu đánh giá của bạn trong một tương tác riêng tư khi làm việc với nhóm đánh giá chuyên gia AWS.

Đánh giá cơ sở kiến thức của Amazon Bedrock (đánh giá RAG): Với Đánh giá cơ sở kiến thức của Amazon Bedrock (đánh giá RAG), bạn chỉ trả tiền cho những gì bạn sử dụng mà không cần cam kết mức tối thiểu về số lượng câu lệnh hoặc phản hồi. Trong Bản xem trước công khai, bạn chỉ trả tiền cho suy luận từ mô hình trình tạo và mô hình trình đánh giá mà bạn chọn (tác vụ đánh giá sử dụng LLM-as-a-judge (LLM làm công cụ đánh giá)), cũng như bất kỳ khoản phí nào phát sinh từ việc sử dụng Cơ sở kiến thức trong tác vụ đánh giá theo định giá cho Cơ sở kiến thức của Amazon Bedrock. Trong tác vụ Đánh giá cơ sở kiến thức (đánh giá RAG), các chỉ số tích hợp sẵn sử dụng mẫu câu lệnh đánh giá của hệ thống dành riêng cho từng chỉ số và mô hình đánh giá có sẵn, sẽ bị tính phí trong mức sử dụng token của bạn. Các câu lệnh đánh giá cũng có sẵn trong tài liệu AWS công khai để đảm bảo tính minh bạch. Một vài chỉ số bao hàm quá trình suy luận mô hình đánh giá trên ngữ cảnh được truy xuất từ Cơ sở kiến thức hoặc các câu trả lời đúng của bạn ngoài câu lệnh đầu vào, điều này ảnh hưởng đến chi phí liên quan đến từng chỉ số – bạn có thể tìm thêm thông tin về từng chỉ số trong tài liệu AWS công khai về đánh giá.

Chi tiết định giá

Mức giá phụ thuộc vào phương thức, nhà cung cấp và mô hình. Vui lòng chọn nhà cung cấp mô hình để xem mức giá chi tiết.

Amazon Bedrock cung cấp các mô hình nền tảng (FM) được chọn lọc từ những nhà cung cấp AI hàng đầu như Anthropic, Meta, Mistral AI và Amazon để suy luận hàng loạt với mức giá thấp hơn 50% so với giá suy luận theo yêu cầu. Vui lòng tham khảo danh sách mô hình tại đây.

  • AI21 Labs
  • AI21 Labs

    Định giá theo nhu cầu

    Mô hình của AI21 Labs Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra
    Jamba 1.5 Large 0,002 USD 0,008 USD
    Jamba 1.5 Mini 0,0002 USD 0,0004 USD
    Jurassic-2 Mid 0,0125 USD 0,0125 USD
    Jurassic-2 Ultra 0,0188 USD 0,0188 USD
    Jamba-Instruct 0,0005 USD 0,0007 USD
  • Amazon
    • Amazon Nova
    • Amazon Nova

      Định giá cho Mô hình hiểu biết

      Định giá cho các mô hình Tạo nội dung sáng tạo

    • Amazon Titan
    • Amazon Titan

    • Amazon khác
  • Anthropic
  • Anthropic

    Định giá theo nhu cầu và theo loạt

    Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

    Mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt) Giá cho mỗi 1.000 token đầu vào (ghi bộ nhớ đệm) Giá cho mỗi 1.000 token đầu vào (đọc bộ nhớ đệm)

    Claude 3.5 Sonnet**
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD

    0,0003 USD

    Claude 3.5 Haiku
     

    0,0008 USD

    0,004 USD

    0,0005 USD

    0,0025 USD

    0,001 USD

    0,00008 USD

    Claude 3 Opus*
     

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

    Không áp dụng

    Không áp dụng

    Claude 3 Haiku
     

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Không áp dụng

    Không áp dụng

    Claude 3 Sonnet
     

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    Không áp dụng

    Không áp dụng

    Claude 2.1
     

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

    Không áp dụng

    Không áp dụng

    Claude 2.0
     

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

    Không áp dụng

    Không áp dụng

    Claude Instant
     

    0,0008 USD

    0,0024 USD

    Không áp dụng

    Không áp dụng

    Không áp dụng

    Không áp dụng
    *Claude 3 Opus hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)
    **Định giá cho Claude 3.5 Sonnet áp dụng cho từng phiên bản của Claude 3.5 Sonnet (v1 và v2) – Claude 3.5 Sonnet v2 hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)
    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt) Giá cho mỗi 1.000 token đầu vào (ghi bộ nhớ đệm) Giá cho mỗi 1.000 token đầu vào (đọc bộ nhớ đệm)

    Claude 3.5 Sonnet**

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

    0,00375 USD 0,0003 USD

    Claude 3.5 Haiku

    0,001 USD

    0,005 USD

    0,0005 USD

    0,0025 USD

    0,001 USD 0,00008 USD

    Claude 3 Opus*

    0,015 USD

    0,075 USD

    0,0075 USD

    0,0375 USD

       

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

       

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

       

    Claude 2.1

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

       

    Claude 2.0

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

       

    Claude Instant

    0,0008 USD

    0,0024 USD

    Không áp dụng

    Không áp dụng

       
    *Claude 3 Opus hiện đã có ở Khu vực Miền Tây Hoa Kỳ (Oregon)    
    **Giá cho Claude 3.5 Sonnet áp dụng cho từng phiên bản của Claude 3.5 Sonnet (v1 và v2) - Claude 3.5 Sonnet v2 hiện được cung cấp ở Khu vực Miền Tây Hoa Kỳ (Oregon)    

    Khu vực: Châu Âu (London)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD 0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

    0,000625 USD

    Khu vực: Châu Âu (Zurich)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Khu vực: Nam Mỹ (Sao Paolo)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

    0,0075 USD

     

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

     

    Khu vực: Canada (Miền Trung)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Khu vực: Châu Á Thái Bình Dương (Mumbai)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Khu vực: Châu Á Thái Bình Dương (Sydney)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Khu vực: Châu Á Thái Bình Dương (Tokyo)

    Mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude Instant

    0,0008 USD

    0,0024 USD

    Không áp dụng

     

    Không áp dụng

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Khu vực: Châu Á Thái Bình Dương (Singapore)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude Instant

    0,0008 USD

    0,0024 USD

    0,0004 USD

     

    0.0012 USD

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    0,004 USD

     

    0,012 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    Không áp dụng

    Không áp dụng

    Khu vực: Châu Âu (Paris)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Khu vực: Châu Âu (Frankfurt)

    Mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude Instant

    0,0008 USD

    0,0024 USD

    Không áp dụng

    Không áp dụng

    Claude 2.0/2.1

    0,008 USD

    0,024 USD

    Không áp dụng

    Không áp dụng

    Claude 3 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    0,0015 USD

     

    0,0075 USD

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    0,000125 USD

     

    0,000625 USD

    Khu vực: Châu Á Thái Bình Dương (Seoul)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    Không áp dụng

     

    Không áp dụng

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    Không áp dụng

     

    Không áp dụng

    Khu vực: Miền Đông Hoa Kỳ (Ohio)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra Giá cho mỗi 1.000 mã thông báo đầu vào (theo loạt) Giá cho mỗi 1.000 token đầu ra (theo loạt)

    Claude 3.5 Sonnet

    0,003 USD

    0,015 USD

    Không áp dụng

     

    Không áp dụng

    Claude 3 Haiku

    0,00025 USD

    0,00125 USD

    Không áp dụng

     

    Không áp dụng

    Khu vực: AWS GovCloud (Miền Tây Hoa Kỳ) và AWS GovCloud (Miền Đông Hoa Kỳ)

    Các mô hình của Anthropic Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra

    Claude 3.5 Sonnet

    0,0036 USD

    0,018 USD

    Claude 3 Haiku

    0,0003 USD

    0,0015 USD

    Suy luận tối ưu hóa độ trễ

    Khu vực: Miền Đông Hoa Kỳ (Ohio)

      Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra
    Claude 3.5 Haiku 0,001 USD 0,005 USD

    Định giá thông lượng được cung cấp

    Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

    Mô hình của Anthropic Giá mỗi giờ cho mỗi mô hình
    không có cam kết
    Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Mô hình của Anthropic Giá mỗi giờ cho mỗi mô hình
    không có cam kết
    Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Claude Instant

    44,00 USD

    39,60 USD

    22,00 USD

    Claude 2.0/2.1

    70,00 USD

    63,00 USD

    35,00 USD

    Khu vực: Châu Á Thái Bình Dương (Tokyo)

    Mô hình của Anthropic Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Claude Instant

    53,00 USD

    29,00 USD

    Claude 2.0/2.1

    86,00 USD

    48,00 USD

    Khu vực: Châu Âu (Frankfurt)

    Mô hình của Anthropic Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Claude Instant

    49,00 USD

    27,00 USD

    Claude 2.0/2.1

    79,00 USD

    44,00 USD

    Vui lòng liên hệ với đội ngũ phụ trách tài khoản AWS của bạn để biết thêm thông tin chi tiết về các đơn vị mô hình. 

     

  • Cohere
  • Cohere

    Định giá theo nhu cầu

    Mô hình của Cohere Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra
    Command 0,0015 USD 0,0020 USD
    Command-Light 0,0003 USD 0,0006 USD
    Command R+ 0,0030 USD 0,0150 USD
    Command R 0,0005 USD 0,0015 USD
    Embed – tiếng Anh 0,0001 USD Không áp dụng
    Embed – Đa ngôn ngữ 0,0001 USD Không áp dụng
    Mô hình của Cohere Giá cho mỗi 1.000 truy vấn**
    Rerank 3.5 2,00 USD
    **Bạn bị tính phí cho số truy vấn, trong đó mỗi truy vấn có thể chứa tối đa 100 khúc tài liệu. Nếu truy vấn chứa hơn 100 khúc tài liệu, thì sẽ được tính là nhiều truy vấn. Ví dụ: nếu một yêu cầu chứa 350 tài liệu, yêu cầu đó sẽ được coi là 4 truy vấn. Xin lưu ý rằng mỗi tài liệu chỉ có thể chứa tối đa 500 token (bao gồm truy vấn và tổng số token của tài liệu) và nếu độ dài token lớn hơn 512 token, thì sẽ được chia thành nhiều tài liệu.

    Định giá tùy chỉnh (tinh chỉnh)

    Mô hình của Cohere Giá đào tạo 1.000 token Giá để lưu trữ từng mô hình tùy chỉnh mỗi tháng Giá suy luận từ mô hình tùy chỉnh cho mỗi đơn vị mô hình mỗi giờ (với cách định giá Thông lượng được cung cấp không cam kết)

    Cohere Command

    0,004 USD

    1,95 USD

    49,50 USD

    Cohere Command-Light 0,001 USD

    1,95 USD

    8,56 USD

    *Tổng số token được đào tạo = số token trong kho dữ liệu đào tạo x số giai đoạn

    Giá của thông lượng được cung cấp

    Mô hình của Cohere Giá mỗi giờ cho mỗi mô hình 
    không có cam kết
    Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng

    Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Cohere Command

    49,50 USD

    39,60 USD

    23,77 USD

    Cohere Command – Light 8,56 USD

    6,85 USD

    4,11 USD
    Embed – tiếng Anh 7,12 USD

    6,76 USD

    6,41 USD
    Embed – Đa ngôn ngữ 7,12 USD

    6,76 USD

    6,41 USD

    Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình. 

  • Meta Llama
  • Meta Llama

    Llama 3.3

    Định giá theo nhu cầu và theo loạt

    Llama 3.2

    Định giá theo nhu cầu và theo loạt

    Llama 3.1

    Định giá theo nhu cầu và theo loạt

    Định giá tùy chỉnh mô hình (tinh chỉnh)

    Định giá Thông lượng được cung cấp

    Llama 3

    Định giá theo nhu cầu

    Llama 2

    Định giá theo nhu cầu

    Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

    Mô hình của Meta Giá cho mỗi 1.000 token đầu vào Giá cho mỗi 1.000 token đầu ra

    Llama 2 Chat (13B)

    0,00075 USD

    0,001 USD

    Llama 2 Chat (70B)

    0,00195 USD

    0,00256 USD

    Định giá tùy chỉnh mô hình (tinh chỉnh)

    Mô hình của Meta Giá đào tạo 1.000 token Giá lưu trữ từng mô hình tùy chỉnh* mỗi tháng Giá suy luận từ mô hình tùy chỉnh cho 1 đơn vị mô hình mỗi giờ (với cách định giá Thông lượng được cung cấp không cam kết)

    Llama 2 Pretrained (13B)

    0,00149 USD

    1,95 USD

    23,50 USD

    Llama 2 Pretrained (70B)

    0,00799 USD

    1,95 USD 23,50 USD

    *Lưu trữ mô hình tùy chỉnh = 1,95 USD

    Giá của thông lượng được cung cấp

    Mô hình của Meta Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng

    Llama 2 Pretrained và Chat (13B)

    21,18 USD

    13,08 USD

    Llama 2 Pretrained (70B)

    21,18 USD

    13,08 USD

    *Các mô hình Llama 2 Pre-trained chỉ được cung cấp trong thông lượng được cung cấp sau khi tùy chỉnh. 

    Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình.

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    Định giá theo nhu cầu

    Mô hình của Stability AI Giá cho mỗi hình ảnh được tạo
    Stable Diffusion 3.5 Large 0,08 USD
    Stable Image Core 0,04 USD
    Stable Diffusion 3 Large 0,08 USD
    Stable Image Ultra 0,14 USD

    Khả năng tạo mô hình hình ảnh trước đây do Stability AI cung cấp được định giá cho mỗi hình ảnh, tùy thuộc vào số bước và độ phân giải hình ảnh.

    Mô hình của Stability AI Độ phân giải hình ảnh Giá cho mỗi hình ảnh được tạo với chất lượng tiêu chuẩn (từ 50 bước trở xuống) Giá cho mỗi hình ảnh được tạo với chất lượng cao (trên 50 bước)
    SDXL 1.0 Tối đa 1024 x 1024 0,04 USD 0,08 USD

    Giá của thông lượng được cung cấp

    Mô hình của Stability AI Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 1 tháng* Giá mỗi giờ cho mỗi đơn vị mô hình có cam kết 6 tháng*

    SDXL 1.0

    49,86 USD

    46,18 USD

    *Bao gồm suy luận cho các mô hình cơ sở và tùy chỉnh

    Vui lòng liên hệ với đội ngũ tài khoản hoặc bán hàng của AWS để biết thêm thông tin chi tiết về các đơn vị mô hình.

    Hiện tại, tính năng tùy chỉnh mô hình (tinh chỉnh) không được hỗ trợ cho các mô hình của Stability AI trên Amazon Bedrock.

  • Nhập mô hình tùy chỉnh
  • Nhập mô hình tùy chỉnh

    • Llama
    • Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

      Phiên bản đơn vị mô hình tùy chỉnh v1.0
      Giá cho mỗi đơn vị mô hình tùy chỉnh/phút* 0,0785 USD
      Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh 1,95 USD
       
      Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Llama 3.1 8B 128K yêu cầu 2 Đơn vị mô hình tùy chỉnh, mô hình Llama 3.1 70B 128k yêu cầu 8 Đơn vị mô hình tùy chỉnh.
      *Được tính phí theo mỗi khoảng thời gian 5 phút
    • Llama đa phương thức
    • Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

      Phiên bản đơn vị mô hình tùy chỉnh v1.0
      Giá cho mỗi đơn vị mô hình tùy chỉnh/phút* 0,0785 USD
      Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh 1,95 USD
       
      Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Llama 3.2 11B 128K yêu cầu 4 Đơn vị mô hình tùy chỉnh.
      *Được tính phí theo mỗi khoảng thời gian 5 phút
    • Mistral
    • Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

      Phiên bản đơn vị mô hình tùy chỉnh v1.0
      Giá cho mỗi đơn vị mô hình tùy chỉnh/phút* 0,0785 USD
      Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh 1,95 USD
       
      Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Mistral 7B 32K yêu cầu 1 Đơn vị mô hình tùy chỉnh.
      *Được tính phí theo mỗi khoảng thời gian 5 phút
    • Mixtral
    • Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

      Phiên bản đơn vị mô hình tùy chỉnh v1.0
      Giá cho mỗi đơn vị mô hình tùy chỉnh/phút* 0,0785 USD
      Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh 1,95 USD
       
      Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Mixtral 8x7B 32K yêu cầu 4 Đơn vị mô hình tùy chỉnh.
      *Được tính phí theo mỗi khoảng thời gian 5 phút
    • Flan
    • Khu vực: Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon)

      Phiên bản đơn vị mô hình tùy chỉnh v1.0
      Giá cho mỗi đơn vị mô hình tùy chỉnh/phút* 0,0785 USD
      Chi phí lưu trữ hàng tháng cho mỗi đơn vị mô hình tùy chỉnh 1,95 USD
       
      Các đơn vị mô hình tùy chỉnh cần thiết để lưu trữ một mô hình phụ thuộc vào nhiều yếu tố - đặc biệt là kiến trúc mô hình, số lượng tham số mô hình và độ dài ngữ cảnh. Số lượng chính xác các đơn vị mô hình tùy chỉnh cần thiết sẽ được xác định tại thời điểm nhập. Ví dụ, mô hình Flan-T5 XL 512 yêu cầu 1 Đơn vị mô hình tùy chỉnh. 
      *Được tính phí theo mỗi khoảng thời gian 5 phút

    Định giá suy luận theo nhu cầu:
    Bạn sẽ bị tính phí theo các khoảng thời gian 5 phút cho thời gian bản sao mô hình của bạn hoạt động, bắt đầu từ lệnh gọi thành công đầu tiên. Giới hạn thông lượng và chạy đồng thời tối đa cho mỗi bản sao mô hình phụ thuộc vào các yếu tố như hỗn hợp token đầu vào/đầu ra, loại phần cứng, kích cỡ mô hình, kiến trúc, việc tối ưu hóa suy luận và được xác định trong quy trình nhập mô hình.

    Bedrock tự động điều chỉnh quy mô số lượng bản sao mô hình tùy thuộc vào kiểu sử dụng của bạn. Nếu không có lệnh gọi trong khoảng thời gian 5 phút, Bedrock sẽ giảm quy mô theo tài nguyên xuống 0 và tăng quy mô trở lại khi bạn gọi mô hình của mình. Trong khi tăng quy mô trở lại, bạn có thể gặp phải thời gian khởi động nguội (khoảng vài chục giây) tùy thuộc vào kích cỡ mô hình. Bedrock cũng tăng số lượng bản sao mô hình nếu khối lượng suy luận của bạn liên tục vượt quá giới hạn chạy đồng thời của một bản sao mô hình. Lưu ý: Theo mặc định, có thể tăng đến tối đa 3 bản sao mô hình thông qua Hạn mức dịch vụ cho mỗi tài khoản trên mỗi mô hình được nhập.

Công cụ định giá (chi tiết)

  • Luồng
  • Luồng Amazon Bedrock

    Chi phí được tính dựa trên số lượng chuyển tiếp nút cần thiết để thực thi ứng dụng của bạn. Luồng Bedrock đếm một chuyển tiếp nút mỗi khi một nút trong quy trình làm việc của bạn được thực thi. Bạn phải trả phí theo tổng số lần chuyển tiếp nút trên tất cả luồng.

    Tất cả phí được tính theo ngày và lập hóa đơn theo tháng, bắt đầu từ ngày 1 tháng 2 năm 2025.

    Giá cho mỗi 1.000 lần chuyển tiếp nút
    0,035 USD

    Phụ phí

    Bạn có thể phải trả thêm phí nếu việc thực thi của quy trình làm việc ứng dụng của bạn sử dụng các dịch vụ AWS khác hoặc truyền dữ liệu. Ví dụ: nếu quy trình làm việc của bạn gọi chính sách Quy tắc bảo vệ của Amazon Bedrock, bạn sẽ phải trả phí cho số đơn vị văn bản được xử lý bởi chính sách. 

  • Cơ sở kiến thức
  • Truy xuất dữ liệu có cấu trúc (Tạo SQL)

    Truy xuất dữ liệu có cấu trúc được tính phí cho mỗi yêu cầu tạo truy vấn SQL. Truy vấn SQL được tạo sẽ dùng để truy xuất dữ liệu từ các kho chứa dữ liệu có cấu trúc.

    Các mô hình Rerank

    Các mô hình Rerank được thiết kế để cải thiện mức độ liên quan và độ chính xác của các phản hồi trong các ứng dụng Tạo có kết hợp truy xuất thông tin ngoài (RAG). Chúng được tính phí trên mỗi truy vấn.

    **Bạn bị tính phí cho số truy vấn, trong đó mỗi truy vấn có thể chứa tối đa 100 khúc tài liệu. Nếu truy vấn chứa hơn 100 khúc tài liệu, thì sẽ được tính là nhiều truy vấn. Ví dụ: nếu một yêu cầu chứa 350 tài liệu, yêu cầu đó sẽ được coi là 4 truy vấn. Xin lưu ý rằng mỗi tài liệu chỉ có thể chứa tối đa 512 token (bao gồm truy vấn và tổng số token của tài liệu) và nếu độ dài token lớn hơn 512 token, thì sẽ được chia thành nhiều tài liệu. Một truy vấn tương đương với một đơn vị tìm kiếm.

  • Quy tắc bảo vệ
  • Quy tắc bảo vệ của Amazon Bedrock

    Chính sách quy tắc bảo vệ*

    Giá mỗi 1.000 đơn vị văn bản**

    Bộ lọc nội dung (nội dung văn bản)****

    0,15 USD

    Chủ đề bị từ chối

    0,15 USD

    Kiểm tra nền tảng theo ngữ cảnh***

    0,1 USD

    Bộ lọc thông tin nhạy cảm (PII)

    0,1 USD

    Bộ lọc thông tin nhạy cảm (biểu thức chính quy) 

    Miễn phí

    Bộ lọc từ

    Miễn phí

    Định giá theo nhu cầu

    * Mỗi chính sách quy tắc bảo vệ đều không bắt buộc và có thể được kích hoạt dựa trên các yêu cầu của ứng dụng. Phí sẽ được tính dựa trên loại chính sách dùng trong quy tắc bảo vệ. Ví dụ: nếu quy tắc bảo vệ được cấu hình theo bộ lọc nội dung và chủ đề bị từ chối, thì hai chính sách này sẽ bị tính phí, đồng thời sẽ không có khoản phí nào liên quan đến các bộ lọc thông tin nhạy cảm.

    **Một đơn vị văn bản có thể chứa lên đến 1000 ký tự. Nếu văn bản đầu vào nhiều hơn 1000 ký tự, thì dữ liệu đó được xử lý dưới dạng nhiều đơn vị văn bản, mỗi đơn vị chứa 1000 ký tự trở xuống. Ví dụ: nếu đầu vào văn bản chứa 5600 ký tự thì sẽ bị tính phí 6 đơn vị văn bản.

    ***Kiểm tra nền tảng theo ngữ cảnh sử dụng nguồn tham chiếu và truy vấn để xác định xem phản hồi của mô hình có dựa trên nguồn tham chiếu và có liên quan đến truy vấn hay không. Tổng số đơn vị văn bản tính phí được tính bằng cách kết hợp tất cả các ký tự trong nguồn tham chiếu, truy vấn và phản hồi của mô hình. 

    ****Định giá cho các bộ lọc nội dung để phát hiện và lọc nội dung hình ảnh độc hại sẽ được công bố khi tính năng này được cung cấp rộng rãi.

  • Đánh giá mô hình
  • Đánh giá mô hình

    Đánh giá mô hình được tính phí cho hoạt động suy luận từ mô hình mà bạn chọn. Điểm số thuật toán được tạo tự động được cung cấp mà không tính thêm phí. Đối với đánh giá của con người, trong đó bạn sử dụng luồng công việc riêng của mình, bạn sẽ bị tính phí suy luận mô hình trong quá trình đánh giá và khoản phí 0,21 USD cho mỗi nhiệm vụ do người hoàn thành.

    Model

    Giá cho mỗi 1.000 mã thông báo đầu vào

    Giá cho mỗi 1.000 token đầu ra

    Giá cho mỗi tác vụ của con người

     

    Mô hình được chọn để đánh giá

    Dựa trên mô hình được chọn

    Dựa trên mô hình được chọn

     

    0,21 USD

     
  • Tự động hóa dữ liệu
  • Tự động hóa dữ liệu

    • Cơ sở kiến thức dành cho Amazon Bedrock cung cấp tích hợp Tự động hóa dữ liệu của Bedrock để cung cấp các phản hồi có liên quan và chính xác hơn cho dữ liệu đa phương thức. Khi thiết lập Cơ sở kiến thức, bạn có thể chọn Tự động hóa dữ liệu của Bedrock làm phương pháp phân tích cú pháp để phân tích và trích xuất thông tin chuyên sâu có ý nghĩa từ hình ảnh hoặc tài liệu, có thể bao gồm các số liệu, biểu đồ và sơ đồ. Trong quá trình xử lý, Tự động hóa dữ liệu của Bedrock trích xuất thông tin hữu ích từ các tài liệu và hình ảnh đã tải nhập, sau đó được sử dụng trong các bước Cơ sở kiến thức tiếp theo để phân đoạn, nhúng và lưu trữ. Khi được tích hợp với Cơ sở kiến thức, Tự động hóa dữ liệu của Bedrock cung cấp và tính phí cho đầu ra chuẩn hóa.

Ví dụ về định giá

  • Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Jurrasic-2 Mid của AI21 để tóm tắt đầu vào gồm 10000 token văn bản đầu vào thành đầu ra gồm 2000 token.

    Tổng chi phí phát sinh = 10000 token/1000 * 0,0125 USD + 2000 token/1000 * 0,0125 USD = 0,15 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Amazon Titan Text Lite để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 1.000 token.

    Tổng chi phí phát sinh hàng giờ = 2.000 token/1.000 * 0,0003 USD + 1.000 token/1.000 * 0,0004 USD = 0,001 USD.

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình cơ sở của Trình tạo hình ảnh Amazon Titan để tạo 1000 hình ảnh cỡ 1024 x 1024 với chất lượng tiêu chuẩn.

    Tổng chi phí phát sinh = 1.000 hình ảnh * 0,01 USD trên mỗi hình ảnh = 10 USD

    Giá tùy chỉnh (tinh chỉnh và đào tạo trước liên tục)

    Nhà phát triển ứng dụng tùy chỉnh mô hình Trình tạo hình ảnh Amazon Titan bằng 1000 cặp hình ảnh – văn bản. Sau khi đào tạo, nhà phát triển sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (kỳ hạn cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

    Chi phí hàng tháng phát sinh cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,005 USD * 500 * 64), trong đó 0,005 USD là giá mỗi hình ảnh nhìn thấy, 500 là số bước và 64 là kích cỡ loạt + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Giá của thông lượng được cung cấp

    Nhà phát triển ứng dụng mua hai đơn vị mô hình Amazon Titan Text Express với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

    Tổng chi phí phát sinh hàng tháng = 2 đơn vị mô hình * 18,40 USD/giờ * 24 giờ * 31 ngày = 27.379,20 USD

    Nhà phát triển ứng dụng mua một đơn vị mô hình của mô hình Trình tạo hình ảnh Amazon Titan cơ sở với cam kết 1 tháng.

    Tổng chi phí phát sinh = 1 đơn vị mô hình * 16,2 USD * 24 giờ * 31 ngày = 12.052,8 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock trong Khu vực Miền Tây Hoa Kỳ (Oregon): yêu cầu tới mô hình Claude của Anthropic để tóm tắt đầu vào gồm 11.000 token văn bản đầu vào thành đầu ra gồm 4.000 token.

    Tổng chi phí phát sinh = 11.000 token/1000 * 0,008 USD + 4.000 token/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Giá của thông lượng được cung cấp

    Nhà phát triển ứng dụng mua một đơn vị mô hình Claude Instant của Anthropic trong Khu vực Miền Tây Hoa Kỳ (Oregon):

    Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 39,6 USD * 24 giờ * 31 ngày = 29.462,4 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Command của Cohere để tóm tắt đầu vào gồm 6.000 token văn bản đầu vào thành đầu ra gồm 2.000 token.

    Tổng chi phí phát sinh = 6.000 token/1.000 * 0,0015 USD + 2.000 token/1.000 * 0,0020 USD = 0,013 USD

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Command – Light của Cohere để tóm tắt đầu vào gồm 6.000 token văn bản đầu vào thành đầu ra gồm 2.000 token.

    Tổng chi phí phát sinh = 6.000 token/1000 * 0,0003 USD + 2.000 token/1000 * 0,0006 USD = 0,003 USD

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Embed tiếng Anh hoặc đa ngôn ngữ của Cohere để tạo ra các phần nhúng cho 10000 token đầu vào.

    Tổng chi phí phát sinh = 10000 token/1000 * 0,0001 USD = 0,001 USD

    Giá tùy chỉnh (tinh chỉnh)

    Nhà phát triển ứng dụng tùy chỉnh mô hình Command của Cohere bằng 1000 token dữ liệu. Sau khi đào tạo, hãy sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

    Chi phí phát sinh hàng tháng cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,004 USD * 1000) + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (49,5 USD) = 55,45 USD

    Chi phí phát sinh hàng tháng cho thông lượng được cung cấp (cam kết 1 tháng) của mô hình tùy chỉnh = 39,6 USD

    Giá của thông lượng được cung cấp

    Nhà phát triển ứng dụng mua một đơn vị mô hình Command của Cohere với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

    Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 39,6 USD * 24 giờ * 31 ngày = 29.462,4 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình Llama 2 Chat (13B) của Meta để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 500 token.

    Tổng chi phí phát sinh = 2.000 token/1000 * 0,00075 USD + 500 token/1000 * 0,001 USD = 0,002 USD

    Giá tùy chỉnh (tinh chỉnh)

    Nhà phát triển ứng dụng tùy chỉnh mô hình Llama 2 Pre-trained (70B) bằng 1000 token dữ liệu. Sau khi đào tạo, hãy sử dụng thông lượng được cung cấp của mô hình tùy chỉnh trong 1 giờ để đánh giá hiệu năng của mô hình. Mô hình đã tinh chỉnh được lưu trữ trong 1 tháng. Sau khi đánh giá, nhà phát triển sử dụng thông lượng được cung cấp (cam kết 1 tháng) để lưu trữ mô hình tùy chỉnh.

    Chi phí phát sinh hàng tháng cho hoạt động tinh chỉnh = đào tạo tinh chỉnh (0,00799 USD * 1000) + lưu trữ mô hình tùy chỉnh mỗi tháng (1,95 USD) + 1 giờ suy luận mô hình tùy chỉnh (23,5 USD) = 33,44 USD

    Chi phí phát sinh hàng tháng cho thông lượng được cung cấp (cam kết 1 tháng) của mô hình tùy chỉnh = 21,18 USD

    Giá của thông lượng được cung cấp

    Nhà phát triển ứng dụng mua một đơn vị mô hình Llama 2 của Meta với cam kết 1 tháng cho trường hợp sử dụng tóm tắt văn bản của họ.

    Tổng chi phí phát sinh hàng tháng = 1 đơn vị mô hình * 21,18 USD * 24 giờ * 31 ngày = 15.757,92 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mistral 7B để tóm tắt đầu vào gồm 2.000 token văn bản đầu vào thành đầu ra gồm 1000 token.

    Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,00015 USD + 1000 token/1.000 * 0,0002 USD = 0,0005 USD

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mixtral 8x7B để tóm tắt đầu vào gồm 2000 token văn bản đầu vào thành đầu ra gồm 1000 token.

    Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,00045 USD + 1000 token/1000 * 0,0007 USD = 0,0016 USD

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock mỗi giờ: yêu cầu tới mô hình Mistral Large để tóm tắt dữ liệu đầu vào gồm 2000 token văn bản đầu vào thành đầu ra gồm 1000 token. 

    Tổng chi phí phát sinh hàng giờ = 2000 token/1000 * 0,008 USD + 1000 token/1.000 * 0,024 USD = 0,04 USD

  • Định giá theo nhu cầu

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình SDXL để tạo hình ảnh cỡ 512 x 512 với kích thước bước là 70 (chất lượng cao).

    Tổng chi phí phát sinh = 1 hình ảnh * 0,036 USD mỗi hình ảnh = 0,036 USD

    Nhà phát triển ứng dụng thực hiện các lệnh gọi API sau tới Amazon Bedrock: yêu cầu tới mô hình SDXL 1.0 để tạo hình ảnh cỡ 1024 x 1024 với kích thước bước là 70 (chất lượng cao).

    Tổng chi phí phát sinh = 1 hình ảnh * 0,08 USD mỗi hình ảnh = 0,08 USD

    Giá của thông lượng được cung cấp

    Nhà phát triển ứng dụng mua một đơn vị mô hình của SDXL 1.0 với cam kết 1 tháng.

    Tổng chi phí phát sinh = 1 * 49,86 USD * 24 giờ * 31 ngày = 37.095,84 USD

  • Ví dụ về đánh giá mô hình 1:

    Định giá theo nhu cầu
    Nhà phát triển ứng dụng gửi tập dữ liệu dành cho đánh giá mô hình do con người thực hiện bằng Anthropic Claude 2.1 và Anthropic Claude Instant tại Khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia).

    Tập dữ liệu này chứa 50 câu lệnh và nhà phát triển yêu cầu một nhân viên đánh giá mỗi tập hợp phản hồi-câu lệnh (có thể cấu hình trong quá trình tạo công việc đánh giá dưới dạng thông số “nhân viên trên mỗi câu lệnh”).

    Sẽ có 50 tác vụ trong công việc đánh giá này (một tác vụ cho mỗi bộ phản hồi-câu lệnh cho mỗi nhân viên). 50 câu lệnh kết hợp với 5000 token đầu vào và các phản hồi liên quan kết hợp với 15.000 token cho Anthropic Claude Instant và 20000 token cho Anthropic Claude 2.1.

    Các khoản phí sau đây phát sinh cho công việc đánh giá mô hình này:

    Mục Số lượng token đầu vào Giá cho mỗi 1.000 token đầu vào Chi phí đầu vào Số lượng token đầu ra Giá cho mỗi 1.000 token đầu ra Chi phí đầu ra Số tác vụ của con người Giá cho mỗi tác vụ của con người Chi phí tác vụ của con người Tổng
    Suy luận Claude Instant 5.000 0,0008 USD 0,004 USD 15000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5000 0,008 USD 0,04 USD 20000 0,024 USD 0,48 USD       0,52 USD
    Tác vụ do con người thực hiện             50 0,21 USD 10,50 USD 10,50 USD
    Tổng                   11,06 USD

    Ví dụ về đánh giá mô hình 2:

    Định giá theo nhu cầu
    Nhà phát triển ứng dụng gửi tập dữ liệu dành cho đánh giá mô hình do con người thực hiện bằng Anthropic Claude 2.1 và Anthropic Claude Instant tại Khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia).

    Tập dữ liệu này chứa 50 câu lệnh và nhà phát triển yêu cầu hai nhân viên đánh giá mỗi tập hợp phản hồi-câu lệnh (có thể cấu hình trong quá trình tạo công việc đánh giá dưới dạng thông số “nhân viên trên mỗi câu lệnh”). Sẽ có 100 tác vụ trong công việc đánh giá này (1 tác vụ cho mỗi bộ phản hồi-câu lệnh cho mỗi nhân viên: 2 nhân viên x 50 tập hợp phản hồi câu lệnh = 100 tác vụ của con người).

    50 câu lệnh kết hợp với 5000 token đầu vào và các phản hồi liên quan kết hợp với 15000 token cho Anthropic Claude Instant và 20000 token cho Anthropic Claude 2.1.

    Các khoản phí sau đây phát sinh cho công việc đánh giá mô hình này:

    Mục Số lượng token đầu vào Giá cho mỗi 1.000 token đầu vào Chi phí đầu vào Số lượng token đầu ra Giá cho mỗi 1.000 token đầu ra Chi phí đầu ra Số tác vụ của con người Giá cho mỗi tác vụ của con người Chi phí tác vụ của con người Tổng
    Suy luận Claude Instant 5.000 0.0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5000 0,008 USD 0,0400 USD 20000 0,024 USD 0,48 USD       0,52 USD
    Tác vụ do con người thực hiện             100 0,21 USD 21,00 USD 21,00 USD
    Tổng                   21,56 USD
  • Ví dụ 1: Chatbot hỗ trợ khách hàng
    Một nhà phát triển ứng dụng tạo một chatbot hỗ trợ khách hàng và sử dụng các bộ lọc nội dung để chặn nội dung gây hại và các chủ đề bị từ chối nhằm lọc các truy vấn và phản hồi không mong muốn.

    Chatbot phục vụ 1000 truy vấn của người dùng mỗi giờ. Mỗi truy vấn người dùng có độ dài đầu vào trung bình là 200 ký tự và nhận được phản hồi FM gồm 1500 ký tự.

    Mỗi truy vấn của người dùng gồm 200 ký tự tương ứng với 1 đơn vị văn bản.

    Mỗi phản hồi FM gồm 1.500 ký tự tương ứng với 2 đơn vị văn bản.

    Đơn vị văn bản được xử lý mỗi giờ = (1 + 2) * 1000 truy vấn = 3000 đơn vị văn bản

    Tổng chi phí phát sinh mỗi giờ cho bộ lọc nội dung và chủ đề bị từ chối = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

     

    Ví dụ 2: Tóm tắt bản chép lời trung tâm cuộc gọi
    Một nhà phát triển ứng dụng tạo một ứng dụng để tóm tắt bản ghi cuộc trò chuyện giữa người dùng và nhân viên hỗ trợ. Ứng dụng đó sử dụng bộ lọc thông tin nhạy cảm để biên tập thông tin nhận dạng cá nhân (PII) trong các bản tóm tắt được tạo cho 10000 cuộc hội thoại.

    Mỗi bản tóm tắt được tạo có trung bình 3.500 ký tự tương ứng với 4 đơn vị văn bản.

    Tổng chi phí phát sinh để tóm tắt 10000 cuộc hội thoại = 10000 * 4 * (0,1 USD / 1000) = 4 USD

    Mục Số lượng token đầu vào Giá cho mỗi 1.000 token đầu vào Chi phí đầu vào Số lượng token đầu ra Giá cho mỗi 1.000 token đầu ra Chi phí đầu ra Số tác vụ của con người Giá cho mỗi tác vụ của con người Chi phí tác vụ của con người Tổng
    Suy luận Claude Instant 5.000 0,0008 USD 0,004 USD 15000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5000 0,008 USD 0,04 USD 20000 0,024 USD 0,48 USD       0,52 USD
    Tác vụ do con người thực hiện             100 0,21 USD 21,00 USD 21,00 USD
    Tổng                   21,56 USD
  • Ví dụ định giá: Nhà phát triển ứng dụng nhập mô hình tùy chỉnh thuộc loại Llama 3.1 có kích cỡ thông số 8B với độ dài chuỗi 128K ở khu vực us-east-1 và xóa mô hình sau 1 tháng. Hoạt động này yêu cầu 2 Đơn vị mô hình tùy chỉnh. Vì vậy, mức giá mỗi phút sẽ là 0,1570 USD vì cần có 2 Đơn vị mô hình tùy chỉnh. Chi phí lưu trữ mô hình cho 2 Đơn vị mô hình tùy chỉnh sẽ là 3,90 USD mỗi tháng.

    Việc nhập mô hình không phát sinh khoản phí nào. Lệnh gọi thành công đầu tiên diễn ra vào lúc 8:03 sáng và việc đo lường sẽ bắt đầu vào thời điểm này. Các khoàng thời gian đo lường 5 phút là từ 8:03 sáng - 8:07 sáng; 8:07 sáng - 8:11 sáng, v.v. Nếu có ít nhất một lệnh gọi trong bất kỳ khoảng thời gian 5 phút nào, khoảng thời gian đó sẽ được coi là hoạt động để tính phí. Nếu không có lệnh gọi từ 8:07 sáng đến 8:11 sáng, việc đo lường sẽ dừng lại vào lúc 8:11 sáng. Trong trường hợp này, hóa đơn sẽ được tính như sau: 0,1570 USD * 5 phút * 3 khoảng thời gian năm phút = 2,355 USD.

  • Ví dụ về định giá 1 (Xếp hạng lại bằng mô hình Amazon Rerank 1.0)

    Trong một tháng, bạn thực hiện 2 triệu yêu cầu đối với API Rerank bằng mô hình Amazon Rerank 1.0 – 1 triệu yêu cầu với mỗi yêu cầu chứa ít hơn 100 tài liệu và do đó mỗi yêu cầu sẽ bị tính phí tương đương một yêu cầu. 1 triệu yêu cầu còn lại chứa 120-150 tài liệu và do đó mỗi yêu cầu sẽ được tính phí tương đương 2 yêu cầu.

    Giá cho một yêu cầu = 0,001 USD
    Tổng mức phí = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USD 

    Ví dụ về định giá 2: (Truy xuất dữ liệu có cấu trúc)

    Một nhà phát triển ứng dụng tạo một chatbot hỗ trợ để truy vấn dữ liệu có cấu trúc được lưu trữ trong Amazon Redshift. Nhà phát triển tạo Cơ sở kiến thức Bedrock và kết nối với Amazon Redshift. Chatbot phục vụ 10000 truy vấn người dùng mỗi giờ. Mỗi truy vấn người dùng sẽ có mức giá 0,002 USD cho mỗi API GenerateQuery để tạo SQL từ truy vấn người dùng.

    Tổng chi phí phát sinh cho việc tạo SQL mỗi giờ = 0,002 USD * 10000 = 20 USD.
    Tổng chi phí phát sinh trong tháng = 20 USD * 24 * 30 = 1440 USD

  • Ví dụ: Tóm tắt tin tức
    Một nhà phát triển ứng dụng tạo ra một luồng để tự động hóa việc tóm tắt tin tức cho các nhà giao dịch. Luồng này bao gồm một nút Đầu vào tiếp nhận vị trí S3 và một nút truy xuất S3 để truy xuất 10 tệp bao gồm các bài báo từ 10 hãng tin lớn trong S3 (2 lần chuyển tiếp nút). Sau đó, luồng này sử dụng một nút trình lặp để gọi một mô hình với một nút câu lệnh để tóm tắt từng tệp (+ 10 tệp x 2 lần chuyển tiếp nút). Sau đó, luồng thu thập tất cả các kết quả bằng cách sử dụng một nút bộ thu thập, ghi kết quả vào S3 bằng nút lưu trữ S3 và hoàn tất trong một nút Đầu ra (+ 3 lần chuyển tiếp nút). Họ chạy luồng này mỗi nữa tiếng/mỗi ngày trong tuần.

    Số lần chuyển tiếp nút/lần thực thi luồng là: 2+1+10*2 + 3 = 25 lần chuyển tiếp nút/thực thi luồng

    Số lần thực thi luồng mỗi tháng là: 24 giờ * 2 * 5 ngày * 4 tuần = 960 lần thực thi luồng mỗi tháng.

    Tổng hóa đơn hàng tháng là: 25 * 960 * 0,035 USD/1000 = 0,84 USD

    Phụ phí
    Hóa đơn cũng sẽ bao gồm các khoản phí bổ sung cho các dịch vụ AWS được sử dụng trong quá trình thực thi quy trình làm việc, bao gồm việc sử dụng Amazon S3 trong các nút truy xuất và lưu trữ và sử dụng mô hình nền tảng Amazon Bedrock trong nút câu lệnh.

  • Ví dụ về định giá 1:
    Giả sử bạn xử lý một tài liệu 1.000 trang bằng Đầu ra tùy chỉnh BDA. Tất cả 1.000 trang được xử lý bằng cách sử dụng kế hoạch chi tiết 1 có 15 trường. Giá mỗi trang cho bất kỳ kế hoạch chi tiết nào có 30 trường trở xuống là 0,040 USD. Tổng chi phí là 40 USD.

    Tổng số trang đã xử lý = 1.000
    Giá mỗi trang cho kế hoạch chi tiết có ít hơn 30 trường = 0,040 USD
    Tổng mức phí = 1.000 * 0,040 USD = 40 USD

     

    Ví dụ về định giá 2:
    Giả sử bạn xử lý 2 tài liệu bằng Đầu ra tùy chỉnh BDA. Tài liệu 1 có 40 trang và được xử lý bằng cách sử dụng kế hoạch chi tiết 1 có 20 trường. Tài liệu 2 có 10 trang và được xử lý bằng cách sử dụng kế hoạch chi tiết 2, có 40 trường. Giá mỗi trang của kế hoạch chi tiết 1 là 0,040 USD vì chứa 30 trường trở xuống. Giá mỗi trang của kế hoạch chi tiết 2 là 0,045 USD. Chi phí xử lý cho Tài liệu 1 sử dụng kế hoạch chi tiết 1 là 1,60 USD. Chi phí xử lý cho Tài liệu 2 sử dụng kế hoạch chi tiết 2 là 0,45 USD. Tổng chi phí xử lý cả hai tài liệu sẽ là 2,05 USD.

    Tổng số trang đã xử lý = 50
    Giá mỗi trang cho Kế hoạch chi tiết 1 có ít hơn 30 trường = 0,040 USD
    Giá mỗi trang cho Kế hoạch chi tiết 2 có 40 trường = 0,040 USD + (số trường bổ sung trên 30 * 0,0005 USD mỗi trường)
    Số trường bổ sung trên 30 = 40 - 30 = 10
    Giá mỗi trang cho Kế hoạch chi tiết 2 có 40 trường = 0,040 USD + (10 * 0,0005 USD mỗi trường) = 0,045 USD
    Phí cho Tài liệu 1 sử dụng Kế hoạch chi tiết 1 = 40 trang x 0,040 USD mỗi trang = 1,6 USD
    Phí cho Tài liệu 2 sử dụng Kế hoạch chi tiết 2 = 10 trang x 0,045 USD mỗi trang = 0,45 USD
    Tổng phí = Phí cho Tài liệu 1 + Phí cho Tài liệu 2 = 1,6 USD + 0,45 USD = 2,05 USD

     

    Ví dụ về định giá 3:
    Giả sử bạn xử lý video 60 phút bằng Đầu ra tiêu chuẩn BDA. Giá mỗi phút cho đầu ra tiêu chuẩn video là 0,050 USD. Tổng chi phí phải trả là 3,00 USD.

    Tổng số phút được xử lý = 60
    Giá mỗi phút cho đầu ra tiêu chuẩn video = 0,050 USD
    Tổng mức phí = 60 * 0,050 USD = 3,00 USD

     

    Ví dụ về định giá 4:
    Giả sử bạn xử lý 2.000 hình ảnh bằng Đầu ra tùy chỉnh BDA. 1.000 hình ảnh đầu tiên được xử lý bằng cách sử dụng kế hoạch chi tiết 1, trong đó có 10 trường. 1.000 trang cuối cùng được xử lý bằng cách sử dụng kế hoạch chi tiết 2, trong đó có 40 trường. Giá mỗi hình ảnh cho kế hoạch chi tiết 1 là 0,005 USD, vì chứa 30 trường trở xuống. Giá mỗi hình ảnh của kế hoạch chi tiết 2 là 0,01 USD. Chi phí xử lý cho 1.000 hình ảnh đầu tiên sử dụng kế hoạch chi tiết 1 là 5,00 USD. Chi phí xử lý cho 1.000 hình ảnh thứ hai sử dụng kế hoạch chi tiết 2 là 10,00 USD. Tổng chi phí xử lý tất cả 2.000 hình ảnh sẽ là 15,00 USD

    Chi phí cho 1000 hình ảnh đầu tiên = 1.000 hình ảnh * 0,005 USD mỗi hình ảnh = 5,00 USD
    Chi phí cho 1.000 hình ảnh thứ hai = 1.000 hình ảnh * (0,005 USD + (số trường bổ sung trên 30 * 0,0005 USD cho mỗi trường))
    = 1.000 * (0,005 USD + ((40-30)*0,0005 USD))
    = 1.000 * (0,005 USD + (10*0,0005 USD)) = 10,00 USD
    Tổng chi phí = 5,00 USD + 10,00 USD = 15,00 USD

     

    Ví dụ về định giá 5:
    Giả sử bạn muốn sử dụng Đầu ra tiêu chuẩn Tự động hóa dữ liệu của Bedrock để xử lý 15.000 phút ghi âm cuộc họp trong tổ chức của bạn. Tổng chi phí xử lý tất cả 15.000 phút âm thanh sẽ là 90 USD.

    Tổng số phút được xử lý = 15.000 phút
    Tổng phí = 15.000 phút × 0,006 USD = 90 USD


    Ví dụ về định giá 6:
    Giả sử bạn thiết lập Cơ sở kiến thức Bedrock để sử dụng Tự động hóa dữ liệu của Bedrock làm trình phân tích cú pháp và sau đó tải nhập một tài liệu 1000 trang. Lưu ý rằng việc tích hợp Cơ sở kiến thức Bedrock và Tự động hóa dữ liệu của Bedrock sử dụng đầu ra tiêu chuẩn. Giá mỗi trang cho đầu ra tiêu chuẩn là 0,010 USD. Tổng chi phí phải trả là 10 USD.

    Tổng số trang đã xử lý = 1.000
    Giá mỗi trang cho đầu ra tiêu chuẩn = 0,010 USD
    Tổng mức phí = 1.000 * 0,010 USD = 10 USD