Amazon Bedrock 定价

定价概述

Amazon Bedrock 是一项完全托管的服务,可通过单个 API 提供多种高性能基础模型(FM),同时还提供一系列您所需的广泛功能,用于构建支持安全性、隐私性和负责任人工智能原则的生成式人工智能应用。

使用 Amazon Bedrock,您需要为模型的推理和自定义支付费用。有两种推理定价方案供您选择: 1.按需和批量:此模式允许您按照即用即付的原则使用基础模型,无需承诺使用期限。2.预配置吞吐量:此模式允许您预先配置足够的吞吐量,以满足应用程序的性能要求,作为交换,您需要承诺使用期限。

定价模式

在按需模式下,您只需按实际用量付费,无需承诺使用期限。对于文本生成模型,您需要为处理的每个输入令牌和生成的每个输出令牌付费。对于嵌入模型,您需要为处理的每个输入令牌付费。令牌由几个字符组成,是模型学习理解用户输入和提示的基本文本单位。对于图像生成模型,您需要为生成的每张图像付费。

跨区域推理:按需模式还支持某些模型的跨区域推理。它使开发人员能够跨 AWS 区域利用计算能力来无缝管理流量突发,并获得更高的吞吐量限制和增强的弹性。使用跨区域推理不收取额外费用,价格是根据您提出请求的区域(来源区域)计算的。

使用批量模式,您可以将一组提示作为单个输入文件提供,并将响应作为单个输出文件接收,这样就可以同时进行大规模预测。这些响应会被处理并存储在您的 Amazon S3 存储桶中,以便您稍后访问。Amazon Bedrock 提供来自领先 AI 提供商(如 Anthropic、Meta、Mistral AI 和 Amazon)的精选基础模型(FM),用于批量推理,价格比按需推理定价低 50%。请参阅此处的模型列表。

Amazon Bedrock 中基础模型的延迟优化推理可缩短模型的响应时间,并有助于提高生成式人工智能应用程序的响应能力。您可以将延迟优化推理用于 Anthropic 的 Claude 3.5 Haiku 模型以及 Meta 的 Llama 3.1 405B 和 70B 模型。经过 Anthropic 验证,Claude 3.5 Haiku 在 Amazon Bedrock 上进行了延迟优化推理,在 AWS 上的运行速度比其他任何地方都快。此外,借助 Bedrock 中的延迟优化推理,Llama 3.1 405B 和 70B 在 AWS 上的运行速度比任何其他主要云提供商都要快。 单击此处了解更多信息

使用预配置吞吐量模式,您可以为特定的基本模型或自定义模型购买模型单元。预配置吞吐量模式主要针对大规模、连续的推理工作负载,此类推理要求在吞吐量方面得到保障。您只能使用预配置吞吐量模式访问自定义模型。模型单元提供一定的吞吐量,吞吐量由每分钟处理的最大输入或输出令牌数衡量。预配置吞吐量定价方案按小时计费,您可以灵活地选择 1 个月或 6 个月的承诺期。

自定义模型导入让您能够利用先前在 Amazon Bedrock 中的模型自定义投资,并以与 Bedrock 现有托管基础模型相同的完全托管方式使用它们。您可以导入支持的模型架构的自定义权重,并使用按需模式提供自定义模型。将自定义模型导入 Bedrock 无需付费。导入模型后,无需执行任何控制面板操作即可按需访问该模型。您只需为模型推理付费,费用基于为您的推理量提供服务所需的自定义模型副本数以及每个模型副本的活动持续时间,以 5 分钟为单位计费。模型副本是已导入模型的单个实例,可用于处理推理请求。每个模型副本每分钟的价格取决于架构、上下文长度、AWS 区域、计算单位版本(硬件世代)等因素,并按模型副本大小分级。

Amazon Bedrock Marketplace 让您在 Bedrock 中发现、测试和使用 100 多种热门新兴的专业基础模型。Amazon Bedrock Marketplace 模型部署到端点,您可以在其中选择所需的实例数量和实例类型,并配置自动扩缩策略来满足工作负载需求。对于专有模型,您需要按模型提供商订立的软件价格(按小时、按秒增量计费或按请求计费)和自己选择的实例所对应的基础设施价格进行付费。您可以在订阅提供商模型之前查看这些价格,也可以从 AWS Marketplace 的模型列表中查看这些价格。对于公开可用的模型,您只需根据选择的实例支付基础设施费用。单击此处了解更多信息。

自定义和优化

借助 Amazon Bedrock,您可以使用数据自定义 FM,提供针对特定任务和您的业务环境量身定制的响应。您可以使用标记数据微调模型,或使用未标记数据进行持续的预训练。对于自定义的文本生成模型,您需要按照模型处理的令牌总数(训练数据语料库中的令牌数量 x 训练周期数)支付模型训练费用,并每月为每个模型支付模型存储费用。训练周期是指在微调或持续的预训练过程中,对训练数据集的一次完整遍历。使用自定义模型的推理根据预配置吞吐量计划收费,并且需要您购买预配置吞吐量。在无承诺期的情况下,我们提供一个模型单元,供您处理自定义模型的推理。您需要按自定义模型推理的第一个模型单元使用的小时数付费。如果您想将吞吐量提高到一个模型单元以上,则必须购买 1 个月或 6 个月的承诺期。

借助 Amazon Bedrock 模型蒸馏,您可以按实际使用量付费。合成数据生成按所选教师模型的按需定价收费。学生模型的微调按模型自定义费率收费。由于蒸馏模型是自定义模型,使用自定义模型的推理根据“预置吞吐量”方案收费,并且需要客户购买预置吞吐量。

借助 Amazon Bedrock 上的提示缓存功能,您可以跨 API 调用缓存重复的上下文,从而降低成本和响应延迟。提示通常包含常见的上下文或前缀,例如长时间多向对话、多镜头示例和细化模型行为的详细说明。使用现有的 Amazon Bedrock API,您可以指定要在 AWS 账户特定的缓存中缓存五分钟的提示前缀。在此缓存期间,任何具有匹配前缀的请求都能获得高达 90% 的缓存令牌折扣,以及高达 85% 的延迟改进。价格和性能改进会因型号和提示长度而异,但缓存始终独立于 AWS 账户。

工具

Amazon Bedrock 防护机制帮助您为生成式人工智能应用程序实施自定义的安全措施和负责任的人工智能策略。除了基础模型提供的原生保护外,它还提供额外的可定制安全保护。这是唯一一个由大型云服务提供商提供的负责任的人工智能功能,帮助客户在单一解决方案中为其生成式人工智能应用程序构建和自定义安全、隐私和真实性保护措施,并兼容 Amazon Bedrock 中的所有基础模型以及微调模型。Bedrock 防护机制还可以与 Amazon Bedrock 代理和 Amazon Bedrock 知识库集成,以构建符合您负责任的人工智能策略的生成式人工智能应用程序。此外,它还提供 ApplyGuardrail API,用于评估用户输入以及由非 Bedrock 内的任何自定义基础模型或第三方基础模型生成的模型响应。

Amazon Bedrock 知识库能够提供完全托管的检索增强生成(RAG)工作流程,让客户能够整合来自自有数据来源的上下文信息,创建高准确性、低延迟并且安全的自定义生成式人工智能应用程序。知识库的预览版支持各种多种数据来源,包括 S3、Confluence、Salesforce 和 SharePoint。其能还为直播数据提供文档摄取服务。Bedrock 知识库将非结构化数据转换为嵌入数据,再将这些数据存储在向量数据库中,从而支持从不同的数据存储中进行检索。其还与 Kendra 集成来进行托管式检索,也支持使用自然语言到 SQL 的结构化数据检索。

Amazon Bedrock Data Automation 将非结构化的多模态内容转换为适用于智能文档处理、视频分析和 RAG 等用例的结构化数据格式。Bedrock Data Automation 可以使用模态特定的预定义默认值生成标准输出内容,例如视频的逐场景描述、音频转录或自动文档分析。此外,客户可以根据自己的数据架构在蓝图中指定输出要求来创建自定义输出,然后可以轻松地将这些数据架构加载到现有数据库或数据仓库中。通过与知识库集成,Bedrock Data Automation 还可用于解析 RAG 应用程序的内容,通过纳入图像和文本嵌入的信息来提高结果的准确性和相关性。

Amazon Bedrock 代理让您能够在应用程序中构建和配置自主代理。这些代理可以安全地连接到贵公司的数据来源,并在用户请求中添加正确的信息,以生成准确的响应。您只需执行几个简单的步骤,即可创建单个代理和多个代理应用程序,从而缩短构建生成式人工智能应用程序所需的时间。这些代理支持代码解释,能够动态生成和执行代码以及返回控制权,这使您可以定义操作模式,并在代理调用该操作时重新获得控制权。另外,Amazon Bedrock 代理能够保留有关交互的记忆,从而提供更加个性化和无缝的用户体验。

Amazon Bedrock Flows 是 Bedrock 的一项工作流编写和执行功能,适用于生成式人工智能应用程序。它可以通过直观的可视化生成器和一组 API,加速创建、测试和部署用户定义的生成式人工智能工作流。它使您能够无缝链接最新的基础模型、提示、代理、知识库、护栏和 AWS 服务(例如 Amazon Lex、AWS Lambda、Amazon S3)以及业务逻辑,以构建生成式人工智能工作流。您可以轻松对您的工作流进行测试和版本控制,并通过可视化界面或 API 在安全的无服务器环境中运行它,而无需建立您自己的基础设施。

模型评测:使用 Amazon Bedrock 模型评测功能时,您可以按实际使用量付费,无需对提示或响应数量做出最低使用量承诺。对于自动(程序化)评测,您只需为评测中选择的模型所进行的推理付费。自动生成的算法分数不收取额外费用。在自动(模型/LLM-as-a-judge)评测的公开预览版期间,您只需为自己选择的生成器模型和评测器模型所进行的推理付费。在 LLM-as-a-Judge 模型评测任务中,内置指标将使用各指标专属的系统评判提示模板和可用的评判模型(将作为词元使用的一部分进行收费),为了确保信息透明,这些评判提示均在公开的 AWS 文档中提供。对于自带工作团队的人工评估,您需要为评估中的模型推理付费,并且每完成一个人工任务需支付 0.21 美元的费用。人工任务被定义为人力员工在人工评估用户界面中提交对单个提示及其相关推理响应的评估的实例。无论是评估工作中有 1 个还是 2 个模型,也无论您包含多少个评估指标和评级方法,价格都相同。人工任务的费用将显示在您的 AWS 账单的 Amazon SageMaker 部分下,并且对于所有 AWS 区域都相同。由于员工是由您提供的,因此不向其单独收费。对于 AWS 管理的评估,我们会在与 AWS 专家评估团队合作的同时,通过私人参与的方式根据您的评估需求定制定价。

Amazon Bedrock 知识库评测(RAG 评测):使用 Amazon Bedrock 知识库评测(RAG 评测)时,您可以按实际使用量付费,无需对提示或响应数量做出最低使用量承诺。在公开预览版期间,您只需为自己选择的生成器模型和评测器模型(评测任务将使用 LLM-as-a-judge)所进行的推理付费,以及根据 Amazon Bedrock 知识库定价支付评测任务中使用知识库所产生的任何费用。在知识库评测(RAG 评测)任务中,内置指标将使用各指标专属的系统评判提示模板和可用的评判模型(将作为词元使用的一部分进行收费),为了确保信息透明,这些评判提示均在公开的 AWS 文档中提供。除了输入提示外,一些指标还涉及到对从知识库或基准答案中检索的上下文进行评判模型推理,这将影响各个指标产生的费用,有关各个指标的更多信息,可参与关于评测的公开 AWS 文档。

定价详情

定价取决于模式、提供商和模型。请选择模型提供商以查看详细定价。

Amazon Bedrock 提供来自领先 AI 提供商 [如 Anthropic、Meta、Mistral AI 和 Amazon)] 的精选基础模型(FM),用于批量推理,价格比按需推理定价低 50%。请参阅此处的模型列表。

  • AI21 Labs
  • AI21 Labs

    按需定价

    AI21 Labs 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
    Jamba 1.5 Large 0.002 USD 0.008 USD
    Jamba 1.5 Mini 0.0002 USD 0.0004 USD
    Jurassic-2 Mid 0.0125 美元 0.0125 美元
    Jurassic-2 Ultra 0.0188 美元 0.0188 USD
    Jamba-Instruct 0.0005 USD 0.0007 USD
  • Amazon
    • Amazon Nova
    • Amazon Nova

      了解模型的定价

      创意内容生成模型的定价

    • Amazon Titan
    • Amazon Titan

    • 其他 Amazon
  • Anthropic
  • Anthropic

    按需和批量定价

    区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) 每 1000 个输入令牌的价格(缓存写入) 每 1000 个输入令牌的价格(缓存读取)

    Claude 3.5 Sonnet**
     

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

    0.00375 USD

    0.0003 USD

    Claude 3.5 Haiku
     

    0.0008 USD

    0.004 USD

    0.0005 USD

    0.0025 USD

    0.001 USD

    0.00008 USD

    Claude 3 Opus*
     

    0.015 USD

    0.075 USD

    0.0075 USD

    0.0375 USD

    NA

    NA

    Claude 3 Haiku
     

    0.00025 USD

    0.00125 USD

    0.000125 USD

    0.000625 USD

    NA

    NA

    Claude 3 Sonnet
     

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

    NA

    NA

    Claude 2.1
     

    0.008 USD

    0.024 USD

    NA

    NA

    NA

    NA

    Claude 2.0
     

    0.008 USD

    0.024 USD

    NA

    NA

    NA

    NA

    Claude Instant
     

    0.0008 USD

    0.0024 USD

    NA

    NA

    NA

    NA
    *Claude 3 Opus 目前在美国西部(俄勒冈州)区域提供
    **Claude 3.5 Sonnet 的定价适用于每个版本的 Claude 3.5 Sonnet(v1 和 v2)— Claude 3.5 Sonnet v2 目前在美国西部(俄勒冈州)区域可用
    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量) 每 1000 个输入令牌的价格(缓存写入) 每 1000 个输入令牌的价格(缓存读取)

    Claude 3.5 Sonnet**

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

    0.00375 USD 0.0003 USD

    Claude 3.5 Haiku

    0.001 USD

    0.005 USD

    0.0005 USD

    0.0025 USD

    0.001 USD 0.00008 USD

    Claude 3 Opus*

    0.015 USD

    0.075 USD

    0.0075 USD

    0.0375 USD

       

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

    0.000625 USD

       

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

       

    Claude 2.1

    0.008 USD

    0.024 USD

    不适用

    不适用

       

    Claude 2.0

    0.008 USD

    0.024 USD

    不适用

    不适用

       

    Claude Instant

    0.0008 USD

    0.0024 USD

    不适用

    不适用

       
    *Claude 3 Opus 目前在美国西部(俄勒冈州)区域提供    
    **Claude 3.5 Sonnet 的定价适用于每个版本的 Claude 3.5 Sonnet(v1 和 v2)— Claude 3.5 Sonnet v2 目前在美国西部(俄勒冈州)区域可用    

    区域:欧洲地区(伦敦)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD 0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

    0.000625 USD

    区域:欧洲(苏黎世)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

     

    区域:南美洲(圣保罗)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

     

    区域:加拿大(中部)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    区域:亚太地区(孟买)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    区域:亚太地区(悉尼)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    区域:亚太地区(东京)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude Instant

    0.0008 USD

    0.0024 USD

    不适用

     

    不适用

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    不适用

    不适用

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    区域:亚太地区(新加坡)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude Instant

    0.0008 USD

    0.0024 USD

    0.0004 USD

     

    0.0012 USD

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    0.004 USD

     

    0.012 美元

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    不适用

    不适用

    区域:欧洲地区(巴黎)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    区域:欧洲地区(法兰克福)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude Instant

    0.0008 USD

    0.0024 USD

    不适用

    不适用

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    不适用

    不适用

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    区域:亚太地区(首尔)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    不适用

     

    不适用

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    不适用

     

    不适用

    区域:美国东部(俄亥俄州)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格 每 1000 个输入令牌的价格(批量) 每 1000 个输出令牌的价格(批量)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    不适用

     

    不适用

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    不适用

     

    不适用

    区域:AWS GovCloud(美国西部)和 AWS GovCloud(美国东部)

    Anthropic 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

    Claude 3.5 Sonnet

    0.0036 USD

    0.018 USD

    Claude 3 Haiku

    0.0003 USD

    0.0015 USD

    延迟优化推理

    区域:美国东部(俄亥俄州)

      每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
    Claude 3.5 Haiku 0.001 USD 0.005 USD

    预配置吞吐量定价

    区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

    Anthropic 模型 每个模型的每小时价格
    无承诺期
    1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

    Claude Instant

    44.00 USD

    39.60 USD

    22.00 美元

    Claude 2.0/2.1

    70.00 USD

    63.00 USD

    35.00 USD

    Anthropic 模型 每个模型的每小时价格
    无承诺期
    1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

    Claude Instant

    44.00 USD

    39.60 USD

    22.00 美元

    Claude 2.0/2.1

    70.00 USD

    63.00 USD

    35.00 美元

    区域:亚太地区(东京)

    Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

    Claude Instant

    53.00 美元

    29.00 美元

    Claude 2.0/2.1

    86.00 美元

    48.00 美元

    区域:欧洲地区(法兰克福)

    Anthropic 模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

    Claude Instant

    49.00 美元

    27.00 美元

    Claude 2.0/2.1

    79.00 美元

    44.00 美元

    请联系您的 AWS 账户团队,了解有关模型单元的更多详细信息。 

     

  • Cohere
  • Cohere

    按需定价

    Cohere 模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格
    命令 0.0015 美元 0.0020 美元
    Command-Light 0.0003 美元 0.0006 USD
    Command R+ 0.0030 USD 0.0150 USD
    Command R 0.0005 USD 0.0015 USD
    Embed — 英语 0.0001 USD 不适用
    Embed — 多语言 0.0001 USD 不适用
    Cohere 模型 每 1000 个查询的价格**
    Rerank 3.5 2.00 USD
    **一个查询中最多可以包含 100 个文档块的大量查询需要付费。如果查询包含超过 100 个文档块,则将其计为多个查询。例如,如果请求包含 350 个文档,则会被视为 4 个查询。请注意,每个文档最多只能包含 500 个令牌(包括查询和文档的总令牌数),如果令牌长度大于 512 个令牌,则将其分解为多个文档。

    定制(微调)的定价

    Cohere 模型 训练 1000 个令牌的价格 每个自定义模型每月的存储价格 自定义模型每个模型单元每小时推理的价格(无承诺预配置吞吐量定价)

    Cohere Command

    0.004 美元

    1.95 美元

    49.50 美元

    Cohere Command-Light 0.001 美元

    1.95 美元

    8.56 美元

    *训练的总令牌数 = 训练数据语料库中的令牌数量 x 训练周期数

    预配置吞吐量定价

    Cohere 模型 每个模型的每小时价格 
    无承诺期
    1 个月承诺期内,每个模型单元的每小时价格

    6 个月承诺期内,每个模型单元的每小时价格

    Cohere Command

    49.50 USD

    39.60 USD

    23.77 USD

    Cohere Command - Light 8.56 USD

    6.85 USD

    4.11 USD
    Embed — 英语 7.12 USD

    6.76 USD

    6.41 USD
    Embed — 多语言 7.12 USD

    6.76 USD

    6.41 USD

    请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。 

  • Meta Llama
  • Meta Llama

    Llama 3.3

    按需和批量定价

    Llama 3.2

    按需和批量定价

    Llama 3.1

    按需和批量定价

    模型定制(微调)的定价

    预配置吞吐量定价

    Llama 3

    按需定价

    Llama 2

    按需定价

    区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

    元模型 每 1000 个输入令牌的价格 每 1000 个输出令牌的价格

    Llama 2 Chat (13B)

    0.00075 USD

    0.001 USD

    Llama 2 Chat (70B)

    0.00195 美元

    0.00256 USD

    模型定制(微调)的定价:

    元模型 训练 1000 个令牌的价格 每个自定义模型*每月的存储价格 自定义模型使用 1 个模型单元进行推理的每小时价格(无承诺期的预配置吞吐量定价)

    Llama 2 预训练(13B)

    0.00149 USD

    1.95 美元

    23.50 USD

    Llama 2 预训练(70B)

    0.00799 美元

    1.95 美元 23.50 美元

    *自定义模型存储空间 = 1.95 美元

    预配置吞吐量定价

    元模型 1 个月承诺期内,每个模型单元的每小时价格 6 个月承诺期内,每个模型单元的每小时价格

    Llama 2 预训练和聊天(13B)

    21.18 USD

    13.08 USD

    Llama 2 预训练(70B)

    21.18 USD

    13.08 美元

    *Llama 2 预训练模型仅在定制后的预配置吞吐量中可用。

    请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    按需定价

    Stability AI 模型 生成每张图像的价格
    Stable Diffusion 3.5 Large 0.08 USD
    Stable Image Core 0.04 USD
    Stable Diffusion 3 Large 0.08 USD
    Stable Image Ultra 0.14 USD

    Stability AI 提供的上一代图像模型按图像定价,具体取决于步数和图像分辨率。

    Stability AI 模型 图像分辨率 生成每张高质量图像的价格(<=50 步) 生成每张高质量图像的价格(>50 步)
    SDXL 1.0 最多 1024 x 1024 0.04 美元 0.08 USD

    预配置吞吐量定价

    Stability AI 模型 1 个月承诺期内,每个模型单元的每小时价格* 6 个月承诺期内,每个模型单元的每小时价格*

    SDXL 1.0

    49.86 美元

    46.18 USD

    *包含基础模型和自定义模型的推理

    请联系您的 AWS 账户或销售团队,了解有关模型单元的更多详细信息。

    目前,Amazon Bedrock 上的 Stability AI 模型不支持模型自定义(微调)。

  • 自定义模型导入
  • 自定义模型导入

    • Llama
    • 区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

      自定义模型单元版本 v1.0
      每个自定义模型单元的每分钟价格* 0.0785 USD
      每个自定义模型单元的每月存储成本 1.95 美元
       
      托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Llama 3.1 8B 128K 模型需要 2 个自定义模型单元,Llama 3.1 70B 128k 模型需要 8 个自定义模型单元。
      *按 5 分钟计费
    • Multimodal Llama
    • 区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

      自定义模型单元版本 v1.0
      每个自定义模型单元的每分钟价格* 0.0785 USD
      每个自定义模型单元的每月存储成本 1.95 美元
       
      托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Llama 3.2 11B 128K 模型需要 4 个自定义模型单元。
      *按 5 分钟计费
    • Mistral
    • 区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

      自定义模型单元版本 v1.0
      每个自定义模型单元的每分钟价格* 0.0785 USD
      每个自定义模型单元的每月存储成本 1.95 美元
       
      托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Mistral 7B 32K 模型需要 1 个自定义模型单元。
      *按 5 分钟计费
    • Mixtral
    • 区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

      自定义模型单元版本 v1.0
      每个自定义模型单元的每分钟价格* 0.0785 USD
      每个自定义模型单元的每月存储成本 1.95 美元
       
      托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Mixtral 8x7B 32K 模型需要 4 个自定义模型单元。
      *按 5 分钟计费
    • Flan
    • 区域:美国东部(弗吉尼亚州北部)和美国西部(俄勒冈州)

      自定义模型单元版本 v1.0
      每个自定义模型单元的每分钟价格* 0.0785 USD
      每个自定义模型单元的每月存储成本 1.95 美元
       
      托管模型所需的自定义模型单元取决于多种因素,特别是模型架构、模型参数数量和上下文长度。所需的自定义模型单元的确切数量将在导入时确定。作为参考,Flan-T5 XL 512 模型需要 1 个自定义模型单元。 
      *按 5 分钟计费

    按需推理定价:
    从第一次成功调用开始,在模型副本处于活动状态期间,将按 5 分钟的时间窗口向您收费。每个模型副本的最大吞吐量和并发限制取决于输入/输出令牌组合、硬件类型、模型大小、架构、推理优化等因素,并在模型导入工作流程中确定。

    Bedrock 会根据您的使用模式自动扩展模型副本的数量。如果 5 分钟内没有调用,Bedrock 将缩减到零,并在您调用模型时向上扩展。在向上扩展时,可能会出现一段冷启动持续时间(以十秒为单位),具体取决于模型大小。如果您的推理量持续超过单个模型副本的并发限制,Bedrock 还会增加模型副本的数量。注意:每个帐户每个导入模型的默认最大模型副本数为 3 个,可以通过服务配额增加。

定价工具(详情)

  • 流程
  • Amazon Bedrock Flows

    您需要根据执行应用程序所需的节点转换次数付费。每次执行工作流中的节点时,Bedrock Flows 都会计算一次节点转换。我们将根据所有流程中的节点转换总数向您收费。

    从 2025 年 2 月 1 日起,所有费用均按天计费,按月收费。

    每 1000 次节点转换的价格
    0.035 USD

    额外费用

    如果您的应用程序工作流程的执行使用了其他 AWS 服务或进行了数据传输,那么您可能需要支付额外费用。例如,如果您的工作流程调用 Amazon Bedrock 防护机制策略,您将根据该策略处理的文本单元数量付费。 

  • 知识库
  • 结构化数据检索(SQL 生成)

    结构化数据检索按生成 SQL 查询的每个请求收费。生成的 SQL 查询用于从结构化数据存储中检索数据。

    重新排列模型

    重新排列模型旨在提高检索增强生成(RAG)应用程序中响应的相关性和准确性。按查询收费。

    **一个查询中最多可以包含 100 个文档块的大量查询需要付费。如果查询包含超过 100 个文档块,则将其计为多个查询。例如,如果请求包含 350 个文档,则会被视为 4 个查询。请注意,每个文档最多只能包含 512 个令牌(包括查询和文档的总令牌数),如果令牌长度大于 512 个令牌,则将其分解为多个文档。查询等同于搜索单元。

  • 防护机制
  • Amazon Bedrock 防护机制

    护栏策略*

    每 1000 个文本单元的价格**

    内容过滤器(文本内容)****

    0.15 USD

    被拒绝的话题

    0.15 USD

    上下文基础检查***

    0.1 USD

    敏感信息过滤器(PII)

    0.1 USD

    敏感信息过滤器(正则表达式) 

    免费

    文字过滤器

    免费

    按需定价

    * 每项护栏策略都是可选的,可以根据您的应用程序要求启用。费用将根据防护机制中使用的策略类型而定。例如,如果在防护机制上配置了内容过滤器和被拒绝的话题,则会产生与这两项策略相关的费用,而不会产生与敏感信息过滤器相关的费用。

    **文本单元最多可包含 1000 个字符。如果文本输入超过 1000 个字符,则将其作为多个文本单元进行处理,每个文本单元包含不超过 1000 个字符。例如,如果文本输入包含 5600 个字符,则将按照 6 个文本单元收费。

    ***上下文基础检查使用参考源和查询来确定模型响应是否基于源并与查询相关。收费文本单元总数是通过合并源、查询和模型响应中的所有字符来计算的。

    ****用于检测和过滤掉有害图像内容的内容过滤器的定价将在该功能正式发布时公布。

  • 模型评测
  • 模型评测

    模型评测根据通过所选模型进行的推断收费。自动生成的算法分数不收取额外费用。对于自带工作流团队的人工评估,您需要为评估中的模型推理付费,并且每完成一个人工任务需支付 0.21 美元的费用。

    型号

    每 1000 个输入令牌的价格

    每 1000 个输出令牌的价格

    每项人工任务的价格

     

    选定进行评测的模型

    基于所选模型

    基于所选模型

     

    0.21 USD

     
  • 数据自动化
  • 数据自动化

    • Amazon Bedrock 知识库提供 Bedrock Data Automation 集成,为多模态数据提供更相关、更准确的响应。设置知识库时,您可以选择 Bedrock Data Automation 作为解析方法,从图像或文档(可能包括数字、图表和图示)中分析和提取有意义的见解。在处理过程中,Bedrock Data Automation 从摄取的文档和图像中提取有意义的信息,然后将其用于后续的知识库步骤中进行分块、嵌入和存储。与知识库集成后,Bedrock Data Automation 可交付标准化输出并收费。

定价示例

  • 应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 AI21 的 Jurasic-2 Mid 模型将 1 万个令牌的输入文本总结成 2000 个令牌的输出。

    产生的总成本 = 1 万个令牌/1000 * 0.0125 美元 + 2000 个令牌/1000 * 0.0125 美元 = 0.15 美元

  • 按需定价

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Amazon Titan Text Lite 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.0003 美元 + 1000 个令牌/1000 * 0.0004 美元 = 0.001 美元。

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Amazon Titan 图像生成器基础模型生成 1000 张大小为 1024 x 1024 的标准质量图像。

    产生的总成本 = 1000 张图像 * 每张图像 0.01 美元 = 10 美元

    定制(微调和持续预训练)定价

    应用程序开发人员使用 1000 个图像文本对自定义 Amazon Titan 图像生成器模型。训练结束后,开发人员使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    微调产生的每月成本为:微调训练(0.005 美元 * 500 * 64),其中 0.005 美元是每张图像的价格,500 是步骤数,64 是批量大小 + 每月自定义模型存储(1.95 美元)+ 一小时的自定义模型推理(21 美元)= 160 美元 + 1.95 美元 + 21 = 182.95 美元

    预配置吞吐量定价

    应用程序开发人员购买了两个 Amazon Titan Text Express 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 2 个模型单元 * 18.40 美元/小时 * 24 小时 * 31 天 = 27379.20 美元

    应用程序开发人员购买了一个基本 Amazon Titan 图像生成器模型的模型单元,承诺期为 1 个月。

    产生的总成本 = 1 个模型单元 * 16.20 美元 * 24 小时 * 31 天 = 12052.80 美元

  • 按需定价

    应用程序开发人员在美国西部(俄勒冈州)对 Amazon Bedrock 执行了以下 API 调用:请求 Anthropic 的 Claude 模型将 1.1 万个令牌的输入文本总结成 4000 个令牌的输出。

    产生的总成本 = 1.1 万个令牌/1000 * 0.008 美元 + 4000 个令牌/1000 * 0.024 美元 = 0.088 美元 + 0.096 美元 = 0.184 美元

    预配置吞吐量定价

    一位应用程序开发人员在美国西部(俄勒冈州)区域购买了 Anthropic Claude Instant 的一个模型单元:

    每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。

    产生的总成本 = 6000 个令牌/1000 * 0.0015 美元 + 2000 个令牌/1000 * 0.0020 美元 = 0.013 美元

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Cohere 的 Command-Light 模型将 6000 个令牌的输入文本总结成 2000 个令牌的输出。

    产生的总成本 = 6000 个令牌/1000 * 0.0003 美元 + 2000 个令牌/1000 * 0.0006 美元 = 0.003 美元

    应用程序开发人员对 Amazon Bedrock 进行了以下 API 调用:请求 Cohere 的 Embed 英语或 Embed 多语言模型为 1 万个输入令牌生成嵌入。

    产生的总成本为 = 1 万个令牌/1000 * 0.0001 美元 = 0.001 美元

    自定义(微调)定价

    应用程序开发人员使用 1000 个数据令牌自定义 Cohere 命令模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    微调产生的每月成本 = 微调训练(0.004 美元 * 1000 美元)+ 每月自定义模型存储(1.95 美元)+ 1 小时自定义模型推理(49.50 美元)= 55.45 美元

    自定义模型的预置吞吐量(1 个月承诺期)产生的每月成本 = 39.60 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 Cohere Command 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 1 个模型单元 * 39.60 美元 * 24 小时 * 31 天 = 29462.40 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 Meta 的 Llama 2 Chat(13B)模型将 2000 个令牌的输入文本总结成 500 个令牌的输出。

    产生的总成本为 = 2000 个令牌/1000 * 0.00075 美元 + 500 个令牌/1000 * 0.001 美元 = 0.002 美元

    自定义(微调)定价

    应用程序开发人员使用 1000 个数据令牌自定义 Llama 2 预训练(70B)模型。训练结束后,使用自定义模型预配置吞吐量一小时来评估模型的性能。经过微调的模型将存储一个月。评估后,开发人员使用预配置吞吐量(1 个月承诺期)来托管自定义模型。

    每月微调产生的费用为:微调训练(0.00799 美元 x 1000)+ 每月自定义模型存储空间(1.95 美元)+ 一小时的自定义模型推理(23.50 美元)= 33.44 美元

    自定义模型的预配置吞吐量(1 个月承诺期)产生的每月成本 = 21.18 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 Meta Llama 2 模型单元,用于处理文本摘要,承诺期为 1 个月。

    每月产生的总成本 = 1 个模型单元 * 21.18 美元 * 24 小时 * 31 天 = 15757.92 美元

  • 按需定价

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral 7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.00015 美元 + 1000 个令牌/1000 * 0.0002 美元 = 0.0005 美元

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mixtral 8x7B 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.00045 美元 + 1000 个令牌/1000 * 0.0007 美元 = 0.0016 美元

    应用程序开发人员每小时对 Amazon Bedrock 执行以下 API 调用:请求 Mistral Large 模型将 2000 个令牌的输入文本总结成 1000 个令牌的输出。 

    每小时产生的总成本为 = 2000 个令牌/1000 * 0.008 美元 + 1000 个令牌/1000 * 0.024 美元 = 0.04 美元

  • 按需定价

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 模型生成尺寸为 512 x 512、步长为 70(高质量)的图像。

    产生的总成本 = 1 张图像 * 每张图像 0.036 美元 = 0.036 美元

    应用程序开发人员对 Amazon Bedrock 执行了以下 API 调用:请求 SDXL 1.0 模型生成尺寸为 1024 x 1024、步长为 70(高质量)的图像。

    产生的总成本 = 1 张图像 * 每张图像 0.08 美元 = 0.08 美元

    预配置吞吐量定价

    应用程序开发人员购买了一个 SDXL 1.0 模型单元,承诺期为 1 个月。

    产生的总成本 = 1 * 49.86 美元 * 24 小时 * 31 天 = 37,095.84 美元

  • 模型评估示例 1:

    按需定价
    一位应用程序开发人员在美国东部(弗吉尼亚州北部)AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集,用于基于人体的模型评估。

    该数据集包含 50 个提示,开发人员需要 1 个工作人员对每个提示响应集进行评分(可在评估作业创建中配置为“每个提示的工作人员”参数)。

    此评估作业中将有 50 个任务(每个工作人员的每组提示响应有 1 个任务)。50 个提示总计 5000 个输入令牌,相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。

    此模型评估作业会产生以下费用:

    项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20000 0.024 USD 0.48 USD       0.52 USD
    人工任务             50 0.21 USD 10.50 USD 10.50 USD
    合计                   11.06 美元

    模型评估示例 2:

    按需定价
    一位应用程序开发人员在美国东部(弗吉尼亚州北部)AWS 区域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant 提交了一个数据集,用于基于人体的模型评估。

    该数据集包含 50 个提示,开发人员需要 2 个工作人员对每个提示响应集进行评分(可在评估作业创建中配置为“每个提示的工作人员”参数)。此评估作业中将有 100 个任务(每个工作人员的每组提示响应有 1 个任务:2 个工作人员 x 50 个提示响应集 = 100 个人工任务)。

    50 个提示总计 5000 个输入令牌,相关响应总计为 1.5 万个 Anthropic Claude Instant 令牌和 2 万个 Anthropic Claude 2.1 令牌。

    此模型评估作业会产生以下费用:

    项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计
    Claude Instant Inference 5000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.0400 USD 20000 0.024 USD 0.48 USD       0.52 USD
    人工任务             100 0.21 USD 21.00 USD 21.00 USD
    合计                   21.56 美元
  • 示例 1:客户支持聊天机器人
    应用程序开发人员创建客户支持聊天机器人,使用内容过滤器屏蔽有害内容,使用被拒绝的话题来过滤不必要的查询和响应。

    聊天机器人每小时处理 1000 个用户查询。每个用户查询的平均输入长度为 200 个字符,收到 1500 个字符的 FM 响应。

    每个 200 个字符的用户查询对应 1 个文本单元。

    每个 1500 个字符的 FM 响应对应 2 个文本单元。

    每小时处理的文本单位 = (1 + 2) * 1000 个查询 = 3000 个文本单元

    内容过滤器和被拒绝的主题每小时产生的总费用 = 3000 *(0.15 美元 + 0.15 美元)/1000 = 0.90 美元

     

    示例 2:呼叫中心听录文本摘要
    应用程序开发人员创建了一个应用程序来总结用户和支持座席之间的聊天记录。它使用敏感信息过滤器来编辑 10000 个对话生成的摘要中的个人身份信息(PII)。

    生成的每个摘要平均包含 3500 个字符,对应 4 个文本单元。

    总结 10000 个对话所产生的总成本 = 10000 * 4 * (0.1/1000 美元) = 4 美元

    项目 输入令牌的数量 每 1000 个输入令牌的价格 输入成本 输出令牌的数量 每 1000 个输出令牌的价格 输出成本 人工任务数量 每项人工任务的价格 人工任务的成本 合计
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20000 0.024 USD 0.48 USD       0.52 USD
    人工任务             100 0.21 USD 21.00 USD 21.00 USD
    合计                   21.56 USD
  • 定价示例:应用开发人员在 us-east-1 区域导入了一个自定义的 Llama 3.1 类型模型,该模型大小为 8B 参数,序列长度为 128K,并在 1 个月后删除了该模型。这需要 2 个自定义模型单元。因此,每分钟的价格将为 0.1570 USD,因为需要 2 个自定义模型单元。当月 2 个自定义模型单元的模型存储成本为 3.90 USD。

    导入模型不收取任何费用。第一次成功调用是在上午 8:03,此时开始计量。5 分钟的计量窗口为上午 8:03 至上午 8:07;上午 8:07 至上午 8:11,依此类推。如果在任何 5 分钟时间段内有至少一次调用,则该窗口将被视为活跃的计费窗口。如果从上午 8:07 到上午 8:11 没有调用,则计量将在上午 8:11 停止。在这种情况下,账单的计算方式如下:0.1570 USD * 5 分钟 * 3 个五分钟窗口 = 2.355 USD

  • 定价示例 1(使用 Amazon Rerank 1.0 模型重新排名)

    在给定的月份中,您使用 Amazon Rerank 1.0 模型向 Rerank API 发出 200 万个请求,100 万个请求包含少于 100 个文档,因此将按每个请求收费。 另外 100 万个请求包含 120-150 个文档,因此每个请求将按 2 个请求收费。

    一个请求的价格 = 0.001 美元
    总费用 = 1000000 * 0.001 美元 + 1000000 * 2 * 0.001 美元 = 3000 美元 

    定价示例 2:(结构化数据检索)

    应用程序开发人员创建了一个支持聊天机器人,用于查询存储在 Amazon Redshift 中的结构化数据。开发人员创建了一个 Bedrock 知识库并连接到 Amazon Redshift。聊天机器人每小时处理 10000 个用户查询。每个 GenerateQuery API 的费用为 0.002 美元,用于从用户查询生成 SQL。

    每小时生成 SQL 产生的总费用 = 0.002 美元 * 10000 = 20 美元。
    本月产生的总费用 = 20 美元 * 24 * 30 = 1440 美元

  • 示例:新闻摘要
    应用程序开发人员创建了一个流程来自动为交易者提供新闻摘要。该流程包括一个接收 S3 位置的输入节点和一个 S3 检索节点,该节点检索 10 个文件,其中包括来自 S3 中 10 家主要新闻机构的文章(2 个节点过渡)。然后,它使用迭代器节点调用带有提示节点的模型来汇总每个文件(+ 10 个文件 x 2 个节点过渡)。然后,它将使用收集器节点收集所有结果,使用 S3 存储节点将结果写入 S3,并在输出节点(+ 3 次节点转换)中完成。它们每周每半小时运行一次此流程。

    每次执行流程的节点转换次数为:2 + 1 + 10 * 2 + 3 = 25 次节点转换/流程执行

    每月的流程执行次数为:24 小时 * 2 * 5 天 * 4 周 = 960 次流程执行/月。

    每月账单总额为:25 * 960 * 0.035 美元/1000 = 0.84 美元

    额外费用
    账单还将包括工作流程执行中使用的 AWS 服务的额外费用,包括检索和存储节点中的 Amazon S3 使用费,以及提示节点中的 Amazon Bedrock 基础模型使用费。

  • 定价示例 1:
    假设您使用 BDA 自定义输出处理 1000 页的文档。所有 1000 个页面均使用具有 15 个字段的蓝图 1 进行处理。任何字段数不超过 30 个的蓝图的每页价格均为 0.040 美元。总费用将为 40 美元。

    处理的总页数 = 1000
    字段数少于 30 个的蓝图的每页价格 = 0.040 美元
    总费用 = 1000 * 0.040 美元 = 40 美元

     

    定价示例 2:
    假设您使用 BDA 自定义输出处理 2 个文档。文档 1 有 40 页,使用包含 20 个字段的蓝图 1 进行处理。文档 2 有 10 页,使用包含 40 个字段的蓝图 2 进行处理。蓝图 1 的每页价格为 0.040 美元,因为它包含 30 个或更少的字段。蓝图 2 的每页价格为 0.045 美元。使用蓝图 1 处理文档 1 的费用为 1.60 美元。使用蓝图 2 处理文档 2 的费用为 0.45 美元。处理这两个文档的总费用为 2.05 美元。

    处理的总页数 = 50
    字段数少于 30 个的蓝图 1 的每页价格 = 0.040 美元
    包含 40 个字段的蓝图 2 的每页价格 = 0.040 美元 +(超出 30 个之外的额外字段数 * 每个字段 0.0005 美元)
    超出 30 个之外的额外字段数 = 40 - 30 = 10
    包含 40 个字段的蓝图 2 的每页价格 = 0.040 美元 +(10 * 每个字段 0.0005 美元)= 0.045 美元
    使用蓝图 1 的文档 1 费用 = 40 页 x 每页 0.040 美元 = 1.6 美元
    使用蓝图 2 的文档 2 费用 = 10 页 x 每页 0.045 美元 = 0.45 美元
    总费用 = 文档 1 的费用 + 文档 2 的费用 = 1.6 美元 + 0.45 美元 = 2.05 美元

     

    定价示例 3:
    假设您使用 BDA 标准输出处理一段 60 分钟的视频。视频标准输出的每分钟价格为 0.050 美元。总费用将为 3.00 USD。

    处理的总分钟数 = 60
    视频标准输出的每分钟价格 = 0.050 美元
    总费用 = 60 * 0.050 美元 = 3.00 美元

     

    定价示例 4:
    假设您使用 BDA 自定义输出处理 2000 个图像。前 1000 个图像使用具有 10 个字段的蓝图 1 进行处理。后 1000 个图像使用具有 40 个字段的蓝图 2 进行处理。蓝图 1 的每个图像价格为 0.005 美元,因为它包含 30 个或更少的字段。蓝图 2 的每个图像价格为 0.01 美元。使用蓝图 1 处理前 1000 个图像的费用为 5.00 美元。使用蓝图 2 处理后 1000 个图像的费用为 10.00 美元。处理所有这 2000 个图像的总费用为 15.00 美元

    前 1000 个图像的费用 = 1000 个图像 * 每个图像 0.005 美元 = 5.00 美元
    后 1000 个图像的费用 = 1000 个图像 * [0.005 美元 +(超出 30 之外的额外字段数 * 每个字段 0.0005 美元)]
    = 1000 *{0.005 美元 + [(40-30)* 0.0005 美元]}
    = 1000 * [0.005 美元 + (10 * 0.0005 美元)] = 10.00 美元
    总费用 = 5.00 美元 + 10.00 美元 = 15.00 美元

     

    定价示例 5:
    假设您想要使用 Bedrock Data Automation 标准输出来处理组织中 15000 分钟的会议录音。处理所有 15000 分钟音频的总费用为 90 美元。

    处理的总分钟数 = 15000 分钟
    总费用 = 15000 分钟 × 0.006 美元 = 90 美元


    定价示例 6:
    假设您将 Bedrock 知识库设置为将 Bedrock Data Automation 用作解析器,然后提取了一份长达 1000 页的文档。请注意,Bedrock 知识库和 Bedrock Data Automation 集成使用标准输出。标准输出的每页价格为 0.010 美元。总费用将为 10 美元。

    处理的总页数 = 1000
    标准输出的每页价格 = 0.010 美元
    总费用 = 1000 * 0.010 美元 = 10 美元