Información general
AWS Lambda es un servicio informático sin servidor que le permite poner en marcha código sin aprovisionar ni administrar servidores. Cree una lógica de escalado de clústeres que tenga en cuenta la carga de trabajo, mantenga las integraciones de eventos y administre los tiempos de ejecución con facilidad. Con Lambda, puede ejecutar código para casi cualquier tipo de aplicación o servicio backend sin tener que administrar nada y pagando únicamente por lo que utilice. El cobro se determina por la cantidad de solicitudes para las funciones y el tiempo de ejecución del código.
Lambda cuenta una solicitud cada vez que comienza a ejecutarse en respuesta a un desencadenador de notificación de eventos (desde Amazon Simple Notification Service (SNS) o Amazon EventBridge, por ejemplo) o una llamada de invocación (desde Amazon API Gateway, por ejemplo) o a través de AWS SDK, lo que incluye las invocaciones de prueba desde la consola de AWS.
La duración se calcula desde el momento en que el código se inicia hasta que regresa o finaliza de algún modo y se redondea al 1 ms más cercano*. El precio depende del volumen de memoria asignado a la función. En el modelo de recursos de AWS Lambda, debe elegir el volumen de memoria que desea para la función y, posteriormente, se asignará la capacidad proporcional de CPU y de otros recursos. Un incremento del volumen de memoria activa un aumento equivalente en la capacidad de CPU disponible para la función. Para obtener más información, consulte la documentación sobre la configuración de funciones.
Puede ejecutar las funciones Lambda en procesadores creados en las arquitecturas x86 o Arm. Las funciones de AWS Lambda que se ejecutan en Graviton2, con una arquitectura de procesador basada en Arm diseñada por AWS, ofrecen un rendimiento de precios hasta un 34 % mejor en comparación con las funciones que se ejecutan en procesadores x86. Esto se aplica a una variedad de cargas de trabajo sin servidor, como backends web y móviles, datos y procesamiento de elementos multimedia.
* Los cargos de duración se aplican al código que se ejecuta en el gestor de una función, así como al código de inicialización que se declara fuera del gestor. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en finalizar durante la fase de cierre. En el caso de las funciones de Lambda configuradas con SnapStart, la duración también incluye el tiempo que se tarda en cargar la versión ejecutable, cualquier código que se ejecute en un enlace de versión ejecutable y el código de inicialización ejecutado durante la creación de copias de instantáneas creadas para garantizar la resiliencia. Para obtener más detalles, consulte la documentación del modelo de programación Lambda.
El nivel gratuito de AWS Lambda incluye un millón de solicitudes gratuitas al mes y 400 000 GB/segundos de tiempo de computación al mes, los cuales se pueden usar para funciones con x86 y procesadores Graviton2, en conjunto. Además, el nivel gratuito incluye 100 GiB de secuencia de respuestas HTTP al mes, más allá de los primeros 6 MB por solicitud, que son gratuitos. Lambda también ofrece opciones de precios por niveles para la duración bajo demanda que supera ciertos umbrales de uso mensual. AWS Lambda forma parte de Savings Plans para computación, un modelo de precios flexible que ofrece precios económicos por el uso de Amazon Elastic Compute Cloud (Amazon EC2), AWS Fargate y Lambda a cambio de comprometerse a una cantidad constante de uso (medida en USD por hora) durante un plazo de uno o tres años. Con Compute Savings Plans puede ahorrar hasta un 17 % en AWS Lambda. El ahorro se aplica a la duración y a la simultaneidad aprovisionada. Más información »
Calculadora de precios de AWS
Calcule el costo de su AWS Lambda y el de la arquitectura en una sola cotización.
Precios de AWS Lambda
El costo de la duración depende del volumen de memoria asignado a la función. Puede asignar a la función cualquier volumen de memoria desde 128 MB a 10 240 MB en incrementos de 1 MB. La siguiente tabla contiene algunos ejemplos del precio por 1 ms asociado con diferentes tamaños de memoria para el uso que se encuentra dentro del primer nivel de precios, por ejemplo, hasta 6 mil millones de GB/segundo por mes en la región Este de EE. UU. (Ohio).
-
Precio de x86
-
Precio de Arm
-
Precio de x86
-
-
Precio de Arm
-
Los niveles de precios de duración bajo demanda de Lambda se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura (x86 o Arm, respectivamente), en la misma región y dentro de la cuenta. Si utiliza la facturación unificada en AWS Organizations, los niveles de precios se aplican a la duración mensual agregada de sus características que se ejecutan en la misma arquitectura, en la misma región y en todas las cuentas de la organización.
Precios del almacenamiento efímero de Lambda
Los costos del almacenamiento efímero dependen de la cantidad de almacenamiento efímero que se asigne a la función y de la duración de ejecución de la función, medida en milisegundos. Puede asignar a la función cualquier cantidad adicional de almacenamiento entre 512 MB y 10 240 MB en incrementos de 1 MB. Puede configurar el almacenamiento efímero para las funciones que se ejecutan en arquitecturas x86 y Arm. Para cada función de Lambda, están disponibles 512 MB de almacenamiento efímero sin costo adicional. Solo paga por el almacenamiento efímero adicional que configure.
Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).
-
Ejemplo 1: backend de aplicación móvil
Supongamos que es un desarrollador de aplicaciones móviles que crea una aplicación para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.Supongamos que es un desarrollador de aplicaciones móviles que crea una aplicación para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria en un procesador basado en x86. Los cargos se calcularían de la siguiente manera:
Cargos mensuales por informática
El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
Informática total (segundos) = 3 millones * 120 ms = 360 000 segundos
Capacidad informática total (GB/s) = 360 000 * 1536 MB/1024 MB = 540 000 GB/s
Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
540 000 GB-s – 400 000 GB-s en el nivel gratuito = 140 000 GB-s
Cargos mensuales por informática = 140 000 * 0,0000166667 USD = 2,33 USDCargos de solicitudes mensuales
El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
3 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 millones de solicitudes mensuales facturables
Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USDCargos mensuales totales
Cargos totales = cargos por informática + cargos por solicitudes = 2,33 USD + 0,40 USD = 2,73 USD al mes
-
Ejemplo 2: enriquecer la telemetría en streaming con metadatos adicionales
Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en un flujo de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en un flujo de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.
Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, ha configurado su función con 1 GB de memoria y la ejecución de la función tarda una media de 2 segundos en completarse en un procesador basado en x86.
Cargos de solicitudes mensuales:
Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función Lambda.Cargos de solicitudes mensuales → 7,44 millones * 0,20 USD por millón = 1,488 USD ~= 1,49 USD
Cargos mensuales por informática:
Al mes, las funciones se ejecutarán una vez por mensaje durante 2 segundos.Duración mensual de informática (segundos) → 7,44 millones * 2 segundos = 14,88 millones de segundos
Informática mensual (GB-s) → 14,88 millones de segundos * 1024 MB/1024 MB = 14,88 GB-s
Cargos mensuales por informática → 14,88 millones de GB-s * 0,0000166667 USD = 248,00 USDCargos mensuales totales:
Cargos mensuales totales = cargos por solicitudes + cargos por informática = 1,49 USD + 248,00 USD = 249,49 USD -
Ejemplo 3: llevar acabo ML en los tickets e interacciones de atención al cliente para mejorar la experiencia del cliente
Supongamos que es una empresa de servicios financieros que desea conocer mejor sus principales problemas de atención al cliente. Su objetivo es mejorar la experiencia del cliente y reducir la pérdida de clientela. Los clientes pueden conversar en directo con el personal de atención al cliente a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).Supongamos que es una empresa de servicios financieros que desea conocer mejor sus principales problemas de atención al cliente. Su objetivo es mejorar la experiencia del cliente y reducir la pérdida de clientela. Los clientes pueden conversar en directo con el personal de atención al cliente a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o derivar al cliente al agente de atención adecuado. El número de consultas de asistencia que procesa su modelo de inferencia varía mucho a lo largo de la semana.
Supongamos que sus funciones que ejecutan el modelo de inferencia reciben 6 millones de solicitudes al mes. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86.
También configura la función para que utilice 2048 MB de almacenamiento efímero.
Los cargos se calcularían de la siguiente manera:
Cargos mensuales por informática:
El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
Informática total (GB-s) = 1 680 000 * 4096 MB/1024 MB = 6 720 000 GB-s
Informática total – informática en el nivel gratuito de AWS = GB-s de informática facturable al mes
6 720 000 GB-s – 400 000 GB-s en el nivel gratuito = 6 320 000 GB-s
Cargos mensuales por informática = 6 320 000 * 0,0000166667 USD = 105,33 USDCargos mensuales por solicitudes:
El precio mensual por solicitudes es de 0,20 USD por un millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
6 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 5 millones de solicitudes mensuales facturables
Cargos mensuales por solicitudes = 5 millones * 0,2 USD por millón = 1 USDCargos mensuales por almacenamiento efímero:
El precio mensual por almacenamiento efímero es de 0,0000000309 USD por cada GB/segundo y Lambda ofrece 512 MB de almacenamiento sin costo adicional.
Informática total (segundos) = 6 millones * 280 ms = 1 680 000 segundos
Almacenamiento efímero total facturable = 2048 MB – 512 MB = 1536 MB
Almacenamiento efímero total (GB-s) = 1 680 000 * 1536 MB/1024 MB = 2 520 000 GB-s
Cargos mensuales por almacenamiento efímero = 2 520 000 * 0,0000000309 USD = 0,08 USDCargos mensuales totales:
Cargos totales = cargos por informática + cargos por solicitudes = 105,33 USD + 1 USD + 0,08 USD = 106,41 USD al mes
Precios de la simultaneidad aprovisionada
Para tener mayor control sobre el rendimiento de sus aplicaciones sin servidor, habilite la simultaneidad aprovisionada para sus funciones Lambda. Cuando se habilita, la simultaneidad aprovisionada mantiene las funciones activadas y en el mayor estado de preparación para responder en milisegundos de dos dígitos. Paga por la cantidad de simultaneidad que configura y por el periodo por el que lo hace. Cuando la simultaneidad aprovisionada está habilitada y se ejecuta para su función, también paga por las solicitudes y por la duración en función de los precios que se muestran a continuación. Si la función excede la que figura en su configuración, se le cobrará por la ejecución de las funciones excedentes según las tarifas que figuran en la sección anterior Precios de AWS Lambda. Puede activar la simultaneidad aprovisionada para las funciones que se ejecutan en las arquitecturas x86 y Arm. Para obtener más información sobre la simultaneidad aprovisionada, consulte la documentación.
La simultaneidad aprovisionada se calcula desde el momento en que la habilita para su función hasta que la desactiva y se redondea a los 5 minutos más cercanos. El precio depende del volumen de memoria que asigne a su función y la cantidad de simultaneidad que configure. La duración se calcula a partir del momento en que el código comienza a ejecutarse hasta que regresa o finaliza de algún modo, y se redondea al 1 ms más cercano**. El precio depende del volumen de memoria asignado a la función.
** Los cargos de duración se aplican al código que se ejecuta en el gestor de una función, así como al código de inicialización que se declara fuera del gestor. En el caso de las funciones de Lambda con extensiones de AWS Lambda, la duración también incluye el tiempo que tarda el código de la última extensión en ejecución en terminar de ejecutarse durante la fase de cierre. Para las funciones configuradas con simultaneidad aprovisionada, AWS Lambda recicla periódicamente los entornos de ejecución y repite el código de inicialización. Para obtener más detalles, revise la documentación del modelo de programación de Lambda.
No se aplicará el nivel gratuito de Lambda a las funciones que tengan habilitada la simultaneidad aprovisionada. Si habilita la simultaneidad aprovisionada en una función y luego la ejecuta, se le cobrará por las solicitudes y por la duración en función de los precios que se muestran a continuación.
Todos los ejemplos que se muestran a continuación se basan en el precio de la región EE. UU. Este (Norte de Virginia).
-
Ejemplo 1: lanzamiento de aplicación móvil
Supongamos que es un desarrollador de aplicaciones móviles y crea una aplicación móvil para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda de su aplicación, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.Supongamos que es un desarrollador de aplicaciones móviles y crea una aplicación móvil para pedir comida. Los clientes pueden utilizar la aplicación para pedir comida en un restaurante concreto, recibir actualizaciones sobre el estado del pedido y recogerlo cuando esté listo. Debido a que espera una gran variación en la demanda de su aplicación, tanto por la hora del día como por la ubicación del restaurante, crea su backend móvil mediante servicios sin servidor, lo que incluye a AWS Lambda.Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. La
duración media de la ejecución de la función es de 120 ms. Se ha configurado la función con 1536 MB de memoria, en un procesador basado en x86.Va a hacer el lanzamiento de la nueva versión de su aplicación móvil, que ha comercializado intensamente. Espera un pico en la demanda durante el día del lanzamiento, desde el mediodía hasta las 8 de la tarde. Quiere que su aplicación móvil tenga capacidad de respuesta incluso cuando la demanda aumenta y disminuye rápidamente, por lo que habilita la simultaneidad aprovisionada en sus funciones Lambda. Establece la simultaneidad aprovisionada en 100.
Durante esas ocho horas, sus funciones recibieron 500 000 solicitudes. La duración media
de ejecución de la función mientras la simultaneidad aprovisionada está habilitada es de 100 ms. Durante el resto del mes, su aplicación recibe las 2,5 millones de solicitudes adicionales y las funciones se ejecutan en respuesta a ellas sin que esté habilitada la simultaneidad aprovisionada.Los cargos se calcularían de la siguiente manera:
Cargos por simultaneidad aprovisionada:
El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s
Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 8 horas = 3600 segundos = 28 800 segundos
Simultaneidad configurada total (GB): 100 * 1536 MB/1024 MB = 150 GB
Cantidad total de simultaneidad aprovisionada (GB-s) = 150 GB * 28 800 segundos = 4 320 000 GB-s
Cargos por simultaneidad aprovisionada: 4,32 millones de GB-s * 0,0000041667 USD = 18 USDCargos por solicitudes:
El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
Solicitudes totales – solicitudes en el nivel gratuito = solicitudes facturables al mes
3 000 000 de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 000 000 de solicitudes facturables al mes
Cargos de solicitudes mensuales = 2 * 0,20 USD = 0,40 USDCargos por informática cuando la simultaneidad aprovisionada está habilitada:
El precio de la informática es de 0,0000097222 USD por GB-s
Duración total de informática (segundos) = 500 000 * 100 ms = 50 000 segundos
Informática total (GB-s) = 50 000 segundos * 1536 MB/1024 MB = 75 000 GB-s.
Cargos totales por informática = 75 000 GB-s * 0,0000097222 USD = 0,73 USD
Cargos por informática cuando la simultaneidad aprovisionada está desactivada:
El precio mensual por informática es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
Informática total (segundos) = 2,5 millones * 120 ms = 300 000 segundos
Informática total (GB-s) = 300 000 * 1536 MB/1024 MB = 450 000 GB-s
Informática total – informática en el nivel gratuito = GB-s de informática facturable al mes
450 000 GB-s – 400 000 GB-s en el nivel gratuito = 50 000 GB-s
Cargos mensuales por informática = 50 000 * 0,0000166667 USD = 0,83 USD
Cargos mensuales totales:
Cargos totales = cargos de simultaneidad aprovisionada + cargos por solicitud + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por informática cuando la simultaneidad aprovisionada está desactivada
Cargos totales = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD
-
Ejemplo 2: dirigir a los clientes al contenido de la solución de asistencia más relevante durante Cyber Monday
Supongamos que es un minorista que lleva a cabo una gran venta durante Cyber Monday, una fiesta del comercio electrónico que tiene lugar el lunes después de Acción de Gracias en Estados Unidos. Sus clientes pueden conversar en directo con el servicio de asistencia a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).Supongamos que es un minorista que lleva a cabo una gran venta durante Cyber Monday, una fiesta del comercio electrónico que tiene lugar el lunes después de Acción de Gracias en Estados Unidos. Sus clientes pueden conversar en directo con el servicio de asistencia a través de la aplicación móvil que proporcione. Decide implementar un modelo de procesamiento de lenguaje natural (PLN).En este caso, utiliza el popular modelo de Representación de Codificador Bidireccional de Transformadores (BERT) en AWS Lambda. El modelo le ayuda a analizar sintácticamente, examinar y comprender las interacciones del servicio de atención al cliente a través de la aplicación móvil con el fin de mostrar el contenido de asistencia pertinente o dirigir al cliente con el agente de atención adecuado. Durante esta venta recibirá muchas más consultas de asistencia al cliente de lo habitual, por lo que decide habilitar simultaneidad aprovisionada en sus funciones Lambda para que la aplicación responda rápidamente incluso cuando experimente picos de tráfico.
Supongamos que sus funciones reciben dos millones de solicitudes durante las 24 horas del evento de venta, mientras la simultaneidad aprovisionada está habilitada. La duración media de la ejecución de la función es de 280 ms. Se ha configurado la función con 4096 MB de memoria en un procesador basado en x86 y se estableció la simultaneidad aprovisionada en siete.
Los cargos se calcularían de la siguiente manera:
Cargos por simultaneidad aprovisionada:
El precio de la simultaneidad aprovisionada es de 0,0000041667 USD por cada GB-s.
Periodo total en que la simultaneidad aprovisionada está habilitada (segundos) = 24 horas = 3600 segundos = 86 400 segundos
Simultaneidad configurada total (GB): 7 * 4096 MB/1024 MB = 28 GB
Cantidad total de simultaneidad aprovisionada (GB-s) = 28 GB * 86 400 segundos = 2 419 200 GB-s
Cargos por simultaneidad aprovisionada = 2 419 200 GB-s * 0,0000041667 USD = 10,08 USDCargos por informática cuando la simultaneidad aprovisionada está habilitada:
El precio de la informática es de 0,0000097222 USD por GB-s.
Duración total de informática (segundos) = 2 000 000 * 280 ms = 560 000 segundos
Informática total (GB-s) = 560 000 segundos * 4096 MB/1024 MB = 2 240 000 GB-s.
Cargos totales por informática = 2 240 000 GB-s * 0,0000097222 USD = 21,78 USDCargos de solicitudes mensuales:
El precio mensual por solicitudes es de 0,20 USD por cada millón de solicitudes
Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USDCargos mensuales totales:
Cargos totales = cargos por simultaneidad aprovisionada + cargos por informática cuando la simultaneidad aprovisionada está habilitada + cargos por solicitudes = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD
Precios de SnapStart
Se crea una instantánea cada vez que publica una nueva versión de la función con SnapStart activado. Se le cobra por almacenar en caché una instantánea durante el periodo en el que la versión de su función esté activa, durante un mínimo de 3 horas y por milisegundo a partir de entonces. El precio depende del volumen de memoria asignado a la función. También se le cobrará cada vez que Lambda reanude un entorno de ejecución mediante la restauración de la instantánea, y el precio dependerá de la cantidad de memoria que asigne a la función.
Los precios de SnapStart no se aplican a las versiones ejecutables administradas de Java compatibles.
-
Ejemplo de precios: enriquecer la telemetría de streaming con metadatos adicionales
Digamos que es una empresa de logística con una flota de vehículos en el sitio, cada uno de los cuales está habilitado con sensores y conectividad 4G o 5G para emitir datos de telemetría en una secuencia de datos de Amazon Kinesis. Desea utilizar los modelos de machine learning (ML) que ha desarrollado para inferir el estado del vehículo y predecir cuándo podría ser necesario el mantenimiento de determinados componentes.
Supongamos que hay 10 000 vehículos en el sitio, cada uno de los cuales emite telemetría una vez por hora de forma escalonada con suficiente fluctuación. Pretende llevar a cabo esta inferencia en cada carga para asegurarse de que los vehículos están programados puntualmente para el mantenimiento y garantizar el estado óptimo de su flota.
Supongamos que el modelo de ML está empaquetado junto con la función y tiene un tamaño de 512 MB. Para la inferencia, configuró su función con 1 GB de memoria y la ejecución facturada tarda una media de dos segundos en un procesador basado en x86. Mantiene una única versión de la función. Para simplificar, supongamos que el 1 % de todas las solicitudes dan lugar a la creación de nuevos entornos de ejecución.
Observa que el procesamiento de principio a fin tarda varios segundos para este 1 % de las solicitudes. Esto se debe a que la inicialización de la función tarda varios segundos, ya que importa módulos de software grandes y el modelo ML durante la inicialización. Desea reducir el tiempo de procesamiento de principio a fin de estas solicitudes, por lo que debe habilitar SnapStart en la función y publicar una nueva versión.
Los cargos se calcularían de la siguiente manera:
Cargos por solicitudes
Al mes, los vehículos emitirán 10 000 * 24 * 31 = 7 440 000 mensajes que serán procesados por la función de Lambda.Cargos de solicitudes mensuales: 7,44 millones * 0,20 USD por millón = 1,49 USD
Cargos de computación mensuales
Al mes, su función se ejecutará una vez por mensaje durante dos segundos.Duración mensual de computación (segundos): 7,44 millones * 2 segundos = 14,88 millones de segundos
Computación mensual (GB/s): 14,88 millones de segundos* 1024 MB/1024 MB = 14,88 millones de GB/s
Cargos mensuales de computación: 14,88 millones de GB/s * 0,0000166667 USD = 248,00 USDCargos de SnapStart:
Periodo total durante el cual la versión de la función está activa (segundos): 24 horas * 31 días * 3600 segundos = 2 678 400 segundos
Memoria asignada para funciones: 1024 MB/1024 MB -> 1 GB
Caché total de SnapStart utilizado: 1 GB * 2 678 400 segundos -> 2 678 400 GB/s
Cargos por la caché de SnapStart: 2,68 millones de GB/s * 0,0000015046 USD = 4,03 USDNúmero de solicitudes que utilizan SnapStart Restore: 1 % de 7,44 millones = 74 400
Total de SnapStart Restore utilizado: 74 400 x 1 GB = 74 400 GB
Cargos de restauración de SnapStart: 74 400 GB * 0,0001397998 = 10,4 USDCargos totales de SnapStart: cargos por la caché de SnapStart + cargos de restauración de SnapStart
Cargos totales de SnapStart: 4,03 USD + 10,4 USD = 14,43 USDCargos mensuales totales
Cargos totales = cargos por solicitudes + cargos por computación + cargos de SnapStart
Cargos totales = 1,49 USD + 248,00 USD + 14,43 USD = 263,92 USD
Precios de la secuencia de respuestas HTTP de Lambda
Todos los ejemplos que se muestran a continuación se basan en el precio de la región Este de EE. UU. (Norte de Virginia).
-
Ejemplo de precios: contenido web renderizado desde el lado del servidor de streaming
Supongamos que es un desarrollador de aplicaciones web y está creando un sitio web que se renderiza en el lado del servidor en una función de Lambda. La función de Lambda genera contenido HTML de forma dinámica en función de la solicitud y los resultados de varias llamadas de servicios descendentes. Algunas de estas llamadas pueden tardar mucho tiempo en devolver una respuesta. Para optimizar la experiencia de carga de páginas de los usuarios, utiliza las capacidades de secuencia de respuestas HTTP de Lambda para mejorar el rendimiento del tiempo hasta el primer byte al representar los primeros fragmentos de HTML en el navegador tan pronto como la función los genere.
Para simplificar, supongamos que su aplicación procesa tres millones de solicitudes al mes. Supongamos también que ha agotado los 100 GB de secuencia de respuestas incluidos en el nivel gratuito de AWS. La duración media de la función es de 500 ms. Se ha configurado la función con 1536 MB de memoria, en un procesador basado en x86. El tamaño medio de la carga útil por solicitud es de 100 KB para los dos primeros millones de solicitudes al mes y de 7 MB para el último millón de solicitudes al mes. El cálculo del ejemplo supone que 1 GB = 1024 MB.
Los cargos se calcularían de la siguiente manera:
Cargos por cómputos mensuales
El precio mensual por computación es de 0,0000166667 USD por GB-s y el nivel gratuito ofrece 400 000 GB-s.
Computación total (segundos) = 3 millones * 500 ms = 1 500 000 segundos
Capacidad de computación total (GB/s) = 1 500 000 * 1536 MB/1024 MB = 2 250 000 GB/s
Computación total – computación en el nivel gratuito = GB-s de computación facturable al mes
2 250 000 GB-s – 400 000 GB-s en el nivel gratuito = 1 850 000 GB-s
Cargos por computación mensuales = 1 850 000 * 0,0000166667 USD = 30,83 USDCargos de solicitudes mensuales
El precio mensual por solicitudes es de 0,20 USD por 1 millón de solicitudes y el nivel gratuito ofrece un millón de solicitudes al mes.
Solicitudes totales – solicitudes del nivel gratuito = solicitudes facturables al mes
3 millones de solicitudes – 1 millón de solicitudes en el nivel gratuito = 2 millones de solicitudes mensuales facturables
Cargos de solicitudes mensuales = 2 millones * 0,2 USD por millón = 0,40 USDCargos por bytes procesados
El precio de transmisión mensual de bytes es de 0,008 USD por GB transmitido y el nivel gratuito ofrece 100 GB al mes. Los primeros 6 MB transmitidos por solicitud también son gratuitos.
Bytes libres transmitidos (GB) = 2 millones de solicitudes * 100 KB = 190,7 GB
Dado que 100 KB < 6 MB por solicitud, los 190,7 GB transmitidos son gratuitos.
Bytes cargables transmitidos (GB) = 1 millón de solicitudes * (7 MB — 6 MB) = 976,56 GB
Cargos mensuales de transmisión de bytes = 976,56 GB * 0,008 USD = 7,81 USDCargos mensuales totales:
Cargos totales = cargos de computación + cargos de solicitud + cargos de transmisión de bytes = 30,83 USD + 0,40 USD + 7,81 = 39,04 USD al mes
Precios del modo aprovisionado para la asignación de orígenes de eventos (ESM)
El modo aprovisionado para la asignación de orígenes de eventos (ESM) le permite optimizar el rendimiento de su ESM al asignar una cantidad mínima y máxima de recursos denominados sondeos de eventos y al escalado automático entre los límites mínimo y máximo configurados. Esta característica es ideal para aplicaciones basadas en eventos en tiempo real que registran picos repentinos de tráfico. Un sondeador de eventos es el recurso configurable que sustenta un ESM en modo aprovisionado y proporciona un rendimiento de hasta 5 MB/s. Los precios se basan en los sondeadores de eventos mínimos aprovisionados y en los sondeadores de eventos consumidos durante el escalado automático. Los cargos se calculan mediante una unidad de facturación denominada unidad del sondeador de eventos (EPU). Cada EPU admite hasta 20 MB/s de rendimiento para el sondeo de eventos, y la cantidad de sondeadores de eventos asignados a una EPU depende del rendimiento consumido por cada sondeador de eventos. Usted paga por la cantidad y la duración de las EPUs utilizadas, medidas en horas de unidad del sondeador de eventos.
Transferencia de datos: se le cobrarán las tarifas estándar de transferencia de datos de AWS.
Duración: el precio se calcula por segundo con un mínimo de 1 minuto.
-
Ejemplo de precios:
Ejemplo: análisis de datos de streaming en tiempo real con KafkaEjemplo: análisis de datos de streaming en tiempo real con KafkaSupongamos que es un proveedor global de soluciones de centros de atención al cliente y tiene canalizaciones que envían metadatos relacionados con la experiencia de las llamadas a temas de Amazon MSK (Kafka) para su análisis en tiempo real. Dado que el tráfico puede ser irregular e impredecible, es recomendable utilizar el modo aprovisionado para ESM a fin de refinar el rendimiento de su ESM. Supongamos que la función de Lambda que procesa estos mensajes está configurada con 1024 MB de memoria para el procesador x86 y recibe 1 millón de invocaciones por día con una duración media de 2 segundos. Supongamos que ha activado el modo aprovisionado para su ESM con el sondeador de 1 evento predeterminado y que su ESM se escala verticalmente hasta consumir 800 horas de EPU al mes en el este de EE. UU. (Norte de Virginia).
Cargos de computación mensuales
El precio de mensual por computación es de 0,0000166667 USD por GB-s, y el nivel gratuito ofrece 400 000 GB-s
Gastos de computación totales (segundos) = 1 000 000 * 30 * 2 segundos = 60 000 000 segundos
Gastos de computación totales (GB-s) = 60 000 000 * 1024 MB/1024 = 60 000 000 GB-s
Gastos de computación totales – computación en el nivel gratuito = GB-s de computación facturable al mes
60 000 000 GB-s – 400 000 GB-s en el nivel gratuito = 59 600 000 GB-s
Cargos mensuales por computación = 59 600 000 * 0,0000166667 USD = 993,3 USDCargos de solicitudes mensuales
El precio de solicitud mensual es de 0,20 USD por millón de solicitudes.
Cargos de solicitudes mensuales = 60 millones de solicitudes * 0,20 USD = 12,00 USDModo aprovisionado mensual para cargos de ESM
Cargos de EPU = 800 horas de EPU * 0,185 USD = 148 USD
Modo aprovisionado mensual para cargos de ESM = 148 USDCargos totales
Cargos totales = cargos por computación + cargos por solicitudes + cargos de modo aprovisionado para ESM
Cargos totales = 993,3 USD + 12 USD + 148 USD = 1153,3 USD
Transferencia de datos y otros cargos
Transferencia de datos
Los datos que se transfieren tanto desde como hacia las funciones de AWS Lambda desde fuera de la región en la que se ejecutan se cobrarán con los precios para transferencias de datos de Amazon EC2 tal y como se describen en la sección “Transferencia de datos”.
La transferencia de datos con AWS Lambda Functions es gratuita en la misma región de AWS entre los siguientes servicios: Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) y Amazon SimpleDB.
El uso de Amazon Virtual Private Cloud (VPC) o interconexión de VPC con funciones de AWS Lambda incurrirá en cargos adicionales como se explica en la página de precios de servicios en diferido de Amazon Elastic Compute Cloud (EC2). Una interconexión de VPC es una conexión de redes entre dos VPC que permite enrutar el tráfico entre ellas mediante direcciones IPv4 privadas o direcciones IPv6.
Para obtener más detalles sobre los precios de los servicios de AWS, consulte la sección de precios en las páginas de los productos de AWS correspondientes.
Precios de Lambda@Edge
Las funciones de Lambda@Edge se calculan con una granularidad de 1 ms
-
Ejemplo de precios:
Si la función de Lambda@Edge se ejecuta 10 millones de veces en un mes durante 10 ms cada vez, el costo se calcularía de la siguiente manera:Si la función de Lambda@Edge se ejecuta 10 millones de veces en un mes durante 10 ms cada vez, el costo se calcularía de la siguiente manera:Cargos por cómputos mensuales
El precio mensual por cómputos es de 0,00000625125 USD por 128 MB/segundo
Cómputos totales (segundos) = 10 millones * (0,01 s) = 100 000 segundos
Cargos por cómputos mensuales = 100 000 * 0,00000625125 USD = 0,63 USD
Cargos de solicitudes mensualesEl precio de solicitud mensual es de 0,60 USD por millón de solicitudes.
Cargos de solicitudes mensuales = 10 millones * 0,6 USD/millón = 6,00 USD
Cargos mensuales totales
Cargos totales = cargos de computación + cargos de solicitud = 0,63 USD + 6,00 USD = 6,63 USD al mes
Recursos de precios adicionales
Calcule fácilmente los costos mensuales en AWS
Contacte con los especialistas de AWS para obtener un presupuesto personalizado