개요
Amazon Redshift를 통해, 시간당 0.25 USD의 비용으로 작게 시작하여 페타바이트의 데이터와 수천 명의 동시 사용자로 확장할 수 있습니다. 컴퓨팅이나 스토리지를 과도하게 프로비저닝하지 않고 스토리지를 확장할 수 있으므로 비즈니스 요구 사항에 적합한 항목을 선택하세요. 프로비저닝된 Amazon Redshift의 경우 온디맨드 인스턴스를 선택하고 장기 약정 또는 선불 요금 없이 시간당 데이터베이스 요금을 지불하거나 예약 인스턴스를 선택하여 추가로 요금을 절약할 수 있습니다. 또는 Amazon Redshift Serverless에서는 자동으로 시작하고 종료하며 애플리케이션의 요구 사항에 따라 용량을 조정(확장 또는 축소)하여 사용량에 대한 요금만 청구하므로, 워크로드를 처리하는 동안 이용한 용량에 대한 요금만 내면 됩니다.
프로비저닝된 Amazon Redshift에서 예상되는 기능
우선, 필요에 따른 최적의 클러스터 구성을 선택할 수 있도록 노드 유형에 대해 자세히 알아봅니다. Redshift 콘솔에서 한 번의 API 호출 또는 몇 번의 클릭으로 클러스터의 크기를 조절하고, 클러스터를 일시 중지하고 재개하며, 노드 유형을 전환할 수 있습니다. 선택하기 전에 온디맨드 요금이 표시되며, 나중에 상당히 할인된 가격으로 예약 노드를 구매할 수 있습니다.
선택한 후에는 탄력적 크기 조정 기능을 사용하여 안정적인 처리를 위해 몇 분 안에 프로비저닝된 컴퓨팅 용량 크기를 쉽게 조정할 수 있습니다. 크기 조정 스케줄러를 사용하면 매일 또는 매주 노드를 추가 및 제거하여 비용을 최적화하고 최상의 성능을 유지할 수 있습니다. 동적 워크로드에 대해 동시성 확장 기능을 사용하여 추가 컴퓨팅 용량을 자동으로 프로비저닝할 수 있으며, 무료 크레딧을 소진한 후에는 초당 사용한 만큼만 지불하면 됩니다(동시성 확장 요금 참조).
Amazon Redshift 노드 유형
관리형 스토리지가 포함된 RA3 노드를 사용하면 컴퓨팅 및 관리형 스토리지를 개별적으로 조절하고 비용을 지불하는 방식으로 데이터 웨어하우스를 최적화할 수 있습니다. RA3에서는 성능 요구 사항에 따라 노드 수를 선택하며, 사용하는 관리형 스토리지에 대해서만 비용을 지불합니다. RA3 클러스터는 매일 처리하는 데이터 크기에 따라 크기를 조정해야 합니다.
Redshift Managed Storage(RMS)는 각 RA3 노드에서 빠른 로컬 스토리지에는 대용량 고성능 솔리드 스테이트 드라이브(SSD)를 사용하며, 내구성이 뛰어난 장기 스토리지에는 Amazon Simple Storage Service(Amazon S3)를 사용합니다. 한 노드의 데이터가 대용량 로컬 SSD의 크기보다 커지는 경우 RMS는 자동으로 데이터를 Amazon S3에 오프로드합니다. 데이터가 고성능 SSD 또는 Amazon S3 중에 어디에 상주하는지와 관계없이 고객은 RMS와 동일한 낮은 요금만 지불하면 됩니다. 확장 가능한 스토리지가 필요한 워크로드의 경우 관리형 스토리지를 사용하면 노드를 추가하거나 추가 노드 비용을 지불하지 않고도 데이터 웨어하우스 스토리지 용량을 자동으로 조정할 수 있습니다.
DC2 노드는 로컬 SSD 스토리지가 포함된 컴퓨팅 집약적인 데이터 웨어하우스를 사용할 수 있습니다. 데이터 크기와 성능 요구 사항에 따라 필요한 노드의 수를 선택하기만 하면 됩니다. DC2 노드는 뛰어난 성능을 위해 데이터를 로컬로 저장하며, 데이터 크기가 커지면 컴퓨팅 노드를 더 추가하여 클러스터의 스토리지 용량을 늘릴 수 있습니다. 1 TB 미만의 압축되지 않은 데이터 세트에 대해서는 가장 저렴한 가격으로 최고의 성능을 낼 수 있도록 DC2 노드 유형을 권장합니다. 데이터가 커질 것으로 예상되면 최상의 가격과 성능을 위해 개별적으로 컴퓨팅 및 스토리지 크기를 조정할 수 있도록 RA3 노드 사용을 권장합니다.
종량 과금제 요금에 따른 Redshift 용량
- Amazon Redshift 노드 유형: 필요에 따른 최적의 클러스터 구성 및 노드 유형을 선택하고, Amazon Redshift 온디맨드 요금에 따라 시간당 용량에 대한 비용을 지불할 수 있습니다. 온디맨드 요금을 선택하면, 클러스터를 사용하지 않을 때 온디맨드 요금을 중지하기 위해 중지 및 다시 시작 기능을 사용할 수 있습니다. 또한, 예약 인스턴스를 안정된 상태 워크로드에 대한 온디맨드 인스턴스 대신 선택하여 온디맨드 요금에 상당한 할인을 받을 수 있습니다.
- Amazon Redshift Spectrum 요금: Amazon S3 데이터 레이크에서 엑사바이트까지 데이터에 대해 직접 SQL 쿼리를 실행할 수 있습니다. 스캔한 바이트 수에 대한 요금만 지불하면 됩니다.
- 동시성 확장 요금: 각각의 클러스터는 하루에 최대 1시간 분량의 동시성 확장 크레딧을 무료로 획득하는데, 이는 97%의 고객에게 충분한 수준입니다. 따라서 사용자는 수천의 동시 쿼리와 사용자가 있더라도 빠른 성능을 일관되게 제공할 수 있습니다. 무료 크레딧을 초과하는 사용량에 대해서는 초당 온디맨드 요금을 지불하면 됩니다.
- RMS 요금: 프로비저닝된 컴퓨팅 노드의 수에 관계없이, RA3 클러스터에 저장하는 데이터에 대해서만 지불합니다. 관리형 스토리지에서 데이터의 총량에 대해 시간 단위로 지불하기만 하면 됩니다. RMS는 Amazon Redshift 서버리스에서도 사용할 수 있습니다.
- Redshift 기계 학습: SQL을 사용하여 기계 학습(ML) 모델을 생성하고 훈련하며 배포할 수 있습니다. Amazon SageMaker의 프리 티어를 모두 소진한 후에는 모델 및 스토리지 생성 시 비용이 청구됩니다. Redshift 기계 학습은 Amazon Redshift Serverless에서도 사용할 수 있습니다.
Amazon Redshift 무료 평가판
이전에 Amazon Redshift Serverless를 사용해본 적이 없다면 컴퓨팅 및 스토리지 사용과 관련하여 300 USD의 크레딧(90일 후 만료)을 받을 수 있습니다. 이 크레딧의 소비율은 서버리스 엔드포인트의 컴퓨팅 용량 및 실제 사용량에 따라 달라집니다.
Amazon Redshift Serverless가 아직 제공되지 않는 리전에서는 프로비저닝된 클러스터에 대한 무료 평가판을 시작할 수 있습니다. DC2 대형 노드의 2개월 무료 평가판을 이용할 수 있습니다. 매월 750시간을 무료로 사용할 수 있으며 이 정도면 160GB의 압축된 SSD 스토리지로 1개의 DC2 대형 노드를 계속 실행하기에 충분한 시간입니다. 2개월의 무료 평가판이 만료되거나 월별 750시간을 초과하여 사용하는 경우, 요금이 발생하지 않도록 클러스터를 종료하거나 표준 온디맨드 요금으로 계속 실행할 수 있습니다. 자세히 알아보려면 Amazon Redshift 무료 평가판 페이지로 이동하세요.
온디맨드 요금
Amazon Redshift 온디맨드 요금을 이용하면 데이터 웨어하우스를 실행하기 위해 선택한 특정 노드 유형에 대해 약정 및 선결제 비용 없이 시간을 기준으로 프로비저닝된 용량에 대한 비용을 지불할 수 있습니다. 클러스터에 있는 노드 수와 선택한 유형에 따라 시간별 요금만 지불하면 됩니다. 클러스터가 실행되는 동안 비용이 청구됩니다. 부분적으로 사용된 사용 시간은 클러스터 생성, 삭제 일시 중지 또는 다시 시작과 같은 청구 가능한 상태 변경 후 1초 단위로 청구됩니다. 일시 중지 및 다시 시작 기능을 사용하면 클러스터가 일시 중지된 시간 동안 온디맨드 결제를 일시 중단할 수 있습니다. 일지 중지 및 재개는 Redshift 노드 유형에서 예약된 작업 또는 수동 작업입니다. 클러스터가 일시 중지된 시간 동안에는 백업 스토리지에 대해서만 비용을 지불하면 됩니다. 이를 통해 데이터 웨어하우스 용량을 미리 계획하고 구매할 필요 없이 개발 또는 테스트 목적으로 환경을 비용 효율적으로 관리할 수 있습니다. 다중 AZ 배포의 경우 동일한 청구 요금을 지불하지만 단일 AZ 배포에 대해 지불하는 것에 비해 두 배의 컴퓨팅 요금을 지불합니다.
현재 세대
*각 RA3 노드에서 관리형 스토리지의 액세스 가능한 총 주소 지정 가능 스토리지 용량.
이전 세대
연간 TB당 실질 온디맨드 요금 계산
온디맨드의 경우, 연간 TB당 실질 요금은 인스턴스의 시간당 요금에 연간 시간 수를 곱한 후 인스턴스당 TB 수로 나눈 값입니다. RA3의 경우 관리형 스토리지에 저장된 데이터는 RA3 유형에 저장된 실제 데이터에 따라 개별적으로 청구됩니다. 컴퓨팅 노드 비용에 대해서만 연간 TB당 실질 요금이 계산됩니다.
Amazon Redshift Serverless
시간당 최저 3 USD에 Amazon Redshift Serverless를 사용할 수 있으며 데이터 웨어하우스가 활성 상태일 때 사용한 컴퓨팅 파워에 대해서만 비용을 지불하면 됩니다. 데이터 웨어하우스 용량은 분석 워크로드 요구 사항에 맞춰 자동으로 스케일 업되거나 스케일 다운되며, 비활성 상태일 때는 종료되므로 비용 및 관리 시간을 절감합니다. Amazon Redshift는 Redshift 처리 단위(RPU)로 데이터 웨어하우스 용량을 측정합니다. Amazon S3에서 열린 파일 형식의 데이터에 액세스하는 쿼리를 포함하여 초당 RPU-시간(최소 60초 요금 기반)을 기준으로 실행하는 워크로드에 대한 비용이 청구됩니다. 데이터 웨어하우스 시작 시간에 대한 비용은 청구되지 않습니다. 자동 크기 조정 및 포괄적인 보안 기능이 포함되어 있습니다. 동시 규모 조정 및 Redshift Spectrum은 Amazon Redshift Serverless에 모두 포함되어 있으므로 별도로 이에 대한 요금을 지불하지 않아도 됩니다.
원하는 경우 데이터 웨어하우스 성능 및 비용을 제어하기 위해 기본, 최대 RPU-시간 및 MaxRPU(최대 용량) 설정을 사용할 수 있습니다.
- 기본 - 이 설정에서는 Amazon Redshift에서 쿼리를 지원하기 위해 사용하는 기본 데이터 웨어하우스 용량을 지정할 수 있습니다. 기본 용량은 RPU로 지정됩니다. 특히 많은 데이터를 처리하고 변환과 기능 강화를 수행하는 데이터 처리 및 추출, 전환, 적재(ETL) 작업의 경우 기본 컴퓨팅 용량을 높게 설정할수록 쿼리 성능이 향상될 수 있습니다. Amazon Redshift API를 호출하거나 Amazon Redshift 관리 콘솔에서 8의 단위(8, 16, 24, 32, 40, 48 등, 최대 512)로 8개 RPU에서 512개 RPU까지 기본 설정을 조정할 수 있습니다.
- 최대 - 이 설정에서는 사용 제한을 지정하고 이러한 제한에 도달하면 예측 가능한 예산을 유지하기 위해 Amazon Redshift에서 자동으로 수행할 작업을 정의할 수 있습니다. 최대는 RPU-시간 단위로 지정되며, 매일, 매주 또는 매월 기간에 연결됩니다. 최대 컴퓨팅 용량을 높게 설정할수록 시스템의 전반적인 처리량이 향상될 수 있습니다. 특히, 일관되게 고성능을 유지 관리하면서 높은 동시성을 처리해야 하는 워크로드에서 유리합니다. 최대는 Amazon Redshift API를 간접적으로 호출하거나 Amazon Redshift 관리 콘솔에서 조정할 수 있습니다.
- MaxRPU(최대 용량) - 이 설정은 Amazon Redshift Serverless에서 규모 조정용으로 수용할 수 있는 최대 RPU 수를 설정합니다. 자동 컴퓨팅 규모 조정이 필요한 경우 MaxRPU의 값을 높여 쿼리 처리량을 높일 수 있습니다. MaxRPU 한도에 도달하면 작업 그룹 컴퓨팅 리소스가 더 이상 스케일 업되지 않습니다.
기본적인 스토리지 용량은 Redshift 관리형 스토리지(RMS)로 청구되며, 사용자 스냅샷에 사용된 스토리지는 이 페이지에서 간략하게 설명하는 표준 백업 청구 요금으로 청구됩니다. 스토리지는 Amazon Redshift의 프로비저닝된 클러스터에서와 같은 요금으로 청구됩니다. Amazon Redshift Serverless를 사용하면 지난 24시간 이내 특정 시점으로 데이터 웨어하우스를 복원할 수 있습니다(30분의 세분화 단위 무료). 데이터 전송 비용 및 기계 학습 비용은 프로비저닝된 클러스터와 같이 별도로 적용됩니다. 여러 AWS 리전에서 스냅샷 복제 및 데이터 공유는 이 페이지에서 간략하게 설명하는 전송 요금으로 청구됩니다.
Amazon Redshift 관리형 스토리지 요금
지역별 고정 GB-월 요금에 따라 관리형 스토리지에 저장된 데이터에 대해 요금을 지불합니다. 관리형 스토리지는 RA3 노드로만 제공되며, 데이터 크기에 관계없이 Redshift 관리형 스토리지와 동일한 낮은 요금만 지불하면 됩니다. 관리형 스토리지의 사용량은 관리형 스토리지에 저장된 총 데이터에 따라 시간 단위로 계산됩니다(GB-시간을 GB-월로 변환하는 방법은 아래 예제 참조). Amazon CloudWatch 또는 AWS Management Console을 통해 RA3 클러스터의 데이터 양을 모니터링할 수 있습니다. RA3 노드와 관리형 스토리지 간 모든 데이터 전송에 대해서는 요금을 지불하지 않습니다. 관리형 스토리지 요금에는 자동 및 수동 스냅샷으로 인한 백업 스토리지 요금이 포함되어 있지 않습니다(백업 스토리지 참조). 클러스터가 종료된 후 수동 백업의 보존 데이터에 대해서는 계속해서 요금이 부과됩니다.
관리형 스토리지 요금 예제
이를 GB-월로 변환해 보겠습니다. 36,900,000GB-시간/4월 중 720시간 = 51,250GB-월
Amazon Redshift Spectrum 요금
Amazon Redshift Spectrum을 사용하면 Amazon S3에 있는 엑사바이트 규모의 데이터에 SQL 쿼리를 직접 수행할 수 있습니다. Redshift Spectrum에서 스캔한 바이트 수에 대해 비용이 부과되며, 쿼리당 최소 10MB를 기준으로 다음 메가바이트로 반올림 처리됩니다. CREATE/ALTER/DROP TABLE과 같은 Data Definition Language(DDL) 문에는 파티셔닝 관리와 실패한 쿼리에 대해서는 비용이 부과되지 않습니다.
Amazon S3에서 Amazon Redshift Serverless의 외부 데이터 쿼리는 별도로 청구되지 않으며, Amazon Redshift 서버리스에 대한 청구 금액(RPU-시간 단위)에 포함됩니다.
데이터를 압축되고 파티셔닝된 열 데이터 형식으로 저장하면 쿼리 성능을 개선하고 비용을 줄일 수 있습니다. Redshift Spectrum이 지원하는 형식 중 하나를 사용하여 데이터를 압축하면 스캔한 용량이 줄어들어 비용을 절감할 수 있습니다. 마찬가지로 Apache Parquet 또는 Optimized Row Columnar(ORC)와 같은 열 형식으로 데이터를 저장하면, Redshift Spectrum에서 쿼리에 필요한 열만 스캔하게 되므로 요금이 낮아집니다.
Redshift Spectrum을 사용하면 스캔한 데이터 1테라바이트당 요금이 부과되고 다음 메가바이트로 반올림 처리되며, 쿼리당 최소 용량은 10MB입니다. 예를 들어, 10GB의 데이터를 스캔하는 경우, 0.05 USD가 부과됩니다. 1테라바이트의 데이터를 스캔하는 경우, 5.00 USD가 부과됩니다.
추가 비용
Redshift Spectrum으로 데이터를 쿼리하는 데 사용한 Amazon Redshift 클러스터에 대해 요금이 부과됩니다. Redshift Spectrum은 Amazon S3에서 바로 데이터를 쿼리합니다. S3 버킷에서의 객체 저장 및 S3 버킷에서 수행한 요청에 대해 표준 S3 요금이 부과됩니다. 자세한 내용은 Amazon S3 요금을 참조하십시오.
Amazon Redshift Spectrum과 함께 AWS Glue 데이터 카탈로그를 사용하면, 표준 AWS Glue 데이터 카탈로그 요금이 부과됩니다. 자세한 내용은 AWS Glue 요금을 참조하세요.
AWS Key Management Service(KMS)로 암호화되어 Amazon S3에 저장된 데이터를 Amazon Redshift Spectrum을 사용하여 쿼리하는 경우, 표준 AWS KMS 요금이 부과됩니다. 자세한 내용은 AWS KMS 요금을 참조하세요.
미국 동부(버지니아 북부) 요금을 기준으로 한 Redshift Spectrum 요금 예제
크기가 같은 100개의 열이 있는 테이블이 Amazon S3에 압축이 안 된 텍스트 파일로 저장되어 있으며 전체 크기는 4 TB라고 가정해보겠습니다. 이 테이블의 한 열에서 데이터를 가져오도록 쿼리를 실행하면 Redshift Spectrum이 전체 파일을 스캔해야 합니다. 텍스트 형식은 분할될 수 없기 때문입니다. 이 쿼리는 4TB를 스캔하고 요금은 20 USD(5 USD/TB * 4TB =20 USD)입니다.
GZIP을 사용해 파일을 압축하면 4:1의 압축비를 달성할 수 있습니다. 이 경우 1TB 크기의 압축 파일이 생깁니다. Redshift Spectrum은 전체 파일을 스캔해야 하지만 크기가 1/4이므로 요금의 1/4인 5 USD만 지불하면 됩니다(5 USD/TB x 1TB = 5 USD).
파일을 압축하고 Apache Parquet와 같은 열 형식으로 변환하면 4:1 압축비를 달성할 수 있으며, 그 경우 압축 파일 크기가 1 TB가 됩니다. 위와 동일한 쿼리를 사용하여 Redshift Spectrum이 Parquet 파일에서 한 열만 스캔하면 됩니다. 이 쿼리의 비용은 0.05 USD입니다(5 USD/TB x 1TB 파일 크기 x 1/100열 또는 스캔한 총 10GB = 0.05 USD).
참고: 위 요금 예제는 설명을 위해 제공된 것입니다. 다른 파일 및 열의 압축비는 달라질 수 있습니다.
동시성 크기 조정 요금
Amazon Redshift는 임시 용량을 자동으로 추가하여 수천의 동시 사용자와 쿼리가 있더라도 빠른 성능을 일관되게 제공합니다. 관리할 리소스나 선결제 비용이 없으며, 임시 클러스터의 시작 또는 종료 시간에 대해서는 비용이 부과되지 않습니다. 기본 클러스터가 실행 중인 동안 24시간마다 동시성 크기 조정 클러스터 크레딧 1시간을 누적할 수 있습니다. 무료 크레딧을 초과하여 사용하는 동시성 크기 조정 클러스터에 대해서는 쿼리를 제공할 때만 초당 온디맨드 요금이 부과되며, 동시성 크기 조정 클러스터를 활성화할 때마다 최소 요금은 1분입니다. 초당 온디맨드 요금은 Amazon Redshift 클러스터의 노드 유형 및 수를 토대로 산정됩니다.
Amazon Redshift Serverless는 기본적으로 워크로드 요구 사항을 충족하기 위해 필요한 대로 리소스를 자동으로 확장 및 축소하며, 동시 크기 조정에 대한 별도 요금은 없습니다.
동시성 규모 조정 크레딧
Redshift 클러스터는 하루에 최대 1시간 분량의 동시성 확장 크레딧을 무료로 획득합니다. 크레딧은 AWS 계정의 각 활성 클러스터에 대해 시간 단위로 적립되며 크레딧을 획득한 후에만 동일한 클러스터에서 사용할 수 있습니다. 각각의 활성 클러스터에 대해 최대 30시간 분량의 무료 동시성 확장 크레딧을 적립할 수 있습니다. 크레딧은 클러스터가 종료되지 않는 한 만료되지 않습니다.
동시성 확장 요금 예
미국 동부에 있는 10 DC2.8XL 노드 Redshift 클러스터는 시간당 비용이 48 USD입니다. 무료 동시성 크기 조정 크레딧을 초과하여 5분 동안 임시 클러스터 2개를 사용하는 상황을 가정해 보겠습니다. 동시성 크기 조정에 대한 초당 온디맨드 요금은 48 USD x 1/3600 = 초당 0.013 USD입니다. 이 경우 동시성 크기 조정에 대한 추가 비용은 초당 0.013 USD x 300초 x 임시 클러스터 2개 = 8 USD입니다. 따라서 이 경우 Amazon Redshift 클러스터와 두 임시 클러스터의 총 비용은 56 USD입니다.
Redshift 기계 학습 요금
Redshift 기계 학습을 시작할 때 이전에 Amazon SageMaker를 사용하지 않았다면 Amazon SageMaker 프리 티어 자격이 주어집니다. 여기에는 2개월 동안 매월 2개의 무료 CREATE MODEL 요청과 요청당 최대 100,000개 셀이 포함됩니다. 프리 티어는 Redshift ML에서 첫 번째 모형을 생성하는 첫 달부터 시작됩니다.
Amazon S3 요금
CREATE MODEL 요청에도 약간의 Amazon S3 요금이 발생합니다. CREATE MODEL에서 생성된 S3 데이터 양이 몇 GB 수준이므로 S3 비용은 월별 1 USD 미만입니다. 가비지 수집이 설정된 경우 빠르게 제거됩니다. Amazon S3는 CREATE MODEL의 SELECT 쿼리에서 생성된 훈련 데이터를 저장하는 데 먼저 사용됩니다. 그런 다음, 예측에 필요한 다양한 모델 관련 아티팩트를 저장하는 데 사용됩니다. 기본 가비지 수집 모드는 CREATE MODEL 끝에서 훈련 데이터와 모델 관련 아티팩트를 모두 제거합니다.
비용 제어 옵션
MAX_CELLS를 설정하여 훈련 비용을 제어할 수 있습니다. 그렇지 않으면 MAX_CELLS의 기본값은 1백만이며, 대부분의 경우 20 USD 아래로 훈련 비용을 유지할 수 있습니다. 훈련 데이터 집합이 1백만을 초과하면 요금은 다음과 같이 늘어납니다.
셀 수 | 요금 |
처음 1천만 개의 셀 |
1백만 개 셀당 20 USD |
다음 9천만 개의 셀 |
1백만 개 셀당 15 USD |
1억 개를 초과하는 셀 |
1백만 개 셀당 7 USD |
참고: 실제 요금은 종종 위에서 공유되는 상한 미만입니다.
CREATE MODEL 비용 예제:
- 1십만 개 셀의 경우: 20 USD (= 1 x 20)
- 2백만 개 셀의 경우: 40 USD (= 2 x 20)
- 2천 3백만 개 셀의 경우: 395 USD (= 10 x 20 + 13 x 15)
- 9천 9백만 개 셀의 경우: 1,535 USD(= 10 x 20 + 89 x 15)
- 2억 1천 1백만 개 셀의 경우: 2,327 USD (= 10 x 20 + 90 x 15 + 111 x 7)
CREATE MODEL 요청의 SELECT 쿼리에서 생성된 훈련 데이터가 제공된 MAX_CELLS 제한(또는 제공되지 않은 경우 기본값, 1백만 개)을 초과하는 경우 CREATE MODEL은 훈련 데이터 집합에서 임의로 대략 MAX_CELLS/"열 수" 레코드를 선택하며, 임의로 선택된 이 튜플을 사용하여 훈련합니다. 줄어든 훈련 데이터 집합에 바이어스가 없도록 임의 선택이 설계되었습니다. 따라서 MAX_CELLS를 설정하면 경계 내에서 비용을 유지할 수 있습니다.
예약 인스턴스 요금
예약 인스턴스는 프로덕션 워크로드가 안정적인 경우에 적합하며 Amazon Redshift 노드 유형의 온디맨드 요금 대비 상당한 비용을 절감할 수 있습니다. 일반적으로 고객은 실험 및 개념 증명을 진행하여 프로덕션 구성을 검증한 후 예약 인스턴스를 구매합니다.
1년 또는 3년 동안 Amazon Redshift를 사용하기로 약정하면 온디맨드 요금과 비교하여 상당한 비용을 절감할 수 있습니다. 예약 인스턴스 요금은 구매한 노드 유형별로 다르며 예약 기간이 종료될 때까지 유효합니다. 요금에는 클러스터 노드와 Amazon S3에 각각 하나씩, 두 가지 추가 데이터 사본이 포함됩니다. AWS에서 백업, 내구성, 가용성, 보안, 모니터링 및 유지 관리를 대신합니다.
예약 인스턴스 요금에는 다음과 같이 세 가지 옵션이 있습니다.
선결제 없음 – 선결제는 없으며 1년 동안 월별 요금을 지불하도록 약정합니다.
부분 선결제 - 예약 인스턴스 선결제 비용의 일부를 지불하고 나머지는 1년 또는 3년 동안 나누어 지불합니다.
전체 선결제 – 전체 예약 인스턴스 기간(1년 또는 3년)에 대한 요금을 한 번에 선결제합니다.
예약 인스턴스는 결제 개념이며, 데이터 웨어하우스 클러스터를 생성하는 데 사용되지 않습니다. 예약 인스턴스를 구매하면, 현재 실행 중인 클러스터가 없거나 기존 클러스터가 일시 중지되었더라도 관련된 선결제 및 월별 비용이 청구됩니다. 예약 인스턴스를 구매하려면 Redshift 콘솔에서 예약 노드 탭으로 이동합니다.
AWS는 언제라도 예약 인스턴스 요금제 프로그램을 종료할 수 있다. 예약 인스턴스에는 예약 인스턴스 요금이 적용되는 것 외에도 AWS 고객 계약 또는 서비스 사용에 관한 당사와의 기타 계약에 따라 적용되는 모든 데이터 전송 요금 및 기타 요금이 적용됩니다.
*예약 인스턴스 계약 기간 동안의 월 평균 금액입니다. 각 달의 실제 월 결제액은 실행하는 Redshift 인스턴스 유형에 따라, 해당 월의 실제 시간 수에 시간당 사용 요금을 곱하거나 해당 월의 초 수에 시간당 사용 요금을 3,600으로 나눈 값을 곱한 것과 같습니다. 시간당 요금은 예약 인스턴스 계약 기간의 월 평균 요금 총액을 예약 인스턴스 계약 기간의 총 시간 수(1년을 365일로 계산)로 나눈 값과 동일합니다.
** 실질적인 시간당 요금은 예약 인스턴스 사용을 통해 절감되는 금액을 온디맨드 요금과 대비해서 계산할 수 있도록 도와줍니다. 예약 인스턴스를 구매하면 인스턴스의 실행 여부에 상관없이 선택한 예약 인스턴스의 전체 계약 기간에 시간당으로 요금이 부과됩니다. 실질적인 시간당 요금은 인스턴스의 시간당 요금을 나타냅니다. 이는 모든 선불 지급을 포함한 전체 약정 기간의 예약 인스턴스 총액을 예약 인스턴스 계약 기간의 각 시간으로 분배한 값입니다.
*** 예약 인스턴스의 경우, 연간 TB당 실질 요금은 시간당 요금에 계약 기간의 시간 수를 곱한 후 선불 지급액을 더한 금액을 계약 년 수와 노드당 TB 수로 나눈 값입니다. RA3의 경우 관리형 스토리지에 저장된 데이터는 RA3 유형에 저장된 실제 데이터에 따라 개별적으로 청구됩니다. 컴퓨팅 노드 비용에 대해서만 연간 TB당 실질 요금이 계산됩니다.
제로 ETL 통합 비용 신규
Amazon Redshift에는 OLTP 데이터베이스와의 제로 ETL 통합이 있으므로 ETL 파이프라인을 구축하고 관리할 필요가 없습니다. 지원되는 데이터베이스에는 Amazon Aurora, Amazon DynamoDB, Amazon Relational Database Service (Amazon RDS) for MySQL이 포함됩니다. 이러한 통합은 유연성을 제공하므로 데이터베이스의 특정 데이터 테이블을 선택하여 Amazon Redshift에 자동으로 복제할 수 있습니다. 이 유연성 덕분에 여러 애플리케이션과 데이터 소스에서 통합 분석을 실행할 수 있습니다. 제로 ETL 통합에 대한 추가 요금은 부과되지 않습니다. 제로 ETL 통합을 생성하고 제로 ETL 통합의 일부로 생성되는 변경 데이터를 처리하는 데 사용한 기존 리소스에 대한 요금이 부과됩니다. 여기에는 복제된 데이터를 저장하기 위한 추가 Amazon Redshift 스토리지, 데이터 복제 처리를 위한 컴퓨팅(또는 Amazon Redshift Serverless의 RPU), 소스에서 대상으로 데이터를 이동하는 데 드는 AZ 간 데이터 전송 비용이 포함됩니다. 제로 ETL 통합을 통한 지속적인 데이터 변경 처리는 추가 비용 없이 제공됩니다. 자세한 내용은 Aurora, RDS for MySQL, DynamoDB 요금 페이지를 참조하t세요.
백업 스토리지
백업 스토리지는 데이터 웨어하우스를 위해 생성된 스냅샷과 연결된 스토리지입니다. 백업 보존 기간을 연장하거나 추가 스냅샷을 생성하면 데이터 웨어하우스가 사용하는 백업 스토리지가 증가합니다. Amazon Redshift는 콘솔, 애플리케이션 프로그래밍 인터페이스(API) 또는 명령줄 인터페이스(CLI)를 사용하는 수행한 수동 스냅샷에 대한 비용을 청구합니다. Amazon Redshift의 스냅샷 일정 예약 기능을 사용하여 기본적으로 생성된 Redshift 자동 스냅샷에 대해서는 요금이 부과되지 않으며, 이 스냅샷은 최대 35일 동안 유지될 수 있습니다. 24시간이 지나지 않은 Amazon Redshift Serverless 복구 시점에 대해서는 요금이 청구되지 않습니다. 복구 시점을 24시간 넘게 유지하려는 경우 RMS의 일부로 요금이 발생합니다. RA3 클러스터에 저장된 데이터는 RMS의 일부이며, RMS 요금으로 비용이 청구되지만, RA3 클러스터에 대해 생성된 수동 스냅샷은 이 페이지에 나와 있는 표준 Amazon S3 요금에 따라 백업 스토리지로서 비용이 청구됩니다.
예를 들어, RA3 클러스터에 10TB의 데이터와 30TB의 수동 스냅샷이 있으면 10TB의 RMS와 30TB의 백업 스토리지에 대한 비용이 청구됩니다. 고밀도 컴퓨팅(DC) 및 고밀도 스토리지(DS) 클러스터에서는 스토리지가 클러스터에 포함되며 개별적으로 비용이 청구되지 않지만, 백업은 Amazon S3(외부 위치)에 저장됩니다. DC 및 DS 클러스터에서 프로비저닝된 스토리지 크기를 초과하는 백업 스토리지는 표준 S3 요금에 따라 백업 스토리지로서 비용이 청구됩니다. 스냅샷에 대해서는 클러스터가 일시 정지되거나 삭제되는 경우를 포함하여 스냅샷이 만료되거나 삭제되기 전까지 비용이 청구됩니다.
데이터 전송
작업의 백업, 복원, 로드 및 언로드를 위해 동일한 AWS 리전 내에서 Amazon Redshift와 Amazon S3 간에 전송되는 데이터에는 비용이 부과되지 않습니다. Amazon Redshift에서 송수신되는 다른 모든 데이터에 대해서는 표준 AWS 데이터 전송 요금이 청구됩니다. 특히 Amazon Virtual Private Cloud(VPC)에서 Amazon Redshift 클러스터를 실행하는 경우 JDBC/ODBC를 통해 Amazon Redshift 클러스터 엔드포인트로 전송되는 데이터에 대해 표준 AWS 데이터 전송 요금이 부과됩니다. 또한, 향상된 VPC 라우팅을 사용하여 다른 리전에 있는 Amazon S3에 데이터를 언로드하면 표준 AWS 데이터 전송 요금이 발생합니다. AWS 데이터 전송 요금에 대한 자세한 내용은 Amazon Elastic Cloud Compute(Amazon EC2) 요금 페이지를 참조하세요.
Amazon Redshift는 여러 리전 간 스냅샷 복사와 여러 리전 간 데이터 공유에 대한 요금을 청구합니다. 데이터 공유 요금은 데이터에 액세스하는 소비자 리전에서 청구됩니다. 여러 리전 간 스냅샷 복사는 스냅샷을 생성한 클러스터가 있는 소스 리전에서 비용이 청구됩니다. 데이터 전송 요금은 모든 스냅샷(자동 및 수동) 및 복구 시점에 적용됩니다. 스냅샷 복사에 대한 모든 데이터 전송 요금은 증분 데이터에 대해서만 청구됩니다.
데이터 공유 데이터 수신 소스 또는 스냅샷 복사 데이터 송신 소스
요금 예시
1개월 동안 4개의 ra3.xlarge 노드와 40TB의 RMS를 사용합니다. 또한, 1개월 동안 Redshift Spectrum를 사용하여 20 TB의 데이터를 스캔하고 20 TB의 데이터를 스캔할 수 있습니다. 온디맨드 요금을 사용합니다.
요금은 다음과 같이 계산됩니다.
- Redshift RA3 인스턴스 비용 = 인스턴스 4개 x 시간 당 3.26 USD x 월 기준 730시간 = 9,519.20 USD
- RMS 비용 = 40TB x TB당 1,024GB x 0.024 USD = 983.04 USD
- Redshift Spectrum 비용 = 20TB x 5.00 USD = 100.00 USD
총 월간 비용 = 10,602.24 USD
두 AZ에 동시에 배포되는 다중 AZ 클러스터를 사용합니다. 클러스터에는 AZ당 4개의 ra3.4xlarge 노드가 있고 한 달 동안 40TB의 RMS를 사용합니다. 온디맨드 요금을 사용합니다.
요금은 다음과 같이 계산됩니다.
- AZ1에 대한 Redshift RA3 인스턴스 비용 = 인스턴스 4개 x 시간 당 3.26 USD x 월 기준 730시간 = 9,519.20 USD
- AZ2에 대한 Redshift RA3 인스턴스 비용 = 인스턴스 4개 x 시간 당 3.26 USD x 월 기준 730시간 = 9,519.20 USD
- RMS 비용 = 40TB x TB당 1,024GB x 0.024 USD = 983.04 USD
총 월간 비용 = 20,021.44 USD
미국 동부(버지니아 북부) 리전의 Amazon Redshift 데이터 웨어하우스에서 오전 7시부터 오후 7시까지 매시간 실행해야 하는 데이터 처리 작업이 있다고 가정합니다. 단순하게 설명하기 위해 작업을 실행할 때마다 걸리는 시간은 10분 30초로 같다고 가정합니다. 이때 Amazon Redshift는 작업을 실행하는 데 128개의 RPU 용량을 사용합니다.
다음 표는 하루의 총 사용량을 요약합니다.
쿼리 기간 |
작업은 오전 7시부터 오후 7시까지 13회 실행되었으며, 실행될 때마다 10분 30초가 걸렸습니다(136분 30초 = 8,190초). |
사용한 용량 |
128개 RPU |
일일 요금 |
109.20 USD((8,190 x 128개 RPU x RPU-시간당 0.375 USD)/3,600) |
미국 동부(버지니아 북부) 리전의 Amazon Redshift 데이터 웨어하우스에 대시보드 애플리케이션이 있다고 가정합니다. 애플리케이션은 조직에서 다양한 사용자(예: 데이터 분석가, 개발자, 데이터 사이언티스트)가 사용하며, 하루에 최고 사용 시간과 최저 사용 시간이 있습니다. 특히, 애플리케이션은 대부분의 사용자가 데이터 웨어하우스에서 데이터에 액세스하고 분석을 수행하는 오전 9시부터 오전 11시와 오후 2시부터 오후 4시에 사용자 활동이 가장 높습니다. 애플리케이션은 사용자 활동이 없는 오전 11시부터 오후 2시 사이에 15분 간격으로 4회 사용됩니다. 오후 10시와 오전 5시 사이에는 사용자 활동이 없습니다.
이제 Amazon Redshift 데이터 웨어하우스에서 리소스 사용량을 살펴보겠습니다. 가격 대비 성능을 보다 효율적으로 제어하기 위해 Amazon Redshift 서버리스의 기본 구성을 64개 RPU로 명시적으로 설정한다고 가정합니다. 그리고 오전과 오후의 최고 사용 기간에 Amazon Redshift는 각각 총 192개의 RPU와 128개의 RPU 용량을 사용하며 자동으로 크기를 조정한다고 가정합니다.
다음 표는 하루의 총 사용량을 요약합니다.
기간 |
총 쿼리 실행 기간 |
오전 5시부터 오전 9시 |
4시간 동안 64개의 RPU = 64 x 4= 256개의 RPU-시간 |
오전 9시부터 오전 11시 |
2시간 동안 192개의 RPU = 384개의 RPU-시간 |
오전 11시부터 오후 2시 |
유휴 상태인 4회의 15분 간격을 제외하고 활동 시간은 2시간입니다. 2시간 동안 64개의 RPU = 64 x 2= 128개의 RPU-시간 |
오후 2시부터 오후 3시 |
1시간 동안 128개의 RPU = 128개의 RPU-시간 |
오후 3시부터 오후 10시 |
7시간 동안 64개의 RPU = 64 x 7= 448개의 RPU-시간 |
오후 10시부터 오전 5시 |
활동 없음 |
일일 요금 |
504 USD((256+384+128+128+448) x RPU-시간당 0.375 USD) |
미국 동부에 있는 10 DC2.8XL 노드 Redshift 클러스터는 시간당 비용이 48 USD입니다. 무료 동시성 크기 조정 크레딧을 초과하여 5분 동안 임시 클러스터 2개를 사용하는 상황을 가정해 보겠습니다. 동시성 크기 조정에 대한 초당 온디맨드 요금은 48 USD x 1/3,600 = 초당 0.013 USD입니다. 이 경우 동시성 크기 조정에 대한 추가 비용은 초당 0.013 USD x 300초 x 임시 클러스터 2개 = 8 USD입니다. 따라서 Redshift 클러스터와 두 임시 클러스터의 총 비용은 56 USD입니다.
크기가 같은 100개의 열이 있는 테이블이 Amazon S3에 압축이 안 된 텍스트 파일로 저장되어 있으며 전체 크기는 4 TB라고 가정해보겠습니다. 이 테이블의 한 열에서 데이터를 가져오도록 쿼리를 실행하면 Redshift Spectrum이 전체 파일을 스캔해야 합니다. 텍스트 형식은 분할될 수 없기 때문입니다. 미국 동부(버지니아 북부)에 대한 Redshift Spectrum 요금에 따라 이 쿼리는 4 TB를 스캔할 수 있으며 20 USD의 비용이 청구됩니다(5.00 USD/ TB x 4 TB = 20 USD).
GZIP을 사용해 파일을 압축하면 4:1의 압축비를 달성할 수 있습니다. 이 경우 1TB 크기의 압축 파일이 생깁니다. Redshift Spectrum은 전체 파일을 스캔해야 하지만 크기가 1/4이므로 요금의 1/4인 5 USD만 지불하면 됩니다(5 USD/TB x 1TB = 5 USD).
파일을 압축하고 Apache Parquet와 같은 열 형식으로 변환하면 4:1 압축비를 달성할 수 있으며, 그 경우 압축 파일 크기가 1TB가 됩니다. 위와 동일한 쿼리를 사용하여 Redshift Spectrum이 Parquet 파일에서 한 열만 스캔하면 됩니다. 이 쿼리의 비용은 0.05 USD입니다(5 USD/TB x 1TB 파일 크기 x 1/100열 또는 스캔한 총 10GB = 0.05 USD).
참고: 위 요금 예제는 설명을 위해 제공된 것입니다. 다른 파일 및 열의 압축비는 달라질 수 있습니다.
추가 요금 리소스
AWS에서 월별 비용을 손쉽게 계산
AWS 전문가에게 맞춤 견적 받기