Amazon FSx for OpenZFS 常见问题

一般性问题

适用于 OpenZFS 的 Amazon FSx 是一项完全托管式文件存储服务,使您能够启动、运行和扩展基于开源 OpenZFS 文件系统构建的完全托管式文件系统。FSx for OpenZFS 使您能够轻松迁移本地文件服务器,而无需更改应用程序或管理数据的方式,并使您能够在云中构建新的高性能数据密集型应用程序。

适用于 OpenZFS 的 Amazon FSx 提供高度可靠且易于使用的完全托管式文件存储,您可以通过行业标准的网络文件系统(NFS)协议从 AWS 或本地运行的几乎所有客户端或工作站访问这些文件存储。它为管理和处理数据提供了一组丰富的功能,例如快照、数据克隆和压缩。适用于 OpenZFS 的 FSx 由 AWS Graviton 处理器和最新的 AWS 磁盘和网络技术提供支持,可为您的高性能工作负载实现 1 百万 IOPS 和低至数百微秒的延迟。

使用适用于 OpenZFS 的 FSx 将存储在 ZFS 或其他基于 Linux 的文件服务器中的本地数据迁移到 AWS。通过提供与本地 NFS 或其他基于 Linux 的文件服务器相同的数据管理功能和性能,FSx for OpenZFS 允许您在不修改现有代码或您的数据管理方式的情况下移动数据。

如果您在 AWS 上构建一个新应用程序,FSx for OpenZFS 将提供丰富的功能,以便更轻松地开发、测试和运行云原生应用程序。利用对吞吐量扩展的支持,FSx for OpenZFS 可以随着应用程序需求和数据集的增长,轻松扩展您的文件系统。

适用于 OpenZFS 的 Amazon FSx 旨在支持广泛的 Linux、Windows 和 macOS 工作负载,包括大数据和分析、代码和构件存储库、DevOps 解决方案、Web 内容管理、前端电子设计自动化(EDA)、基因组学研究和媒体处理。使用 FSx for OpenZFS,您可以为最苛刻的应用程序和工作负载提供所需的低延迟和性能。

可以通过 Amazon Elastic Compute Cloud(EC2)、Amazon Elastic Container Service(ECS)、Amazon Elastic Kubernetes Service(EKS)、Amazon WorkSpaces、Amazon AppStream 2.0 和 VMware Cloud on AWS 访问适用于 OpenZFS 的 Amazon FSx。您可以使用 Amazon 虚拟私有云(VPC)和 AWS Key Management Service(AWS KMS)保护数据的安全。您可以使用 Amazon CloudWatch 监控存储和性能指标,使用 AWS CloudTrail 和 AWS Identity and Access Management(IAM)监控和保护 API 调用,以及使用 AWS CloudFormation 管理文件系统。

要开始使用,请使用 AWS 管理控制台、AWS 命令行界面(AWS CLI)或 Amazon FSx API 创建适用于 OpenZFS 的 Amazon FSx 文件系统。创建文件系统时,您可以指定部署类型(单可用区或多可用区)、存储容量、吞吐能力,并可以选择性地指定磁盘 IOPS 的水平。几分钟后,您的文件系统便可以使用,您可以通过 Linux、Windows 或 macOS 客户端使用 NFS 协议(v3、v4、v4.1、v4.2)访问它。FSx for OpenZFS 将数据作为本地目录或驱动器呈现给用户和应用程序,并且最多为数千个客户端提供并发访问。

文件系统是 Amazon FSx 中的主要资源。您可以为您的文件系统指定 SSD 存储容量、吞吐能力和 IOPS 容量,并选择在其中创建文件系统的 AWS VPC。

您可以从运行在 Amazon EC2、Amazon ECS、Amazon EKS、VMware Cloud on AWS、Amazon WorkSpaces 和 Amazon AppStream 2.0 上的 Linux、Windows 或 macOS 客户端中访问您的数据。

在 Linux 实例中,您可以使用标准的 Linux 挂载命令以及与卷关联的域名系统(DNS)名称访问文件数据。在 Windows 实例中,通过 NFS 客户端使用 Windows Powershell 将驱动器盘符(例如 Z:)映射到您的文件系统中的文件共享。在 macOS 实例中,使用“连接到服务器”功能连接到与您的文件系统关联的 DNS 名称。有关示例挂载命令,请参阅 Amazon FSx 文档。从任何客户端挂载您的文件共享后,您就可以像使用本地文件系统一样,使用您的文件系统中的文件和目录。

适用于 OpenZFS 的 Amazon FSx 通过最新版本的 NFS 协议(v3、v4、v4.1、v4.2)提供对共享文件存储的访问。

您可以通过 AWS Direct Connect 或 VPN 从本地环境中访问适用于 OpenZFS 的 Amazon FSx 文件系统,或使用 rsync 或 Robocopy 之类的标准复制工具将数据从本地复制到适用于 OpenZFS 的 FSx。您还可以使用 AWS Snowball 将您的数据迁移到 AWS,而无需使用 Direct Connect 或 VPN。

请参阅选择 Amazon FSx 文件系统页面了解有关不同 Amazon FSx 文件存储产品的更多详细信息。

请参阅区域性产品和服务页面,了解适用于 OpenZFS 的 Amazon FSx 服务在不同区域的具体提供情况。

我们建议大多数生产工作负载使用 Multi-AZ 高可用性(HA)文件系统,因为它能提供高可用性和耐用性模式。您应使用 Multi-AZ HA 文件系统,以确保在发生硬件故障、文件系统维护和 AZ 中断等事件时,文件系统仍能保持可用性和耐用性。

对于需要持续的单可用区延迟的工作负载(例如某些 EDA 和 HPC 工作负载),使用单可用区 (HA) 作为经济实惠的解决方案,适用于不需要多可用区 (HA) 提供的高耐久性的工作负载(例如,在应用层内置复制和失效转移的工作负载以及可以对数据进行再融合或再生的分析工作负载)。

使用单可用区(非 HA)文件系统进行测试和开发,即不需要高可用性或耐久性并且可以承受由可恢复的硬件故障和计划内维护事件导致的停机时间(通常长达 30 分钟)的非生产工作负载。

规模与性能

答:适用于 OpenZFS 的 FSx 以低至数百微秒的稳定延迟提供完全托管式 SSD 存储。利用 OpenZFS 中嵌入的缓存功能,适用于 OpenZFS 的 FSx 文件系统为频繁访问的数据提供了更高的性能和更低的延迟。

FSx for OpenZFS 文件系统在访问缓存在文件服务器上的数据时,可以提供超过 100 万 IOPS 和 21 GB/s 的吞吐量,在访问 SSD 存储中的数据时,可以提供数十万 IOPS 和10 GB/s 的吞吐量。通过每个客户端的多个并行连接(通过 NFS n-connect),您可以从单个客户端驱动文件系统的最大吞吐量和 IOPS 级别。

您可以在创建文件系统时指定其吞吐能力。每 GB 的存储包括 3 个磁盘 IOPS,您可以根据需要预调配额外的磁盘 IOPS。您可以使用 AWS 管理控制台、AWS CLI 或 Amazon FSx API 随时纵向扩展或缩减吞吐能力,以满足您不断变化的应用程序需求。访问文件系统性能页面了解更多信息

您最多可以在单个文件系统上预调配 512TiB 数据。您可以同时轻松挂载多个文件系统,从而为您的应用程序提供 PB 级存储。

默认情况下,卷最多可以增长到文件系统上的可用容量。您可以选择为卷设置配额,以限制卷的增长大小。您还可以选择为卷设置预留,以便为该卷预留最小存储容量。如果没有预留,卷将被精简预调配,这意味着它们仅为存储在其中的数据消耗存储容量。您可以随时更改这些设置。

Intelligent-Tiering

适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类将大家熟悉的网络附加存储(NAS)与具有完全弹性且可通过自动分层数据来优化成本的存储结合了起来。

您应该使用 Intelligent-Tiering 来简化存储管理和降低成本。它的弹性意味着您不再需要管理存储容量,也不再需要担心如何适应不可预测的数据集或空间不足。它可以通过在不同的存储层之间移动数据来自动优化成本,与 Amazon FSx 固态硬盘(SSD)存储类相比,它可节省高达 85% 成本,而与传统本地硬盘(HDD)部署相比,它可以节省高达 20% 的成本。

在使用 Amazon FSx 控制台、API 或命令行界面(CLI)创建文件系统时,请指定 Intelligent-Tiering 类。在创建文件系统时或在那之后的任何时候,您还可以创建基于 SSD 的可选读取缓存,优化对频繁访问的数据的读取。

大多数 NAS 数据集都适合使用适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类。仅为所有数据都需要全闪存存储性能的数据集(例如芯片设计工作负载、数据库以及供数据科学家使用的用户共享数据)使用 SSD 存储类。

适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类旨在满足各种文件工作负载的性能需求。它在 Lustre 上提供高达每秒数十 TB 的吞吐量和数千万次输入/输出操作(IOPS),在 OpenZFS 上提供高达每秒 20 GB 的吞吐量和 40 万次 IOPS。SSD 读取缓存中的数据具有亚毫秒级的首字节时间延迟,而所有其他数据的首字节时间延迟均在几十毫秒范围内。典型的文件工作负载往往是读取密集型的,并且在任何给定时间都只主动处理整个数据集的一小部分,这意味着适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类的混合 SSD 模式为大多数工作负载提供了 SSD 级别的存储,同时相对于全 SSD 部署,它可以节省高达 85% 的成本。

默认情况下,Amazon FSx 会根据您为文件系统选择的吞吐量水平自动选择 SSD 读取缓存大小,或者您可以选择更小或更大的缓存,然后根据您的工作负载需求随时向上或向下扩展。您可以通过 AWS CLI、AWS SDK 或 Amazon FSx 控制台更改文件系统的 SSD 读取缓存大小。Amazon FSx 会发布缓存命中率指标(缓存读取的百分比)来帮助您确定缓存大小是否合适,您可以在 Amazon FSx 控制台的文件系统“监控”选项卡中查看该指标,也可以使用 Amazon CloudWatch 查看该指标。对于大多数工作负载,80% 的缓存命中率就说明性能与成本优化达到了适当平衡。

符合。适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类提供 99.99% 的 SLA。

对于使用适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类的文件系统,Amazon FSx 会将您的所有数据以冗余方式存储在多个可用区(AZ)中,从而提供抵御大规模灾难的内置弹性。

能。您可以通过 Amazon FSx 控制台、API 或 CLI,对使用 Intelligent-Tiering 存储的文件系统进行备份。备份 Amazon FSx 文件系统会创建文件数据的单独副本,稍后您可以使用该副本恢复一个或多个新的文件系统。Amazon FSx 备份具有崩溃一致性(允许您恢复到文件系统的某个时间点视图)、高持久性 [存储在 Amazon Simple Storage Service(Amazon S3)中,专为达到 11 个 9 的持久性而设计] 和增量性(意味着每次备份仅添加自上次备份以来的更改,从而通过避免复制数据来节省备份存储成本)。默认情况下,Amazon FSx 每天会在您指定的备份时段启动文件系统自动备份。您可以随时使用 Amazon FSx 控制台、CLI 或 API 创建额外备份,也可以使用 AWS Backup 创建您自己的自动备份计划。

您可以通过使用“从备份中恢复”选项创建新的文件系统来从备份中恢复。在这一过程中,您可以在几分钟内访问所有数据,同时恢复任务会在后台完成。文件系统会在您访问备份时以透明方式从备份中检索数据,因此您无需等待恢复完成就可以使用文件系统。

您需要按每月存储在适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类中的每 GB 数据付费,具体价格取决于数据存储的层,另外您还需按每月预置的每 GB SSD 读取缓存付费。当您写入数据时,按写入操作次数付费;当您读取不在 SSD 读取缓存中的数据时,按读取操作次数付费。与其他 Amazon FSx 文件系统一样,您需要按每月为文件服务器预置的每 MB 吞吐能力付费。

与 Amazon S3 Intelligent-Tiering 一样,适用于 OpenZFS 的 Amazon FSx Intelligent-Tiering 存储类会根据上次访问时间自动对数据进行分层,从而自动优化不太活跃的数据的成本。最近 30 天内访问过的数据存储在频繁访问层。30 天内未被访问的数据将自动移至不频繁访问层,其成本较频繁访问层中的数据更低。90 天内未被访问的数据将自动移至归档层,其成本较不频繁访问层中的数据更低。如果您访问不频繁访问层或归档层中的数据,这些数据会自动移回频繁访问层。所有对非缓存数据的访问都具有相同的性能特征,它们与数据层无关,且除了常规的读/写操作成本外,没有额外的 IOPS、检索或转换成本。

存储管理

除了以传统的文件-目录结构表示数据外,适用于 OpenZFS 的 FSx 还支持在文件系统中使用卷来进一步组织数据。每个文件系统均包含一个或多个卷,它们是目录和文件的隔离数据容器。您可以使用 AWS 管理控制台、AWS CLI 或 Amazon FSx API 创建和管理单个卷,客户端可以通过从 Linux、macOS 或 Windows 中将卷作为网络位置挂载来访问卷。单个卷可以独立配置,这意味着您可以在卷级别设置精简预调配或压缩等特性。

默认情况下,卷最多可以增长到文件系统上的可用容量。您可以选择为卷设置配额,以限制卷的增长大小。您可以选择为卷设置预留,以便为该卷预留最小存储容量。如果没有预留,卷将被精简预调配,这意味着它们仅为存储在其中的数据消耗存储容量。您可以随时更改这些设置。

适用于 OpenZFS 的 FSx 提供一组由 ZFS 提供支持的丰富数据处理功能,包括时间点快照、就地数据克隆以及跨文件系统的按需数据复制。使用适用于 OpenZFS 的 FSx,您可以随时创建卷快照,从而轻松保留、管理和恢复数据库或应用程序的历史版本。数据克隆使您可以轻松地并行测试多个功能和更改,而不会中断现有用户或应用程序,也不需要复制数据。跨文件系统的按需数据复制提供了一种简单灵活的方法,可为灾难恢复、只读副本以及测试和开发工作流程同步数据,而无需执行在文件系统之间建立连接或检测和处理网络中断的额外工作。

例如,如果您正在运行一个数据库工作负载,并且希望在将数据库操作应用到生产环境之前对其进行测试,则您可以通过创建数据库的克隆来测试该操作,并对克隆卷运行该操作以验证其是否按预期工作。完成测试后,您可以将克隆卷复制到完整复制卷,以保留结果以供长期或生产使用。

适用于 OpenZFS 的 FSx 支持一组丰富的存储效率功能,包括 Z-Standard 和 LZ4 压缩,用于减少数据消耗的存储容量、卷预留和卷配额,以控制单个卷使用的空间量,并减少用户配额以控制单个最终用户的使用情况。这些功能可以帮助您减少或管理文件系统和备份存储中的存储占用。

启用压缩可能会降低文件系统在写入工作量重的工作负载下的性能,因为数据在写入磁盘时被压缩。但是,对于读取工作量重的工作负载,压缩可以显著提高文件系统的整体吞吐量性能,因为它减少了在这些磁盘和存储服务器之间发送的数据量。 请参阅适用于 OpenZFS 的 Amazon FSx 性能文档了解更多详细信息。 

Amazon FSx 是一项完全托管式服务,因此所有文件存储基础设施均由我们为您管理。使用 Amazon FSx,您不需要部署和维护复杂的文件系统基础设施。FSx for OpenZFS 提供 ZFS 的所有功能,而没有管理 ZFS 文件系统时常见的复杂性

您可以通过 AWS 管理控制台、AWS CLI 和 Amazon FSx API 创建、查看和删除文件系统、卷和备份。我们还在 FSx 控制台和 API 中提供对高级 ZFS 功能的本地支持,这意味着您不需要成为 ZFS 专家就可以利用 ZFS 快照和克隆等功能。

可用性与持久性

借助多可用区 (HA) 和单可用区 (HA) 文件系统,Amazon FSx 部署了一对具有自动失效转移和失效自动恢复功能的高可用性 (HA) 文件服务器,以确保高可用性。借助多可用区(AZ)文件系统,Amazon FSx 在两个 AWS 可用区 (AZ) 上部署这对文件服务器,并自动在这两个可用区之间复制您的数据以确保高耐久性,并通过自动失效转移和失效自动恢复功能在两个可用区部署一对高可用性 (HA) 文件服务器,即使在整个可用区中断的情况下也能确保高可用性和耐久性。此外,Amazon FSx 会持续监控硬件故障,并在出现故障时自动更换基础设施组件。文件系统会根据需要自动进行失效转移和恢复(通常在 60 秒内),而客户端则会自动在文件系统中进行失效转移和恢复。

借助单可用区(非 HA)文件系统,Amazon FSx 通过持续监控硬件故障并在出现故障时自动更换基础设施组件(通常在 30 分钟内),从而恢复故障事件的可用性。

Amazon FSx 还会每天对您的文件系统进行高度持久的备份(存储在 S3 中),并允许您随时进行其他备份。

答:是。如果客户的月度正常运行时间百分比在任何账单周期内低于我们的服务承诺,Amazon FSx SLA 将提供服务抵扣金。

为了防止最终用户或应用程序意外删除或无意中修改卷中的文件,您可以拍摄快照(存储在文件系统中的卷的时间点映像),以允许最终用户或应用程序管理员轻松撤消文件更改并比较文件版本。最终用户和应用程序管理员可以在卷的根目录下的“.zfs/snapshot”目录中查看快照,并且可以访问这些快照中的各个文件和文件夹。您可以使用 AWS 管理控制台、AWS CLI 或 Amazon FSx API 管理您的 FSx for OpenZFS 快照。

FSx for OpenZFS 还提供文件系统备份,旨在支持存档、数据留存和合规性需求。备份是存储在 Amazon S3 中的文件系统的二级、脱机、高持久性副本。备份具有时间点一致性(代表整个文件数据集在给定时间内的一致视图),是增量式的(您只需为给定备份的自上一次备份以来所做的更改付费),易于管理(通过 AWS 管理控制台、AWS CLI 或 Amazon FSx API),且可以快速创建和恢复(RTO 为 5-10 分钟)。

默认情况下启用每日自动备份,您可以随时更新保留策略,只需在 Amazon FSx 控制台单击几下即可。适用于 OpenZFS 的 FSx 还提供将文件系统备份复制到其他 AWS 区域的能力,以满足跨区域灾难恢复或业务连续性目标。

当您创建多可用区 (HA) 或单可用区 (HA) 文件系统时,Amazon FSx 会自动预置两个单独的文件服务器:对于多 AZ(HA)文件系统,其中一个是首选 AZ 中的“首选”服务器,另一个是备用 AZ 中的“备用”服务器,每个服务器都有自己的存储卷集。这些文件服务器中只有一台能随时主动提供数据(通常是首选文件服务器),但两者都保留着持久且相同的数据副本。对于单可用区 (HA) 文件系统,两台服务器位于同一个可用区中。这些文件服务器中只有一个在任何时候都在主动提供数据,但两者都连接到同一组存储卷,这些卷本身会复制数据以实现高耐久性。

Amazon FSx 会持续监控您的文件服务器的运行状况,以快速发现任何问题。如果首选文件服务器因任何原因不可用(例如,由于孤立的硬件故障、计划中的维护事件,或在多 AZ 文件系统的情况下,由于整个 AZ 的中断),服务将自动故障切换到备用文件服务器,这样您就可以在不损失任何可用性的情况下恢复文件系统操作。Amazon FSx 会将文件系统的网络地址映射到新的活跃备用文件服务器,这样基于 Linux 和 Windows 的应用程序就可以继续从同一个网络位置不间断地访问数据。首选文件服务器恢复到正常状态后,您的文件系统也将自动进行失效自动恢复。这些失效转移和失效自动恢复事件对您的用户和应用程序是透明的:您的文件系统将继续为来自相同网络地址的 NFS 流量提供服务,从而允许 NFS 客户端在不进行手动干预的情况下继续访问您的数据。

如果活动文件服务器因任何原因(包括硬件故障、失去连接,或对于多区域文件系统,整个区域的中断)而失去可用性,Amazon FSx 会自动在多区域(HA)或单区域(HA)文件系统上执行失效转移。在维护时段的计划维护期间,或者如果您更改文件系统的吞吐能力,Amazon FSx 也会暂时失效转移到备用文件服务器。

安全和可访问性

符合。FSx for OpenZFS 自动加密静态数据和传输中的数据。您的文件系统数据和备份始终使用通过 AWS KMS 管理的密钥进行静态加密。您可以使用服务拥有的密钥或您自己的客户托管密钥。当从支持传输加密的 Amazon EC2 实例(受支持的 Amazon EC2 客户端实例)访问数据时,Amazon FSx 会自动加密传输中数据。

您可以将文件系统配置为与 Amazon VPC 和 VPC 安全组相关联,且只有该 VPC(或对等 VPC)内的 Amazon EC2 实例,并且是符合安全组规则的实例才能访问您的文件系统。您可以使用 AWS IAM 控制谁可以管理您的文件系统、卷和备份(例如,创建、更新和删除)。此外,您还可以使用 POSIX 权限控制哪些用户和组可以访问卷上的哪些文件和目录。

符合。您可以使用 AWS Transit Gateway 或 VPC 对等从另一个 VPC(包括另一个区域的 VPC)访问文件系统,也可以使用 AWS Direct Connect 或 VPN 从本地访问文件系统。

您可以使用 AWS CloudTrail 和 AWS IAM 监控和保护 API 调用,并使用 Amazon GuardDuty 检测和标记可疑的 API 使用模式。

定价与计费

将根据预调配的存储容量(每月每 GB)、预调配的吞吐量(每月每 Mbps)和预调配的可选额外 SSD IOPS(每月每 IOP)向您进行文件系统计费。同时,还将根据所使用的存储(每 GB-月)以及跨可用区、跨 AWS 区域传输的数据以及传输到本地环境的数据(每 GB)向您进行备份计费。虽然是按月计费的,但您的使用量是按秒按比例分配的,将按您每月的平均使用量收取费用。

除非另行说明,否则我们的价格不包含适用的税费和关税(包括增值税和适用销售税)。使用日本账单地址的客户若要使用 AWS,则需缴纳日本消费税。了解详情。