目次
Amazon FSx 完全ガイド v2.0
初心者から実務者向けの包括的解説
ドキュメントの目的
本ガイドは以下を対象としています。
- 初心者向け: FSx の 4 つのバリアント(Windows / Lustre / NetApp ONTAP / OpenZFS)の選び方を学びたい方
- ストレージエンジニア向け: Windows File Server・HPC・NAS 移行の実装を習得したい方
- データサイエンティスト向け: FSx for Lustre で S3 データレイクを高速アクセスしたい方
- NetApp ユーザー向け: オンプレミス ONTAP をクラウドに移行したい方
- セキュリティ/コンプライアンス責任者向け: WORM・SnapLock・データ暗号化を理解したい方
2026 年の FSx エコシステム動向
第 2 世代 FSx for NetApp ONTAP の拡大
- 2025 年 9 月:最大 72 GBps スループット対応(12 HA ペア、1 PiB プロビジョニング容量)
- 2026 年 4 月:ロンドン・ハイデラバード・サンパウロ・AWS GovCloud に追加展開
- HA ペア数最大化で従来の 4 倍スループット実現
S3 Access Integration(新機能)
- FSx for NetApp ONTAP に S3 Access Point 統合(AWS re:Invent 2025)
- ファイル形式のまま S3 互換で AI/ML・Analytics サービスと連携
- FSx for OpenZFS にも 2025 年 6 月に同機能追加
セキュリティ・耐性強化
- Anti-Ransomware Protection(ONTAP)
- Direct-to-Vault バックアップ(AWS Backup)
- FlexCache Write-Back キャッシング(グローバル分散ワークロード)
目次
- 概要・本質
- FSx が解決する課題
- FSx の 4 つのバリアント
- FSx for Windows File Server
- FSx for Lustre
- FSx for NetApp ONTAP
- FSx for OpenZFS
- アーキテクチャ・メリット
- 主要ユースケース
- 設定・操作の具体例
- CloudFormation / Terraform IaC
- CLI / SDK 実装例
- 類似サービス比較表
- ベストプラクティス
- トラブルシューティング
- 2025-2026 最新動向
- 学習リソース・参考文献
- 実装例・Python サンプル
- 運用チェックリスト
- まとめ
概要・本質
Amazon FSx は、マネージドファイルシステム群。Windows・Linux・HPC・エンタープライズ NAS など、ワークロード特性に最適化された 4 つのバリアント を提供します。AWS が完全管理(ハードウェア故障・OS パッチ・データ複製)するため、ユーザーはファイル共有に集中できます。
簡潔な定義
「AWS のマネージドファイルストレージ群。4 つのバリアント(Windows / Lustre / ONTAP / OpenZFS)で、エンタープライズ NAS、HPC 高速処理、S3 連携を実現。AWS が完全管理。」
| バリアント | プロトコル | 特化領域 | スループット | 最大サイズ |
|---|---|---|---|---|
| Windows File Server | SMB / NFS | Windows AD 統合・SMB | 最大 2 GB/s | 最大 65.5 TiB |
| Lustre | Lustre(並列 FS) | HPC / ML / 高速処理 | 数 TB/s | ペタバイト |
| NetApp ONTAP(Gen2) | NFS / SMB / iSCSI | エンタープライズ NAS・SnapMirror | 最大 72 GBps(Gen2) | ペタバイト |
| OpenZFS | NFS | ZFS 機能・スナップショット・クローン | 最大 1.28 GB/s | 最大 500 TiB |
FSx が解決する課題
- Windows 環境の AD 統合:Active Directory 認証・DFS レプリケーションが必要
- HPC・ML の高スループット:EFS では 100 MB/s 程度。Lustre なら数 TB/s
- NetApp ONTAP の移行:オンプレミスと同じ SnapMirror・機能をクラウドで継続
- ZFS スナップショット:瞬時のスナップショット・クローンで開発環境複製
- オンプレミス NAS の置き換え:ハードウェア管理不要。AWS で完全管理
- マルチプロトコル対応:NFS・SMB・iSCSI 同時処理(ONTAP)
- エンタープライズ機能:SnapLock(WORM)・RBAC・重複排除・圧縮
FSx の 4 つのバリアント
FSx for Windows File Server
用途:Windows サーバー環境・SMB 共有・Active Directory 統合
主な特徴:
- Active Directory 統合(ユーザー認証・アクセス制御)
- DFS(分散ファイルシステム)対応
- Multi-AZ 自動フェイルオーバー(RPO = 0)
- SMB 3.1.1 対応
- VSS(Volume Shadow Copy)対応
- スループット最大 2 GB/s(SSD)
料金:ストレージ容量 + スループット容量 + バックアップ
# Windows File Server 作成
aws fsx create-file-system \
--file-system-type WINDOWS \
--storage-capacity 32 \
--subnet-ids subnet-xxxxx \
--security-group-ids sg-xxxxx \
--active-directory-configuration '{
"DomainName": "example.com",
"UserName": "Admin",
"Password": "MySecurePassword123!",
"OrganizationalUnitDistinguishedName": "OU=Fileservers,DC=example,DC=com"
}' \
--throughput-capacity 8 \
--storage-type SSD \
--tags '[{"Key": "Environment", "Value": "production"}]'
FSx for Lustre
用途:HPC・機械学習・ビッグデータ。S3 データレイク直結
主な特徴:
- 並列分散ファイルシステム:数 TB/s スループット
- S3 連携:S3 をデータリポジトリとして自動ロード・エクスポート
- Scratch vs Persistent:短期 = Scratch(低コスト)/ 長期 = Persistent(永続)
- 圧縮:LZ4 で帯域削減
- データキャッシング:S3 データの段階的ロード
- Linking:複数 Lustre FS 間のリンク
# Lustre 作成(Persistent タイプ)
aws fsx create-file-system \
--file-system-type LUSTRE \
--import-path 's3://my-bucket/training-data' \
--export-path 's3://my-bucket/output' \
--storage-capacity 2400 \
--subnet-ids subnet-xxxxx \
--security-group-ids sg-xxxxx \
--deployment-type PERSISTENT_1 \
--per-unit-storage-throughput 200 \
--data-compression-type LZ4
デプロイメントタイプ:
- SCRATCH_1:低コスト、一時ストレージ(データ複製なし)
- SCRATCH_2:高スループット(SCRATCH_1 の 6 倍)
- PERSISTENT_1:永続、自動バックアップ、高可用性
FSx for NetApp ONTAP
用途:NetApp 環境からの移行・マルチプロトコル・SnapMirror
主な特徴:
- SnapMirror:オンプレミス ONTAP ↔ AWS クラウド複製
- マルチプロトコル:NFS / SMB / iSCSI 同時対応
- Storage Tiering:Capacity Pool で低頻度データ自動移行
- フレキシブルボリューム:FlexVol で容量弾力的
- WORM / Snaplock:コンプライアンス対応(削除不可)
- 第 2 世代(2025-2026):最大 72 GBps、1 PiB プロビジョニング容量
- S3 Access Integration:S3 互換インターフェース(AI/ML サービス連携)
# NetApp ONTAP 作成(第 2 世代)
aws fsx create-file-system \
--file-system-type ONTAP \
--subnet-ids subnet-xxxxx \
--security-group-ids sg-xxxxx \
--storage-capacity 8 \
--ontap-configuration '{
"DeploymentType": "MULTI_AZ_1",
"ThroughputCapacity": 512,
"AutomaticBackupRetentionDays": 30,
"DailyAutomaticBackupStartTime": "02:00",
"DiskIopsConfiguration": {
"Iops": 6400
},
"FsxAdminPassword": "SecurePassword123!"
}' \
--tags '[{"Key": "Tier", "Value": "enterprise"}]'
デプロイメントモード:
- SINGLE_AZ_1:単一 AZ(開発・テスト用)
- MULTI_AZ_1:マルチ AZ HA(本番推奨)
FSx for OpenZFS
用途:ZFS 機能利用(スナップショット・クローン・圧縮)
主な特徴:
- 瞬時スナップショット:コピーオンライト技術
- クローン:スナップショットから瞬時に独立ボリューム作成
- 圧縮:LZ4 / GZIP で容量削減(最大 90%)
- 重複排除:効率的なストレージ利用
- S3 Access Integration(2025 年 6 月追加)
- バックアップ・リカバリー:スナップショット世代管理
# OpenZFS 作成
aws fsx create-file-system \
--file-system-type OPENZFS \
--storage-capacity 64 \
--subnet-ids subnet-xxxxx \
--security-group-ids sg-xxxxx \
--open-zfs-configuration '{
"DeploymentType": "MULTI_AZ_1",
"ThroughputCapacity": 128,
"DailyAutomaticBackupStartTime": "03:00",
"AutomaticBackupRetentionDays": 30,
"CopyTagsToSnapshots": true,
"RecordSizeKiB": 128
}'
アーキテクチャ・メリット
graph TB
subgraph Users["クライアント"]
AD["Windows AD Domain"]
EC2["EC2 (SMB / NFS)"]
ECS["ECS Fargate (NFS)"]
HPC["HPC Cluster"]
end
subgraph FSx["FSx Services"]
WINS["Windows File Server<br/>(SMB 3.1.1 + AD)"]
LUST["Lustre<br/>(Parallel FS)"]
ONTAP["NetApp ONTAP<br/>(NFS/SMB/iSCSI)"]
ZFS["OpenZFS<br/>(NFS + Snapshots)"]
end
subgraph Backup["データ保護・連携"]
AWS_BACKUP["AWS Backup<br/>(Vault)"]
S3["S3 Data Lake"]
ONPREM["On-Premises<br/>(SnapMirror)"]
end
AD --> WINS
EC2 --> WINS
EC2 --> ONTAP
ECS --> ZFS
HPC --> LUST
LUST --> S3
ONTAP --> S3
ONTAP --> ONPREM
WINS --> AWS_BACKUP
ONTAP --> AWS_BACKUP
ZFS --> AWS_BACKUP
LUST --> AWS_BACKUP
AWS が完全管理する要素:
- ハードウェア故障・自動置換
- OS・パッチ管理
- 自動バックアップ
- ネットワーク冗長化
- スケーリング管理
- 監視・アラート
主要ユースケース
1. Windows 環境の移行(AD 統合)
- Windows ファイルサーバー → FSx for Windows
- Active Directory とシームレス統合
- オンプレから段階的クラウド移行
2. 機械学習データセット高速アクセス
- S3(コールドストレージ)→ FSx Lustre(ホットストレージ)
- SageMaker Training が Lustre 経由で高速読込
- データは S3 に永続、Lustre にキャッシュ
3. NetApp ONTAP からのクラウド移行
- SnapMirror で段階的レプリケーション
- アプリケーション改修不要(同じ API)
- フェイルオーバー・フェイルバック容易
4. ゲノム解析パイプライン
- 数十 TB のシーケンスデータを Lustre で並列処理
- 結果を S3 にエクスポート
- 解析完了後は自動クリーンアップ
5. 開発環境の瞬時複製
- OpenZFS クローン機能で本番スナップショットから即開発環デプロイ
- スナップショット取得時点のデータ完全再現
6. マルチ AZ ファイル共有
- Windows / ONTAP Multi-AZ で自動フェイルオーバー
- RPO = 0(フルシンク複製)
- RTO < 1 分
7. 金融機関のコンプライアンスストレージ
- ONTAP SnapLock で WORM 対応
- Compliance Mode で削除不可
- 監査ログ・改ざん防止
8. ビデオレンダリングファーム
- Lustre Scratch で一時ファイル高速処理
- 完了後自動クリーンアップ
- コスト最適化(Persistent 不要)
9. 製造業の CAD ファイル共有
- Windows / ONTAP で複数地点から同時アクセス
- ONTAP の効率化機能で容量削減
10. グローバル拠点間のデータ同期
- ONTAP SnapMirror で複数リージョン複製
- オンプレ ↔ クラウド間の継続同期
11. AI/ML 用途の S3 連携
- FSx for Lustre / ONTAP に S3 Access Point
- ファイルシステムのまま S3 データ操作(AI サービス)
12. 一時データ処理・高速キャッシング
- Lustre で短期ワークロード最適化
- S3 からの自動ロード
- 完了後削除可能
設定・操作の具体例
Windows File Server での SMB 共有マウント
# Windows インスタンスで実行
net use Z: \\fs-0123456789abcdef0.example.com\share
# または
mount -t cifs -o username=user,password=password \
//fs-0123456789abcdef0.example.com/share /mnt/windows
Lustre での S3 データレイク統合
# Linux コンピューティングインスタンスから Lustre マウント
mount -t lustre \
fs-0123456789abcdef0.fsx.ap-northeast-1.amazonaws.com@tcp:/fsx \
/mnt/lustre
# /mnt/lustre/training-data に S3 オブジェクト自動表示
ls -la /mnt/lustre/training-data/
# Lustre のファイル状態確認(キャッシュ状況)
lfs find /mnt/lustre -type f -print0 | xargs -0 lfs getstripe
NetApp ONTAP での SnapMirror 構築
# ONTAP ボリューム作成
aws fsx create-volume \
--file-system-id fs-0123456789abcdef0 \
--name prod-vol \
--ontap-configuration '{
"SizeInMegabytes": 1024000,
"StorageEfficiencyEnabled": true,
"TieringPolicy": {
"CoolingPeriod": 31,
"Name": "AUTO"
}
}'
# SnapMirror リレーションシップ作成(オンプレ ← クラウド)
# FSx コンソール → Volumes → Create SnapMirror
OpenZFS スナップショット・クローン
# スナップショット作成(API / CLI)
aws fsx create-snapshot \
--volume-id fsvol-0123456789abcdef0 \
--name "prod-backup-$(date +%Y%m%d)"
# スナップショットからクローン作成
aws fsx create-volume-from-backup \
--backup-id fsbackup-0123456789abcdef0 \
--name "dev-clone-$(date +%Y%m%d)"
CloudFormation / Terraform IaC
CloudFormation テンプレート
Resources:
FSxONTAP:
Type: AWS::FSx::FileSystem
Properties:
FileSystemType: ONTAP
StorageCapacity: 8
SubnetIds:
- subnet-xxxxx
SecurityGroupIds:
- sg-xxxxx
OntapConfiguration:
DeploymentType: MULTI_AZ_1
ThroughputCapacity: 512
AutomaticBackupRetentionDays: 30
DailyAutomaticBackupStartTime: "02:00"
DiskIopsConfiguration:
Iops: 6400
FsxAdminPassword: !Sub '{{resolve:secretsmanager:fsx-admin:SecretString:password}}'
Tags:
- Key: Environment
Value: production
FSxBackupVault:
Type: AWS::Backup::BackupVault
Properties:
BackupVaultName: fsx-vault-prod
EncryptionKeyArn: !GetAtt BackupKey.Arn
BackupPlan:
Type: AWS::Backup::BackupPlan
Properties:
BackupPlan:
BackupPlanName: fsx-daily-backup
BackupPlanRules:
- RuleName: DailyBackup
TargetBackupVaultName: !Ref FSxBackupVault
ScheduleExpression: "cron(0 2 * * ? *)"
StartWindowMinutes: 60
CompletionWindowMinutes: 120
Lifecycle:
DeleteAfterDays: 30
Terraform 構成例
resource "aws_fsx_ontap_file_system" "prod" {
storage_capacity = 8
subnet_ids = [aws_subnet.fsx_subnet_1.id, aws_subnet.fsx_subnet_2.id]
deployment_type = "MULTI_AZ_1"
throughput_capacity = 512
automatic_backup_retention_days = 30
daily_automatic_backup_start_time = "02:00"
storage_type = "SSD"
ontap_configuration {
disk_iops_configuration {
iops = 6400
}
}
tags = {
Environment = "production"
Tier = "enterprise"
}
}
resource "aws_fsx_ontap_volume" "app_volume" {
file_system_id = aws_fsx_ontap_file_system.prod.id
name = "app-vol"
size_in_megabytes = 1048576
ontap_volume_configuration {
storage_efficiency_enabled = true
tiering_policy {
cooling_period = 31
name = "AUTO"
}
}
}
CLI / SDK 実装例
Python(Boto3)での FSx 管理
import boto3
import json
from datetime import datetime
fsx = boto3.client('fsx')
# FSx ファイルシステムの一覧
response = fsx.describe_file_systems()
for fs in response['FileSystems']:
print(f"ID: {fs['FileSystemId']}, Type: {fs['FileSystemType']}, "
f"Status: {fs['Lifecycle']}")
# バックアップの自動取得
response = fsx.create_backup(
FileSystemId='fs-0123456789abcdef0',
Tags=[
{'Key': 'Backup-Type', 'Value': 'weekly'},
{'Key': 'Date', 'Value': datetime.now().isoformat()}
]
)
print(f"Backup created: {response['Backup']['BackupId']}")
# Lustre ファイルシステムの統計情報取得
response = fsx.describe_file_systems(
Filters=[
{'Name': 'file-system-type', 'Values': ['LUSTRE']}
]
)
for fs in response['FileSystems']:
print(f"Lustre FS: {fs['FileSystemId']}, "
f"Throughput: {fs.get('LustreConfiguration', {}).get('PerUnitStorageThroughput')} MB/s/TiB")
CLI でのボリューム操作
# ONTAP ボリューム一覧
aws fsx describe-volumes \
--filters Name=file-system-id,Values=fs-xxxxx \
--query 'Volumes[*].{Name:Name, Size:SizeInMegabytes, StorageEfficiency:OntapConfiguration.StorageEfficiencyEnabled}'
# ボリュームのスナップショット一覧
aws fsx describe-snapshots \
--filters Name=volume-id,Values=fsvol-xxxxx \
--query 'Snapshots[*].{ID:SnapshotId, Created:CreateTime, Size:SizeInMegabytes}'
# スナップショット削除
aws fsx delete-snapshot \
--snapshot-id fssnap-0123456789abcdef0
類似サービス比較表
FSx バリアント内比較
| 観点 | Windows File Server | Lustre | NetApp ONTAP | OpenZFS |
|---|---|---|---|---|
| プロトコル | SMB / NFS | Lustre(並列 FS) | NFS / SMB / iSCSI | NFS |
| AD 統合 | ✅ | ❌ | ❌ | ❌ |
| SnapMirror | ❌ | ❌ | ✅ | ❌ |
| スナップショット | ✅(VSS) | ❌ | ✅ | ✅(高速) |
| S3 連携 | ❌ | ✅(Linked) | ✅(Access Point) | ✅(Access Point) |
| マルチ AZ | ✅ | ❌ | ✅ | ✅ |
| 最大スループット | 2 GB/s | 数 TB/s | 72 GBps | 1.28 GB/s |
| 使用例 | Windows 環境 | HPC / ML | エンタープライズ | ZFS 利用者 |
クラウド NAS サービス比較
| 観点 | FSx for ONTAP | NetApp Cloud Volumes | EFS | Azure Files |
|---|---|---|---|---|
| SnapMirror | ✅ | ✅ | ❌ | ❌ |
| iSCSI | ✅ | ✅ | ❌ | ❌ |
| 管理の手軽さ | ★★★★★(AWS 管理) | ★★★☆☆(手動多い) | ★★★★★ | ★★★★☆ |
| マルチクラウド | AWS のみ | マルチクラウド | AWS のみ | Azure |
| エンタープライズ機能 | ✅ | ✅ | 限定的 | ✅ |
| コスト | 中~高 | 中~高 | 低~中 | 中 |
HPC・分析用スケーリング比較
| サービス | スループット | 用途 | S3 連携 | コスト |
|---|---|---|---|---|
| Lustre Scratch | 最大数 TB/s | 一時的高速処理 | ✅ | 低 |
| Lustre Persistent | 最大数 TB/s | 長期 HPC | ✅ | 中 |
| EFS(Elastic Throughput) | 最大 500 MB/s | 汎用共有 | ❌ | 低~中 |
| ONTAP | 最大 72 GBps | マルチプロトコル | ✅ | 高 |
ベストプラクティス
✅ DO(推奨)
-
適切なバリアントを選択
- Windows 環境 + AD 統合 → Windows File Server
- HPC / ML / 分析 → Lustre(S3 連携)
- NetApp 継続運用 → ONTAP
- ZFS スナップショット必須 → OpenZFS
-
本番環境は Multi-AZ 構成を必須に
- RPO = 0(フルシンク複製)
- RTO < 1 分
- 自動フェイルオーバー
-
バックアップ戦略の明確化
- 自動日次バックアップ有効化
- 定期マニュアルスナップショット
- AWS Backup または Vault への別リージョン転送
-
ストレージ効率化を有効化
- 圧縮・重複排除(ONTAP / OpenZFS)
- ONTAP Storage Tiering(パフォーマンス / 自動)
- Intelligent Tiering で IA/Archive への自動遷移
-
セキュリティ・監視を整備
- KMS CMK による暗号化
- セキュリティグループで適切なポート開放
- CloudWatch メトリクス監視(レイテンシ・IOPS)
- CloudTrail で API 監査
-
S3 連携で コスト最適化
- Lustre Linked Data Repository
- ONTAP / OpenZFS S3 Access Point
- ホット・コールドデータの分離
-
リージョン間レプリケーション計画(ONTAP)
- SnapMirror で ディザスタリカバリー
- オンプレ ↔ クラウド継続同期
❌ DON’T(非推奨)
-
Lustre Persistent を恒続利用ストレージに
- Scratch で十分な場合もある
- コスト評価が必須
-
Windows File Server で Linux NFS
- 複雑な統合が必要
- Linux ワークロードなら EFS / Lustre
-
バックアップなしでの本番運用
- 人的ミスによる削除対策
- ランサムウェア・サイバー攻撃対応
-
セキュリティグループ設定の省略
- 不要なポートを開放しない
- 本番環境は最小権限の原則
-
スケーリング計画なしの導入
- ピークロード時のボトルネック確認
- スループット・IOPS のプロビジョニング
-
複数ファイルシステム間の重複
- 統合設計で無駄なスケーリング回避
トラブルシューティング
| 現象 | 原因 | 解決方法 |
|---|---|---|
| マウント失敗(Windows SMB) | Security Group でポート 445(SMB)閉塞 | インバウンド 445 を開放 |
| マウント失敗(NFS) | NFS ポート(111, 2049, 20001-20049)閉塞 | セキュリティグループで NFS ポート開放 |
| Lustre I/O 遅い | S3 から自動ロード中・キャッシュ不足 | キャッシュ動作待つ / Provisioned Throughput 増加 |
| ONTAP スナップショット容量が急増 | Snaplock / 古いスナップショット未削除 | 不要なスナップショット削除・Lifecycle 設定 |
| OpenZFS マウント失敗 | NFS ファイアウォール・ポート閉塞 | ポート 111 / 2049 / NFSv4 開放 |
| コスト急上昇 | ONTAP の Capacity Pool 自動拡張 | Tiering Policy 確認・Storage 上限設定 |
| ファイルアクセス権限エラー | POSIX ユーザー・グループ不一致(OpenZFS) | アクセスポイント設定で UID/GID 統一 |
| SnapMirror ラグ増加 | ネットワーク帯域不足・バックアップ重複 | Service Link 帯域確認・スケジュール最適化 |
| Windows AD 認証失敗 | AD のパスワード変更・信頼関係喪失 | 再度 AD 統合設定 / パスワード更新 |
| Lustre リンク切断 | リージョン間遅延・S3 接続断 | リージョン確認・S3 バケット権限確認 |
2025-2026 最新動向
1. 第 2 世代 FSx for NetApp ONTAP の全リージョン拡大
- 2025 年 9 月:12 HA ペア、最大 72 GBps スループット対応
- 2026 年 4 月:ロンドン・ハイデラバード・サンパウロ・GovCloud に追加
- 従来のシングル HA ペア(4 GBps)からの 18 倍スループット向上
2. S3 Access Integration(AI/ML 連携)
- FSx for NetApp ONTAP(AWS re:Invent 2025 発表):S3 Access Point で ファイルシステムデータを S3 互換で AI/ML・Analytics サービスに公開
- FSx for OpenZFS(2025 年 6 月追加):同機能で ZFS ボリュームの S3 公開
3. セキュリティ・耐性強化
- Anti-Ransomware Protection(ONTAP):自動スナップショット・復旧
- Direct-to-Vault Backup:AWS Backup による Vault への直接バックアップ
- FlexCache Write-Back:グローバル分散ワークロード向けのキャッシング強化
4. AWS Elastic VMware Service との統合
- FSx for ONTAP を vSphere クラスタのストレージバックエンド化
- 2025 年 6 月より提供開始
5. SSD Decreasing(容量縮小対応)
- NetApp Workload Factory との統合
- デプロイ後もストレージサイズ縮小・パフォーマンス最適化が可能
- 2026 年 Q1 予定
学習リソース・参考文献
AWS 公式ドキュメント(8+)
- Amazon FSx 公式サイト
- FSx User Guide - AWS Docs
- FSx for Windows File Server Guide
- FSx for Lustre Guide
- FSx for NetApp ONTAP Guide
- FSx for OpenZFS Guide
- AWS Backup with FSx
- FSx Pricing & Calculator
NetApp・技術パートナーリソース(5+)
- FSx for NetApp ONTAP - NetApp 公式
- NetApp Workload Factory
- FSx ONTAP パフォーマンス最適化
- NetApp Data Infrastructure Insights
- FSx Workshop - GitHub
ベンダー・クラウド比較
実装例・Python サンプル
SageMaker Training + Lustre データローディング
import boto3
import subprocess
import os
import sagemaker
from sagemaker.estimator import Estimator
# FSx Lustre マウントパス
lustre_path = '/mnt/lustre'
# Lustre キャッシュ状況確認
def check_lustre_cache():
result = subprocess.run(
f'lfs find {lustre_path} -type f | wc -l',
shell=True,
capture_output=True,
text=True
)
cached_files = int(result.stdout.strip())
print(f"Cached files in Lustre: {cached_files}")
return cached_files > 0
# SageMaker Training 実行(Lustre データセット利用)
session = sagemaker.Session()
role = sagemaker.get_execution_role()
estimator = Estimator(
image_uri='382416733822.dkr.ecr.ap-northeast-1.amazonaws.com/sagemaker-pytorch:2.0-cpu-py310',
role=role,
instance_count=1,
instance_type='ml.c5.2xlarge',
output_path='s3://my-bucket/output',
hyperparameters={
'epochs': 10,
'batch-size': 32
}
)
# Lustre データセット指定
estimator.fit(
inputs={
'training': f'file://{lustre_path}/training-data'
}
)
ONTAP スナップショット・リカバリー自動化
import boto3
from datetime import datetime, timedelta
fsx = boto3.client('fsx')
cloudformation = boto3.client('cloudformation')
def create_scheduled_snapshots(file_system_id, retention_days=7):
"""ONTAP ボリュームの定期スナップショット作成"""
response = fsx.describe_volumes(
Filters=[{'Name': 'file-system-id', 'Values': [file_system_id]}]
)
for volume in response['Volumes']:
volume_id = volume['VolumeId']
snapshot_name = f"{volume['Name']}-snap-{datetime.now().strftime('%Y%m%d-%H%M%S')}"
# スナップショット作成
snap_response = fsx.create_snapshot(
VolumeId=volume_id,
ClientToken=str(datetime.now().timestamp())
)
print(f"Snapshot created: {snap_response['Snapshot']['SnapshotId']}")
def cleanup_old_snapshots(file_system_id, retention_days=7):
"""指定日数以上前のスナップショットを削除"""
response = fsx.describe_snapshots(
Filters=[{'Name': 'file-system-id', 'Values': [file_system_id]}]
)
cutoff_date = datetime.now() - timedelta(days=retention_days)
for snapshot in response['Snapshots']:
created_time = snapshot['CreateTime'].replace(tzinfo=None)
if created_time < cutoff_date:
fsx.delete_snapshot(SnapshotId=snapshot['SnapshotId'])
print(f"Deleted old snapshot: {snapshot['SnapshotId']}")
# 使用例
create_scheduled_snapshots('fs-0123456789abcdef0', retention_days=30)
cleanup_old_snapshots('fs-0123456789abcdef0', retention_days=7)
運用チェックリスト
- [ ] バリアント選択:ワークロード特性に応じて適切なバリアント決定(Windows / Lustre / ONTAP / OpenZFS)
- [ ] ネットワーク設定:セキュリティグループで適切なポート開放(445 / 111 / 2049)
- [ ] バックアップ戦略:自動日次 + 定期マニュアル取得・多リージョン転送
- [ ] マルチ AZ:本番環境で Multi-AZ 構成確認(RPO/RTO 要件達成)
- [ ] ストレージ効率化:圧縮・重複排除有効化(容量・帯域削減)
- [ ] S3 統合:Lustre Linked Data / ONTAP Access Point 確認
- [ ] 暗号化:KMS CMK を使用(保存時・転送時)
- [ ] 監視・アラート:CloudWatch メトリクス(レイテンシ・IOPS・容量)
- [ ] IaC 化:CloudFormation / Terraform で管理
- [ ] リージョン間複製:ディザスタリカバリー計画(ONTAP SnapMirror)
- [ ] ライフサイクル管理:古いスナップショット自動削除ポリシー
- [ ] セキュリティ監査:CloudTrail / Config による監査ログ確認
FSx 実装パターン・本番運用ガイド
パターン 1:Windows ファイルサーバー移行(AD 統合・DFS レプリケーション)
シナリオ:オンプレミス Windows ファイルサーバー → AWS FSx への段階的移行
アーキテクチャ:
On-Premises FSx Server
↓ (DFS Replication)
AWS FSx for Windows
↑ (SMB 3.1.1)
EC2 Windows Instances + Active Directory
実装手順:
- FSx for Windows を Multi-AZ で デプロイ
- AD ドメイン参加設定(AWS Managed AD / オンプレ AD)
- DFS レプリケーション 構築(オンプレ → AWS)
- アプリケーション接続ポイント切り替え(段階的)
- オンプレ ファイルサーバー廃止
コスト効果:
- ハードウェア保守費削減(年間 30-50%)
- 容量の 弾力的管理(オンデマンド拡張)
- 人的運用コスト削減(AWS 完全管理)
パターン 2:HPC・機械学習ワークロード(Lustre + S3 連携)
シナリオ:大規模データセット(TB~PB 級)の高速処理
ワークロード例:
- ゲノム解析:数 TB シーケンスデータ
- 画像学習:数百万画像の前処理
- 気象予測:リアルタイムデータ処理
アーキテクチャ:
S3 Data Lake (Cold)
↓ (Auto-load via Lustre Linked Data)
FSx Lustre (Scratch/Persistent)
↑ ↓ (NFS mount)
HPC Cluster (EC2 Fleet) + SageMaker Training
↓ (Export Path)
S3 Results
技術的ポイント:
- Scratch vs Persistent:短期タスク(Scratch・低コスト)vs 長期保持(Persistent)
- S3 連携:Import Path で 段階的ロード、Export Path で 結果自動保存
- 圧縮:LZ4 で 帯域削減(費用 20-30% 削減)
- パフォーマンス:Per-Unit Storage Throughput で 数 TB/s 実現
コスト最適化:
- Scratch 完了後の自動削除
- ホット・コールドデータの分離
- On-Demand 課金で 予測可能性
パターン 3:エンタープライズ NAS 統合(NetApp ONTAP + SnapMirror)
シナリオ:オンプレミス NetApp ONTAP 環境からクラウド移行
特徴:
- SnapMirror で 継続レプリケーション
- フェイルオーバー・フェイルバックが容易
- ハイブリッド運用(段階的移行)
レプリケーション戦略:
- Day 1-30: オンプレ(主) ↔ AWS FSx ONTAP(副)の SnapMirror
- Day 31-60: トラフィック段階的切り替え
- Day 61+: AWS FSx(主)での本番運用、オンプレ廃止
ユースケース:
- 金融機関:勘定系データの継続複製
- 医療機関:患者データのハイブリッド管理
- 製造業:CAD ファイル・ 設計図の全社共有
パターン 4:開発環境テンプレート管理(OpenZFS クローン)
シナリオ:本番スナップショットから瞬時に開発環境複製
フロー:
Production OpenZFS Volume (Daily Backup)
↓ (Create Snapshot - Instant)
Point-in-Time Snapshot (Read-only)
↓ (Clone - Instant, Copy-on-Write)
Dev Environment Volume (Independent)
↓ (Cleanup after use)
Delete
効果:
- 開発・テスト環境の迅速デプロイ(分単位)
- 本番データの安全な検証環境作成
- 複数開発者の並行環境構築
まとめ
Amazon FSx は 「ワークロード特化型マネージドファイルシステム群」。AWS が完全管理するため、ユーザーはファイル共有に集中できます。
| バリアント | 推奨用途 | 主な特徴 |
|---|---|---|
| Windows File Server | Windows 環境・AD 統合 | SMB 3.1.1・Multi-AZ・VSS |
| Lustre | HPC・ML・分析 | 数 TB/s スループット・S3 連携 |
| NetApp ONTAP | エンタープライズ NAS | SnapMirror・マルチプロトコル・WORM |
| OpenZFS | ZFS 機能・スナップショット | 瞬時クローン・圧縮・S3 連携 |
2026 年の主な動向:
- ONTAP 第 2 世代(72 GBps)の全リージョン展開
- S3 Access Integration で AI/ML 連携強化
- Anti-Ransomware・FlexCache で エンタープライズ機能拡充
- AWS Elastic VMware Service との統合
導入メリット:
- AWS による完全管理(ハードウェア・パッチ)
- 自動スケーリング・複製
- ハイブリッド継続(SnapMirror)
- コスト最適化(圧縮・Tiering)
最終更新:2026-04-26 バージョン:v2.0