目次
Amazon Kendra v2.0 完全ガイド 2026
Amazon Kendra は、企業のドキュメント・ナレッジベースに対して、自然言語による直接回答を提供するインテリジェント検索サービス であり、40+ のエンタープライズコネクター(SharePoint・Salesforce・Confluence・S3 等)を統合し、セマンティック検索・ハイブリッド検索・ファクト抽出により、従来のキーワード検索では実現できない正確で関連性の高い回答を実現します。2025-2026 年の GenAI Index による大幅な機能強化により、Bedrock Knowledge Bases・Amazon Q Business のコア検索エンジンとしての地位を確立しました。
目次
- 概要・課題・特徴
- アーキテクチャ
- コアコンポーネント
- 主要ユースケース
- インデックスタイプ
- 設定・操作の具体例
- データソースコネクター
- 類似サービス比較表
- ベストプラクティス
- トラブルシューティング
- 2025-2026 最新動向
- 学習リソース・参考文献
- 実装例・チェックリスト
- まとめ
概要・課題・特徴
本質
Amazon Kendra は 「40+ エンタープライズコネクターを統合し、セマンティック・ハイブリッド検索で直接回答を返すインテリジェント検索サービス」 です。従来の Elasticsearch・OpenSearch はキーワードマッチングで関連ドキュメントのリストを返すのに対し、Kendra は “有給休暇は何日か?” という自然言語質問に対して社内規程から直接 “年間 20 日” と段落レベルの回答を抽出して返します(ファクト抽出)。
解決する課題
- 情報の断片化:SharePoint・Confluence・S3・Salesforce などに散在するドキュメントを一元検索できず、従業員が必要な情報を見つけるのに時間を要する
- キーワード検索の限界:関連度スコア付きリストを返すが、質問への直接回答ではない
- エンタープライズコネクター実装の複雑さ:各 SaaS の API 仕様を個別に実装する必要がある
- アクセス制御の維持:元のドキュメントのアクセス権をインデックスに反映させるのが複雑
- セマンティック検索の実装難度:ベクター化・埋め込みモデル選定・ハイブリッド検索の構築には高度な機械学習知識が必要
主な特徴
| 特徴 | 説明 |
|---|---|
| GenAI Index(2024-2026) | ハイブリッド検索(キーワード + ベクター)、最新セマンティックモデル、再ランカー機能で最高精度を実現 |
| 40+ データソースコネクター | S3、SharePoint、Salesforce、ServiceNow、Confluence、Slack、Google Drive、Box、Jira、GitHub、Zendesk 等一度の設定で接続可能 |
| ファクト抽出(Question Answering) | 質問に対して段落・リスト・テーブル形式で直接回答を返す |
| Bedrock Knowledge Bases 統合 | GenAI Index を Bedrock の RAG エンジンとして利用可能 |
| Amazon Q Business 統合 | Q Business のコア検索エンジン、企業向けノーコード GenAI アシスタントを実現 |
| セキュリティ・アクセス制御 | SharePoint・Salesforce のドキュメントレベルのアクセス権を維持、検索結果を権限ユーザーのみに制限 |
| メタデータ・カスタム属性フィルタリング | 部署・日付・ドキュメントタイプ等で検索結果を限定 |
| Relevance Tuning | ユーザーフィードバック(クリック・“Not Helpful”)を学習して精度向上 |
| Query Suggestions | 過去のクエリから自動補完候補を提示 |
| Mobile & Web 対応 | REST API でモバイル・Web・チャットボット等に統合可能 |
アーキテクチャ
graph TB
subgraph "Enterprise Data Sources(ソース)"
S3["Amazon S3<br/>ドキュメント"]
SP["SharePoint<br/>会社資料"]
SF["Salesforce<br/>営業資料"]
SN["ServiceNow<br/>ナレッジ"]
CF["Confluence<br/>技術ドキュメント"]
SL["Slack<br/>会話履歴"]
Other["Google Drive<br/>Box<br/>GitHub<br/>Zendesk等"]
end
subgraph "Kendra Platform(インデックス・処理)"
Connector["Data Source Connectors<br/>(自動クロール・同期)"]
Extract["Document Extraction<br/>(テキスト・メタデータ抽出)"]
Index["Intelligent Index<br/>・キーワード索引<br/>・ベクター化<br/>・再ランカー学習"]
QA["Question Answering Engine<br/>(ファクト抽出・段落選択)"]
Auth["ACL Enforcement<br/>(元のアクセス権維持)"]
end
subgraph "User Interfaces & Integration"
WebUI["Web Search UI<br/>(カスタマイズ可能)"]
API["REST API<br/>(カスタムアプリ)"]
QBusiness["Amazon Q Business<br/>(エンタープライズ GenAI)"]
Bedrock["Bedrock Knowledge Bases<br/>(RAG エンジン)"]
end
S3 --> Connector
SP --> Connector
SF --> Connector
SN --> Connector
CF --> Connector
SL --> Connector
Other --> Connector
Connector --> Extract
Extract --> Index
Index --> QA
Extract --> Auth
QA --> WebUI
QA --> API
QA --> QBusiness
QA --> Bedrock
Auth --> QBusiness
Auth --> Bedrock
データフロー詳細
- データソース接続:コネクター自動クロール(スケジュール / 手動 / イベント駆動)
- ドキュメント抽出:PDF / Word / HTML / テキストからテキスト・メタデータ・アクセス制御情報を抽出
- インデックス化:
- キーワード索引:全文検索用
- ベクター化:セマンティック検索用
- メタデータ索引:フィルタリング用
- クエリ処理:
- ユーザーが自然言語質問を入力
- キーワード・セマンティック・ハイブリッドで関連ドキュメント検索
- 再ランカー:上位ドキュメントの関連性再評価
- ファクト抽出:質問に直結する段落・リスト・テーブルを抽出
- セキュリティ適用:検索結果から、ユーザーがアクセス権を持たないドキュメントを除外
コアコンポーネント
1. インデックス(Index)
Kendra の中核。複数のドキュメントを整理し、高速・正確な検索を実現します。
インデックスタイプ(2026 年時点)
| タイプ | エディション | 用途 | 特徴 |
|---|---|---|---|
| GenAI Enterprise Index | 本番推奨 | RAG・企業検索 | ハイブリッド検索、最高精度、再ランカー、43+ コネクター |
| Basic Enterprise Index | 本番対応 | 企業検索 | セマンティック検索、高可用性 |
| Developer Edition | 非本番 | PoC・開発 | セマンティック検索、機能制限(最大 10k ドキュメント) |
2. データソースコネクター(40+ 対応)
自動クロール・同期・アクセス制御維持。
主要コネクター:
- クラウドストレージ:S3、Google Drive、Dropbox、OneDrive、Box
- 企業ナレッジ:SharePoint Online、Confluence、Jira、ServiceNow
- CRM/営業:Salesforce、HubSpot
- 通信:Slack、Microsoft Teams
- 開発:GitHub、GitLab、Bitbucket、CodeCommit
- その他:RDS(MySQL/PostgreSQL)、Web Crawler
3. クエリエンジン(Query Engine)
ファクトクエリ(Factoid Questions)
“Where is the nearest service center?” → “Seattle downtown location” → FAQ や記事から直接短い回答を返す
説明質問(Descriptive Questions)
“How do I set up VPN?” → 複数の段落・手順を含む説明を返す
キーワード・自然言語クエリ
複雑な会話的クエリでも文脈を理解
4. 検索機能
- キーワード検索:全文検索、フレーズ検索
- セマンティック検索:文脈・意味による検索
- ハイブリッド検索:キーワード + セマンティックの組み合わせ
- ファセット検索:メタデータ(カテゴリ・日付・部署等)でフィルタ
- カスタムシノニム:「有給休暇」「年休」「PTO」を同一概念として処理
- Featured Results:特定の質問に対して強調結果を指定
主要ユースケース
1. 社内ポータル・FAQ 検索
シーン:HR 部門が就業規則・福利厚生・育児休暇申請方法を Kendra にインデックス
- 従業員が “育児休暇の申請方法は?” と質問
- Kendra が規程から直接 “申請はマイページから…” と回答
- ポータルに埋め込まれた Web UI で即座に検索
2. 法務・リーガルサーチ
シーン:契約書・規制文書・判例を Kendra に統合
- 弁護士が “SaaS ライセンスの制限事項は何か” と質問
- Kendra が複数の契約書から該当条項を抽出
- ソース文書へのリンク付きで提示
3. ヘルプデスク・サポート自動化
シーン:Confluence・Jira・ServiceNow ナレッジを Kendra 統合
- サポートエンジニアが “SSO ログイン失敗時の対応は?” と検索
- トラブルシューティングガイドを自動提示
- チャットボット(Lex + Kendra)で顧客自己解決を促進
4. 営業・顧客成功チーム
シーン:Salesforce・競合分析・提案テンプレートを統合
- 営業担当者が “顧客 ABC の過去の提案は?” と質問
- Kendra が過去のセールスロジックス記録から類似案件を検索
- 提案時間を 50% 削減
5. 医療・製薬・生命科学
シーン:臨床試験報告・FDA 規制・論文を Kendra 統合
- 研究者が “薬物 X の副作用は何か” と検索
- Kendra が複数の論文・試験報告から該当情報を抽出
- 規制当局への回答作成時間を短縮
6. 技術ドキュメント検索
シーン:API ドキュメント・アーキテクチャガイド・トラブルシューティングガイド
- 開発者が “Lambda のコールドスタート回避方法は?” と検索
- Kendra が複数のドキュメントから回避策を統合提示
7. 従業員研修・オンボーディング
シーン:会社ハンドブック・セキュリティポリシー・プロセスマニュアル
- 新入社員が “データ分類ポリシーは?” と質問
- Kendra が該当セクションを即座に提示
8. 多言語検索
シーン:グローバル企業が複数言語のドキュメントを統合
- 日本の従業員が日本語で、米国の従業員が英語で検索
- 各自の言語で結果が返される(多言語 GenAI Index 対応)
9. 生成 AI(Bedrock)の知識ベース
シーン:Claude・Llama・Nova を使った RAG チャットボット
- ユーザーが “会社の出張ポリシーの例外申請プロセスは?” と質問
- Bedrock の Claude が Kendra GenAI Index から関連文書を検索(RAG)
- 検索結果に基づいて Claude が生成回答を作成
- ハルシネーション(幻覚)を抑制、正確な回答を保証
10. Amazon Q Business 統合
シーン:ノーコード企業向け GenAI アシスタント
- 従業員が Q Business チャット UI で自然言語質問
- Q Business が Kendra GenAI Index から検索
- 権限のあるドキュメントのみを回答に含める
- Jira・ServiceNow へのアクション実行(タスク作成等)
インデックスタイプ
GenAI Enterprise Index(推奨)
2024 年末に発表、2025-2026 年の本番推奨。
特徴:
- ハイブリッド検索:キーワード + ベクター
- 最新の情報検索技術:セマンティック埋め込み + 再ランカー
- 43+ のデータソースコネクター
- メタデータベースのユーザー権限フィルタリング
- 高可用性(マルチリージョン対応予定)
- Bedrock Knowledge Bases・Amazon Q Business での使用を想定
- 無料トライアル:750 時間(30 日間)
価格:
- インデックス作成・保持:月次固定(詳細は AWS 公式)
- クエリ:従量課金(数千クエリから)
- コネクター同期:GB ベース
Basic Enterprise Index
セマンティック検索を備えた基本エディション。
特徴:
- セマンティック検索対応
- 高可用性、本番対応
- GenAI Index よりも価格が低い
- 大規模エンタープライズ向け
Developer Edition
開発・PoC 用。本番非推奨。
設定・操作の具体例
AWS CLI による設定
1. インデックスの作成
aws kendra create-index \
--name "company-knowledge-base" \
--edition ENTERPRISE_GENAI \
--role-arn arn:aws:iam::123456789012:role/KendraIndexRole \
--region ap-northeast-1
2. S3 データソースの追加
aws kendra create-data-source \
--index-id index-xxx \
--name "s3-company-docs" \
--type S3 \
--configuration '{
"S3Configuration": {
"BucketName": "company-internal-docs",
"InclusionPrefixes": ["policies/", "manuals/"],
"ExclusionPatterns": ["*.tmp", "archive/"]
}
}' \
--role-arn arn:aws:iam::123456789012:role/KendraDataSourceRole \
--schedule 'cron(0 2 * * ? *)' \
--region ap-northeast-1
3. SharePoint Online 接続
aws kendra create-data-source \
--index-id index-xxx \
--name "sharepoint-docs" \
--type SHAREPOINT \
--configuration '{
"SharePointConfiguration": {
"SharePointVersion": "SHAREPOINT_ONLINE",
"Urls": ["https://company.sharepoint.com"],
"CrawlAttachments": true,
"ExclusionPatterns": ["*.tmp"]
}
}' \
--secret-arn arn:aws:secretsmanager:ap-northeast-1:123456789012:secret/sharepoint-creds \
--schedule 'cron(0 */6 * * ? *)' \
--role-arn arn:aws:iam::123456789012:role/KendraDataSourceRole \
--region ap-northeast-1
4. 検索(自然言語クエリ)
aws kendra query \
--index-id index-xxx \
--query-text "有給休暇は何日もらえますか?" \
--region ap-northeast-1
出力例:
{
"QueryId": "abc123",
"ResultItems": [
{
"Id": "doc-001",
"Type": "QUESTION_ANSWER",
"Score": 0.95,
"DocumentTitle": "HR Policy Manual - Leave Policy",
"DocumentURI": "s3://company-docs/policies/leave.pdf",
"DocumentAttributes": {
"Department": "HR",
"UpdateDate": "2025-12-01"
},
"Content": "正社員は年間20日の有給休暇が付与されます。契約社員は勤務時間に応じて日数が異なります。",
"AdditionalAttributes": {
"SourceAttribution": {
"SourceUrl": "s3://company-docs/policies/leave.pdf#page5"
},
"Confidence": {
"Score": 0.95
}
}
}
],
"TotalNumberOfResults": 3
}
Python SDK での実装
import boto3
client = boto3.client('kendra', region_name='ap-northeast-1')
# 自然言語クエリ
response = client.query(
IndexId='index-xxx',
QueryText='有給休暇は何日もらえますか?',
QueryResultTypeFilter='QUESTION_ANSWER', # ファクト抽出を優先
PageSize=5,
SortingConfiguration={
'DocumentAttributeKey': 'UpdateDate',
'SortOrder': 'DESC'
},
FilteringConfiguration={
'DocumentAttributeFilter': {
'AndAllFilters': [
{
'EqualsTo': {
'Key': 'Department',
'Value': {'StringValue': 'HR'}
}
}
]
}
}
)
# 結果を表示
for item in response['ResultItems']:
if item['Type'] == 'QUESTION_ANSWER':
print(f"[直接回答] {item['Content']}")
print(f"出所: {item['DocumentTitle']}")
print(f"信頼度: {item['ScoreAttributes']['ScoreConfidence']:.0%}")
elif item['Type'] == 'DOCUMENT':
print(f"[関連ドキュメント] {item['DocumentTitle']}")
print(f"スコア: {item['Score']:.2f}")
IaC(CloudFormation)での設定
AWSTemplateFormatVersion: '2010-09-09'
Resources:
KendraIndexRole:
Type: AWS::IAM::Role
Properties:
AssumeRolePolicyDocument:
Version: '2012-10-17'
Statement:
- Effect: Allow
Principal:
Service: kendra.amazonaws.com
Action: sts:AssumeRole
ManagedPolicyArns:
- arn:aws:iam::aws:policy/CloudWatchLogsFullAccess
Policies:
- PolicyName: KendraS3Access
PolicyDocument:
Version: '2012-10-17'
Statement:
- Effect: Allow
Action:
- s3:GetObject
- s3:ListBucket
Resource:
- arn:aws:s3:::company-docs
- arn:aws:s3:::company-docs/*
KendraIndex:
Type: AWS::Kendra::Index
Properties:
Name: company-kb
Edition: ENTERPRISE_GENAI
RoleArn: !GetAtt KendraIndexRole.Arn
ServerSideEncryptionConfiguration:
KmsKeyId: !GetAtt KendraEncryptionKey.Arn
Description: Company-wide knowledge base
S3DataSource:
Type: AWS::Kendra::DataSource
Properties:
IndexId: !Ref KendraIndex
Name: s3-docs
Type: S3
DataSourceConfiguration:
S3Configuration:
BucketName: company-docs
InclusionPrefixes:
- policies/
- manuals/
Schedule: 'cron(0 2 * * ? *)'
RoleArn: !GetAtt KendraIndexRole.Arn
データソースコネクター
43+ 対応コネクター(2026 年)
クラウドストレージ
- Amazon S3
- Google Drive
- Dropbox
- OneDrive
- Box
エンタープライズナレッジ
- SharePoint Online
- SharePoint On-premises
- Confluence(Cloud & Server)
- Jira(Cloud & Server)
- ServiceNow
- Slack
CRM・営業
- Salesforce
- HubSpot
- Zendesk
開発
- GitHub
- GitLab
- Bitbucket
- AWS CodeCommit
データベース
- RDS(MySQL、PostgreSQL)
- Redshift
その他
- Web Crawler
- QuickSight
- Alfresco
- Microsoft Teams
コネクタ設定パターン
Web Crawler によるスクレイピング
aws kendra create-data-source \
--index-id index-xxx \
--name "company-website" \
--type WEBCRAWLER \
--configuration '{
"WebCrawlerConfiguration": {
"Urls": {
"SeedUrlConnections": [
{
"SeedUrl": "https://company.example.com",
"Mode": "HOST_ONLY"
}
],
"SiteMapsUrls": ["https://company.example.com/sitemap.xml"]
},
"CrawlDepth": 2,
"MaxContentSizePerPageInMegabytes": 50,
"MaxLinksPerPage": 100,
"MaxUrlsPerMinuteCrawlRate": 300
}
}' \
--role-arn arn:aws:iam::123456789012:role/KendraDataSourceRole
RDS データソース
aws kendra create-data-source \
--index-id index-xxx \
--name "rds-database" \
--type RDS \
--configuration '{
"RdsConfiguration": {
"DatabaseHost": "mydb.xxxxx.ap-northeast-1.rds.amazonaws.com",
"DatabasePort": 5432,
"DatabaseName": "company_db",
"TableNames": ["knowledge_articles", "faq"],
"SecretArn": "arn:aws:secretsmanager:ap-northeast-1:123456789012:secret/rds-creds"
}
}' \
--role-arn arn:aws:iam::123456789012:role/KendraDataSourceRole
類似サービス比較表
| サービス | 検索方式 | エンタープライズコネクター | ファクト抽出 | GenAI 統合 | コスト | 導入難度 |
|---|---|---|---|---|---|---|
| Kendra GenAI Index | ハイブリッド(キーワード+ベクター) | 40+ | ✅ | Bedrock・Q Business | 中 | 低(ノーコード) |
| Azure AI Search | キーワード・セマンティック | 10+ | △(限定的) | ✅ | 中 | 中 |
| Elasticsearch | キーワード・ベクター検索 | カスタム実装 | ❌ | △(外部統合) | 低~中 | 高 |
| OpenSearch | キーワード・ベクター検索 | カスタム実装 | ❌ | △(外部統合) | 低~中 | 高 |
| Algolia | キーワード・セマンティック | 少ない | ❌ | △ | 低~中 | 低 |
| Google Cloud Search | キーワード・セマンティック | Google Workspace のみ | △ | △ | 中 | 中 |
| Glean | セマンティック AI | 50+ | ✅(AI 活用) | ✅(ネイティブ) | 高 | 低(ノーコード) |
| Coveo | AI 検索・セマンティック | 200+ | ✅(AI 活用) | ✅ | 高 | 低 |
Kendra の強み:
- AWS 統合が最高(Bedrock・Q Business・Security Lake)
- エンタープライズコネクター数が豊富
- セマンティック検索 + ファクト抽出
- AWS IAM による統一的なセキュリティ・アクセス制御
ベストプラクティス
✅ Do
- GenAI Enterprise Index を本番利用:ハイブリッド検索・再ランカーで精度向上
- 元のアクセス制御を維持:SharePoint・Salesforce のドキュメント権限をインデックスに反映
- メタデータを豊富に設定:部署・更新日・ドキュメントタイプ等で後のフィルタリングを容易に
- 定期的にコネクタを同期:スケジュール実行で常に最新の情報を保持
- Relevance Tuning を実施:ユーザーフィードバックを学習させ、精度向上
- カスタムシノニム定義:業界用語・略語を標準化(「PTO」「有給」「年休」)
- Bedrock・Q Business と統合:RAG チャットボット・エンタープライズ GenAI を構築
- セキュリティ監視:CloudWatch・CloudTrail で検索ログ・異常アクセスを監視
- 複数リージョン構成:高可用性を確保(地理的冗長性)
- コストモニタリング:Cost Explorer で月次コスト分析、ドキュメント削減やクエリ最適化
❌ Don’t
- Developer Edition を本番利用:ドキュメント数制限・機能制限
- アクセス制御を無視:機密文書の権限なしユーザーへの漏洩
- メタデータを設定しない:後のクエリ最適化が困難
- 手動で頻繁にドキュメント追加:データソースコネクターで自動化すべき
- Relevance Tuning を無視:デフォルトのままでは精度が低い
- Elasticsearch と混在利用:エンタープライズ機能が異なるため混乱
- IAM ロール権限が過剰:最小権限設計に基づいて制限
- ドキュメント同期の頻度が低すぎる:情報鮮度が落ちる(時間単位で同期推奨)
- CloudWatch ロギングを無効化:トラブルシューティングが困難
- 無制限スケーリング:クエリ数・ドキュメント数に応じてコスト計画を立案
トラブルシューティング
| 問題 | 原因 | 対策 |
|---|---|---|
| 検索結果がない・少ない | ドキュメントがインデックスされていない / コネクタが失敗 | CloudWatch ログで同期エラー確認、S3 パス設定確認 |
| 精度が低い(関連性薄い結果) | GenAI Index を使っていない / Relevance Tuning 未実施 | GenAI Index に升級、ユーザーフィードバック学習 |
| 検索結果が権限なしドキュメントを含む | ACL 設定が完全でない | SharePoint・Salesforce での ALC 設定確認、Kendra での権限フィルタ設定確認 |
| コネクタ同期が失敗 | 認証情報が無効 / ネットワーク不通 | Secrets Manager で認証情報確認、IAM ロール権限確認 |
| クエリレイテンシーが高い | インデックスサイズが大きい / 同時クエリ数が多い | ドキュメント最適化、Provisioned Capacity の利用 |
| ファクト抽出が機能しない | 質問がドキュメントに存在しない / 質問形式が不適切 | 異なる質問で試行、ドキュメント内容確認 |
| コスト増加 | クエリ数増加 / 同期頻度が高い / 大量ドキュメント | クエリキャッシュ活用、同期スケジュール見直し、ドキュメント整理 |
| データソース接続が途絶える | OAuth トークン期限切れ / ネットワーク問題 | Secrets Manager リフレッシュ、ネットワーク診断 |
2025-2026 最新動向
GenAI Index(2024-2026)
AWS が 2024 年末に発表した最新インデックス型。
新機能:
- ハイブリッド検索:キーワード + ベクター(チャンク・文書単位)
- 最新セマンティックモデル:より正確な文脈理解
- 再ランカー機能:上位ドキュメントを再評価
- 43+ コネクター完全サポート
- Bedrock Knowledge Bases・Amazon Q Business との深い統合
2025-2026 の展開:
- 4 月 2025:Europe(Ireland)・Asia Pacific(Sydney)で利用可能
- 多言語サポート拡充
- マルチリージョン高可用性(予定)
Amazon Q Business への統合
Kendra GenAI Index が Amazon Q Business のコア検索エンジン。
- ノーコード UI でデータソース接続
- 自然言語回答 + 権限分離
- Jira・ServiceNow へのアクション実行
Bedrock Knowledge Bases との統合
生成 AI(Claude・Llama・Nova)を使った RAG チャットボット。
- Kendra GenAI Index を検索エンジンとして利用
- LLM が検索結果に基づいて生成回答
- Guardrails でコンテンツ制御
エンタープライズセキュリティ強化
- より細粒度のアクセス制御(ユーザーグループ単位)
- SAML・OIDC 統合
- CloudTrail 監査ログ完全装備
コネクター拡充
- Miro、Figma、Notion 等のモダンツール対応
- カスタムコネクター SDK の拡張
学習リソース・参考文献
公式 AWS リソース
- Amazon Kendra の概要
- Kendra Developer Guide
- Introducing Amazon Kendra GenAI Index
- Kendra + Bedrock Knowledge Base
- Amazon Kendra Pricing
- Kendra Tutorials & Workshops
- GenAI Index Regional Availability(2025/04)
- Index Types in Kendra
オープンソース・ベンダーリソース
- Amazon Kendra on GitHub
- Retrieval Augmented Generation(RAG)パターン集
- Kendra + LangChain 統合
- Kendra + LlamaIndex
- SemanticSearch・ベクター検索の基礎
実装例・チェックリスト
実装シナリオ:企業 FAQ ポータル
-
計画フェーズ
- [ ] 対象ドキュメント・ナレッジベース選定(Confluence・SharePoint・S3 等)
- [ ] ドキュメント分類・メタデータ標準化
- [ ] アクセス制御方針(誰がどのドキュメントを見られるか)
-
セットアップフェーズ
- [ ] IAM ロール・ポリシー作成
- [ ] Kendra インデックス作成(GenAI Enterprise Edition)
- [ ] データソースコネクター設定(SharePoint・Confluence・S3)
- [ ] 初期クロール・インデックス化
-
チューニングフェーズ
- [ ] 関連性チューニング:ユーザーフィードバック学習
- [ ] カスタムシノニム定義
- [ ] Featured Results 設定(よくある質問)
- [ ] Query Suggestions 設定
-
統合フェーズ
- [ ] Web UI カスタマイズ(ブランディング・配色)
- [ ] REST API 統合(イントラネットポータル・モバイルアプリ)
- [ ] Slack・Teams チャットボット統合(Bedrock + Kendra)
-
運用フェーズ
- [ ] 定期同期スケジュール設定
- [ ] CloudWatch ロギング・監視設定
- [ ] コスト最適化(ドキュメント整理・クエリ頻度分析)
- [ ] セキュリティ監査(定期アクセス権確認)
実装チェックリスト
検索エクスペリエンス
- [ ] 5 語以内の短い質問で直接回答が返される
- [ ] 複雑な質問でも関連ドキュメント TOP 3 が表示される
- [ ] 検索結果にソース文書へのリンク・信頼度スコアが表示される
- [ ] モバイルデバイスで最適化されている
セキュリティ・アクセス制御
- [ ] 権限なしユーザーには検索結果に機密文書が表示されない
- [ ] CloudTrail で全クエリがログされている
- [ ] IAM ロール権限が最小化されている
パフォーマンス・コスト
- [ ] クエリレイテンシー < 2 秒(95 パーセンタイル)
- [ ] インデックス更新頻度がドキュメント変更サイクルと同期
- [ ] 月次コスト予測が立てられている
メンテナンス・運用
- [ ] ドキュメント整理・削除プロセスが定義されている
- [ ] Relevance Tuning 実施スケジュールがある
- [ ] アラート設定(コネクタ失敗・クエリエラー)
まとめ
Amazon Kendra は 「40+ エンタープライズコネクターを統合し、自然言語による直接回答を提供するインテリジェント検索サービス」 です。
適切な利用場面
- 社内ポータル・FAQ 検索:キーワード検索では困難な複雑な質問に直接回答
- 企業向け GenAI:Bedrock・Q Business の知識ベース
- エンタープライズナレッジ統合:SharePoint・Salesforce・Confluence を一元検索
- セキュリティ・コンプライアンス:アクセス制御維持しながら検索
不適切な利用場面
- 全文検索エンジン:Elasticsearch・OpenSearch の方が安価・柔軟
- リアルタイム分析:データウェアハウス(Redshift・Athena)向け
- 大規模ログ分析:CloudWatch Logs・Splunk 向け
導入チェック
Kendra の導入を検討する際は以下を確認:
- ドキュメント量:1,000 ドキュメント以上(小規模なら OpenSearch で十分)
- ユーザー数:10 名以上(数人なら手動検索で OK)
- 複雑な質問の発生頻度:月 10 件以上のキーワード検索では対応困難な質問
- エンタープライズコネクター数:2 つ以上のデータソースを統合したい
バージョン:v2.0 | 最終更新:2026-04-26