Amazon Rekognition
1. サービス概要¶
Amazon Rekognition は、AWS が提供する画像・動画解析のマネージド AI サービスである。
画像や動画の中に含まれるオブジェクトやシーンの検出、顔認識、テキスト抽出などを機械学習モデルによって自動化し、プログラミング不要で高度なビジョン処理を行える。
主なユースケースとしては、
- カスタマーサポートにおける画像分類
- 写真投稿サイトのコンテンツモデレーション(不適切画像の自動検出)
- リテール店舗の顔認証チェックインシステム
- 動画解析を用いたメディアのタグ付け
などが挙げられる。
2. 主な特徴と機能¶
2.1 物体・シーン検出 (Label Detection)¶
画像/動画に含まれるラベル(猫、車、建物、木など)を自動抽出し、それぞれに確信度スコアを付与する。
シーン(屋内、屋外、自然風景など)も検出可能で、写真や映像をメタデータ化する用途に便利である。
2.2 顔認識と顔比較 (Face Detection / Compare Faces)¶
画像内の顔を検出し、年齢推定や感情分析、姿勢などのアトリビュートを取得できる。
更に、人物が同一かどうかを比較(Compare Faces)できるため、本人確認やセキュリティ用途にも活用される。
2.3 顔検索 (Face Search)¶
独自のコレクションを作成し、顔を登録(インデックス)しておくと、リアルタイムに人物を特定できる顔検索が可能である。
大量の登録顔画像からの高速検索が実現し、監視や入退室管理、CRM システムとの統合などにも役立ちる。
2.4 テキスト検出 (Text in Image/Video)¶
写真や動画の中に含まれるテキストを読み取り、OCR(光学文字認識)機能を提供。
交通標識、看板、書類の文字などをデジタルデータ化し、分析や検索に転用できる。
2.5 コンテンツモデレーション (Content Moderation)¶
アダルトコンテンツや暴力表現など、不適切な画像や動画を検知して安全なプラットフォーム運営をサポート。
SNS 投稿やユーザー生成コンテンツ(UGC)のレビューを自動化し、リスクを低減できる。
3. アーキテクチャおよび技術要素¶
- Rekognition API に対象の画像や動画を入力(S3 の URL または Base64 などで送信)
- Rekognition が内部のディープラーニングモデルで解析し、ラベルや顔情報、テキストなどを JSON で返却
- 必要に応じて顔コレクションを作成し、登録顔画像とのマッチング(Face Search)を実施
- データ量が大きい場合はビデオ解析用の非同期ジョブを使用し、SNS や Lambda で完了通知を受けて結果を取得
- 分析結果を保存し、ダッシュボードや BI ツールで可視化、あるいはリアルタイムにユーザーへフィードバック
このように、Rekognition は画像/動画解析を即座に利用可能にし、スケーラブルなビジョン処理パイプラインを AWS 上で構築できる。
4. セキュリティと認証・認可¶
Rekognition におけるセキュリティ上の考慮点は以下の通りである:
- IAM ポリシー: Rekognition API やコレクション操作(CreateCollection、IndexFaces など)に対する最小権限を設定
- データ暗号化: S3 に格納する画像・動画を KMS 暗号化し、機密性を保持
- リージョン制限: 顔コレクションはリージョンごとに分割管理。データ越境リスクに注意
- プライバシー: 顔認識・追跡が含まれる場合は、適切な利用許諾や法令準拠を徹底
5. 料金形態¶
Amazon Rekognition の費用は以下の要素に基づきる:
- 画像解析: 1,000 枚(Units)あたりの従量課金
- 動画解析: 1 分あたりの処理料金
- 顔コレクション: インデックス作成や検索リクエストごとの料金
- テキスト検出: 1,000 枚/1 分の動画単位などで追加コスト
6. よくあるアーキテクチャ・設計パターン¶
Rekognition の利用例としては、以下が代表的である:
- 写真共有サイトのタグ付け: ユーザーがアップロードした画像を自動でラベリングし、検索性やおすすめ精度を向上
- コンテンツモデレーション: SNS や UGC プラットフォームで不適切画像を自動検知し、ブロックや要レビューに振り分け
- 防犯・セキュリティ: 店舗や施設の監視カメラ映像を分析し、特定人物の検知や異常行動監視に活用
- 営業支援(名刺処理): 名刺画像から文字を抽出して顧客情報 DB に格納し、セールス効率を高める
7. 設定・デプロイ手順(ハンズオン例)¶
- AWS コンソールで「Amazon Rekognition」を検索し、「Try demo」をクリックして簡易動作を確認
- 格的に使う場合、S3 に画像をアップロードし、Rekognition API (DetectLabels, DetectFaces など)を呼び出す
- 顔認識用には CreateCollection を実行し、IndexFaces で顔を登録
- SearchFacesByImage などを使って、類似度スコアとともに人物特定結果を取得
- 動画解析の場合は、Start/Stop API でジョブを発行し、SNS または Lambda で完了通知を受け取り結果を取得
- 結果のメタデータやラベル情報をデータベースや検索システムへ連携し、アプリケーションの機能を拡張
8. 試験で問われやすいポイント¶
8.1 ラベル検出と信頼度¶
- Label Detection: 画像/動画内のオブジェクトやシーンを検出
- Confidence スコア: 0 ~ 100%で確信度を示す、しきい値を設定して必要な結果のみ採用
8.2 顔検出と顔コレクション¶
- DetectFaces: 画像内の顔領域を検出し、年齢層や表情などの属性を返す
- Face Collection: 顔の特徴量をインデックス化し、SearchFaces で人物同定が可能
8.3 テキスト検出 (OCR)¶
- DetectText: 看板や印刷文字を抽出、位置情報も取得
- 動画: Video Rekognition で動的に文字を認識
8.4 非同期ビデオ解析¶
- StartLabelDetection など: ビデオファイル(S3)を処理し、SNS や Lambda で完了通知を受け取る
- 長尺動画: 非同期ジョブで大容量コンテンツをスケーラブルに分析
8.5 モデレーション (Content Moderation)¶
- 不適切ラベル: アダルト、暴力シーンなどを検出
- コミュニティガイドライン: SNS や UGC プラットフォームでの利用を支援
8.6 試験で頻出となる具体的な問われ方と答え¶
- Q: Amazon Rekognition で顔を識別(同一人物か判定)するには?
- A: CompareFaces API を使用、または顔コレクションを作り SearchFaces でマッチング。
- Q: 大量動画のラベル付けをしたい場合は?
- A: Video Rekognition の非同期ジョブ(StartLabelDetection など)を使い、SNS 通知で完了を受け取る。
- Q: コンテンツモデレーションで何が検出できる?
- A: アダルトや暴力表現など、不適切な画像・動画要素を検出し、ラベルとスコアを返す。
- Q: OCR 的な機能は Rekognition で扱える?
- A: Yes. DetectText API で画像や動画フレーム内の文字を抽出可能。
- Q: Rekognition の料金ポイントは?
- A: 画像ラベル検出は 1,000 イメージ単位、ビデオは 1 分単位で従量課金。顔コレクションの検索や IndexFaces にもコストが発生。