コンテンツにスキップ

Amazon Rekognition

1. サービス概要

Amazon Rekognition は、AWS が提供する画像・動画解析のマネージド AI サービスである。
画像や動画の中に含まれるオブジェクトやシーンの検出、顔認識、テキスト抽出などを機械学習モデルによって自動化し、プログラミング不要で高度なビジョン処理を行える。

主なユースケースとしては、

  • カスタマーサポートにおける画像分類
  • 写真投稿サイトのコンテンツモデレーション(不適切画像の自動検出)
  • リテール店舗の顔認証チェックインシステム
  • 動画解析を用いたメディアのタグ付け

などが挙げられる。

2. 主な特徴と機能

2.1 物体・シーン検出 (Label Detection)

画像/動画に含まれるラベル(猫、車、建物、木など)を自動抽出し、それぞれに確信度スコアを付与する。
シーン(屋内、屋外、自然風景など)も検出可能で、写真や映像をメタデータ化する用途に便利である。

2.2 顔認識と顔比較 (Face Detection / Compare Faces)

画像内の顔を検出し、年齢推定や感情分析、姿勢などのアトリビュートを取得できる。
更に、人物が同一かどうかを比較(Compare Faces)できるため、本人確認やセキュリティ用途にも活用される。

独自のコレクションを作成し、顔を登録(インデックス)しておくと、リアルタイムに人物を特定できる顔検索が可能である。
大量の登録顔画像からの高速検索が実現し、監視や入退室管理、CRM システムとの統合などにも役立ちる。

2.4 テキスト検出 (Text in Image/Video)

写真や動画の中に含まれるテキストを読み取り、OCR(光学文字認識)機能を提供。
交通標識、看板、書類の文字などをデジタルデータ化し、分析や検索に転用できる。

2.5 コンテンツモデレーション (Content Moderation)

アダルトコンテンツや暴力表現など、不適切な画像や動画を検知して安全なプラットフォーム運営をサポート。
SNS 投稿やユーザー生成コンテンツ(UGC)のレビューを自動化し、リスクを低減できる。

3. アーキテクチャおよび技術要素

  1. Rekognition API に対象の画像や動画を入力(S3 の URL または Base64 などで送信)
  2. Rekognition が内部のディープラーニングモデルで解析し、ラベルや顔情報、テキストなどを JSON で返却
  3. 必要に応じて顔コレクションを作成し、登録顔画像とのマッチング(Face Search)を実施
  4. データ量が大きい場合はビデオ解析用の非同期ジョブを使用し、SNS や Lambda で完了通知を受けて結果を取得
  5. 分析結果を保存し、ダッシュボードや BI ツールで可視化、あるいはリアルタイムにユーザーへフィードバック

このように、Rekognition は画像/動画解析を即座に利用可能にし、スケーラブルなビジョン処理パイプラインを AWS 上で構築できる。

4. セキュリティと認証・認可

Rekognition におけるセキュリティ上の考慮点は以下の通りである:

  • IAM ポリシー: Rekognition API やコレクション操作(CreateCollection、IndexFaces など)に対する最小権限を設定
  • データ暗号化: S3 に格納する画像・動画を KMS 暗号化し、機密性を保持
  • リージョン制限: 顔コレクションはリージョンごとに分割管理。データ越境リスクに注意
  • プライバシー: 顔認識・追跡が含まれる場合は、適切な利用許諾や法令準拠を徹底

5. 料金形態

Amazon Rekognition の費用は以下の要素に基づきる:

  • 画像解析: 1,000 枚(Units)あたりの従量課金
  • 動画解析: 1 分あたりの処理料金
  • 顔コレクション: インデックス作成や検索リクエストごとの料金
  • テキスト検出: 1,000 枚/1 分の動画単位などで追加コスト

6. よくあるアーキテクチャ・設計パターン

Rekognition の利用例としては、以下が代表的である:

  • 写真共有サイトのタグ付け: ユーザーがアップロードした画像を自動でラベリングし、検索性やおすすめ精度を向上
  • コンテンツモデレーション: SNS や UGC プラットフォームで不適切画像を自動検知し、ブロックや要レビューに振り分け
  • 防犯・セキュリティ: 店舗や施設の監視カメラ映像を分析し、特定人物の検知や異常行動監視に活用
  • 営業支援(名刺処理): 名刺画像から文字を抽出して顧客情報 DB に格納し、セールス効率を高める

7. 設定・デプロイ手順(ハンズオン例)

  1. AWS コンソールで「Amazon Rekognition」を検索し、「Try demo」をクリックして簡易動作を確認
  2. 格的に使う場合、S3 に画像をアップロードし、Rekognition API (DetectLabels, DetectFaces など)を呼び出す
  3. 顔認識用には CreateCollection を実行し、IndexFaces で顔を登録
  4. SearchFacesByImage などを使って、類似度スコアとともに人物特定結果を取得
  5. 動画解析の場合は、Start/Stop API でジョブを発行し、SNS または Lambda で完了通知を受け取り結果を取得
  6. 結果のメタデータやラベル情報をデータベースや検索システムへ連携し、アプリケーションの機能を拡張

8. 試験で問われやすいポイント

8.1 ラベル検出と信頼度

  • Label Detection: 画像/動画内のオブジェクトやシーンを検出
  • Confidence スコア: 0 ~ 100%で確信度を示す、しきい値を設定して必要な結果のみ採用

8.2 顔検出と顔コレクション

  • DetectFaces: 画像内の顔領域を検出し、年齢層や表情などの属性を返す
  • Face Collection: 顔の特徴量をインデックス化し、SearchFaces で人物同定が可能

8.3 テキスト検出 (OCR)

  • DetectText: 看板や印刷文字を抽出、位置情報も取得
  • 動画: Video Rekognition で動的に文字を認識

8.4 非同期ビデオ解析

  • StartLabelDetection など: ビデオファイル(S3)を処理し、SNS や Lambda で完了通知を受け取る
  • 長尺動画: 非同期ジョブで大容量コンテンツをスケーラブルに分析

8.5 モデレーション (Content Moderation)

  • 不適切ラベル: アダルト、暴力シーンなどを検出
  • コミュニティガイドライン: SNS や UGC プラットフォームでの利用を支援

8.6 試験で頻出となる具体的な問われ方と答え

  • Q: Amazon Rekognition で顔を識別(同一人物か判定)するには?
  • A: CompareFaces API を使用、または顔コレクションを作り SearchFaces でマッチング。
  • Q: 大量動画のラベル付けをしたい場合は?
  • A: Video Rekognition の非同期ジョブ(StartLabelDetection など)を使い、SNS 通知で完了を受け取る。
  • Q: コンテンツモデレーションで何が検出できる?
  • A: アダルトや暴力表現など、不適切な画像・動画要素を検出し、ラベルとスコアを返す。
  • Q: OCR 的な機能は Rekognition で扱える?
  • A: Yes. DetectText API で画像や動画フレーム内の文字を抽出可能。
  • Q: Rekognition の料金ポイントは?
  • A: 画像ラベル検出は 1,000 イメージ単位、ビデオは 1 分単位で従量課金。顔コレクションの検索や IndexFaces にもコストが発生。