Amazon Bedrock の料金
料金設定の概要
Amazon Bedrock は、単一の API を通じて種々の高性能な基盤モデル (FM) を提供するフルマネージドサービスであり、セキュリティ、プライバシー、責任ある AI を使用して生成 AI アプリケーションを構築するために必要な幅広い機能を備えています。
Amazon Bedrock は、生成 AI 導入のあらゆる段階でお客様をサポートするための柔軟な価格オプションを提供しています。お客様は、前払い不要で従量課金制のオンデマンド価格設定と、大量の入力をコスト効率よく処理するバッチモードのいずれかを選択できます。高トラフィックで予測可能なワークロードの場合、プロビジョニングされたスループットを利用することで、専用のモデル容量を割引価格で提供します。これらのオプションは、速度、スケール、モデルアクセスのニーズのバランスを取りながらコストを最適化するのに役立ちます。
料金モデル
オンデマンドとバッチ
オンデマンドモードでは、使用した分のみのお支払いとなり、時間ベースの契約はありません。テキスト生成モデルでは、入力トークンの処理および出力トークンの生成ごとに課金されます。埋め込みモデルでは、入力トークンの処理ごとに課金されます。トークンは数文字で構成されており、ユーザー入力と、結果を生成するためのプロンプトを理解するためにモデルが学習する基本単位です。画像生成モデルでは、生成されたすべての画像について課金されます。 カスタムモデルがオンデマンドのサポートを開始しました。オンデマンド推論とカスタムモデルの詳細をご覧ください。
クロスリージョン推論: オンデマンドモードは、一部のモデルのクロスリージョン推論もサポートしています。これにより、デベロッパーはさまざまな AWS リージョンでコンピューティングを活用してトラフィックバーストをシームレスに管理し、より高いスループット制限と強化された回復力を活用できます。クロスリージョン推論の使用には追加料金は発生せず、料金はリクエストを実行したリージョン (ソースリージョン) に基づいて計算されます。
バッチモードでは、一連のプロンプトを単一の入力ファイルとして提供し、応答を単一の出力ファイルとして受け取ることができるため、大規模な予測を同時に取得できます。レスポンスは処理され、Amazon S3 バケットに保存されるため、後でアクセスできます。Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した基盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論用に提供しています。モデルのリストについては、こちらをご覧ください。
レイテンシー最適化 (パブリックプレビュー)
Amazon Bedrock の基盤モデルのレイテンシー最適化推論は、モデルの応答時間を短縮し、生成 AI アプリケーションの応答性を向上させるのに役立ちます。Amazon Nova Pro、Anthropic の Claude 3.5 Haiku モデル、Meta の Llama 3.1 405B および 70B モデルには、レイテンシー最適化推論を使用できます。Anthropic が検証したように、Amazon Bedrock でレイテンシーを最適化した推論により、Claude 3.5 Haiku は AWS 上で他のどこよりも高速に動作します。さらに、Bedrock でレイテンシー最適化推論を使用した場合、Llama 3.1 405B と 70B は、AWS 上で他の主要なクラウドプロバイダーよりも高速に動作します。 詳細については、こちらをご覧ください。
プロビジョンドスループット
プロビジョンドスループットモードでは、特定のベースモデルまたはカスタムモデルのモデルユニットを購入できます。プロビジョンドスループットモードは、主に、スループットの保証を必要とする大規模で一貫性のある推論ワークロード向けに設計されています。モデルユニットは、1 分あたりに処理される入力トークンまたは出力トークンの最大数によって測定される特定のスループットを提供します。時間単位で課金されるこのプロビジョンドスループット料金設定では、1 か月または 6 か月の契約期間を柔軟に選択できます。
カスタムモデルインポート
カスタムモデルインポートにより、以前に設備投資してカスタマイズしたモデルを Amazon Bedrock 内で活用し、それらのモデルを Bedrock の既存のホストされた基盤モデルと同じフルマネージドで使用できます。サポートされているモデルアーキテクチャのカスタム重みをインポートし、オンデマンドモードを使用してカスタムモデルを提供できます。カスタムモデルの Bedrock へのインポートに料金はかかりません。モデルをインポートすると、コントロールプレーンアクションを実行する必要なく、オンデマンドでそのモデルにアクセスできるようになります。モデルの推論についてのみ課金されます。課金は推論ボリュームを処理するために必要なカスタムモデルのコピー数と、各モデルコピーがアクティブな期間に基づいて、5 分間のウィンドウごとに課金されます。モデルコピーは、推論リクエストを処理する準備が整っているインポートされたモデルの単一インスタンスです。モデルコピーごとの 1 分あたりの料金は、アーキテクチャ、コンテキストの長さ、AWS リージョン、コンピューティングユニットのバージョン (ハードウェア世代) などの要因によって異なり、モデルコピーのサイズによって階��化されます。
Marketplace モデル
Amazon Bedrock Marketplace を使用すると、Bedrock で 100 を超える人気の基盤モデル、新しい基盤モデル、および専門的な基盤モデルを見つけて、テストし、使用できます。Amazon Bedrock Marketplace モデルはエンドポイントにデプロイされ、そこで必要なインスタンス数とインスタンスタイプを選択できるほか、ワークロードの需要を満たすように自動スケーリングポリシーを設定できます。独自のモデルの場合、モデルプロバイダーによって設定されたソフトウェア料金 (時間単位、秒単位の増分での請求、またはリクエスト単位) と、選択したインスタンスに基づくインフラストラクチャ料金が課金されます。これらの料金は、プロバイダーモデルをサブスクライブする前に確認できるほか、AWS Marketplace のモデル一覧からも確認できます。公開モデルの場合、選択したインスタンスに基づくインフラストラクチャ料金のみが課金されます。詳細については、こちらをご覧ください。
カスタマイズと最適化
モデルのカスタマイズ
モデル蒸留
Amazon Bedrock Model Distillation を利用すると、顧客はより大規模で高性能なモデル (「教師モデル」と呼ばれる) から、より小さく、速く、費用対効果の高いモデル (「生徒モデル」と呼ばれる) にナレッジを移すことができます。これにより、特定のユースケースでは、生徒モデルが教師と同じ性能を発揮できるようになります。Amazon Bedrock Model Distillation では、使用した分の料金のみをお支払いいただきます。蒸留は 2 段階のプロセスで、最初に教師モデルから合成データを生成し、次に生徒モデルをトレーニングします。合成データの生成は、選択した教師モデルのオンデマンド料金に基づいて課金されます。生徒モデルのファインチューニングは、モデルのカスタマイズ料金に基づいて課金されます。特定のワークロード要件とコスト目標に応じて、カスタムモデルをオンデマンドデプロイで作成するか、プロビジョンドスループットを購入することで、カスタムモデルに推論を設定できます。オンデマンド推論オプションには、推論中に処理されたトークンの数に基づいて課金されるトークンベースの料金モデルが含まれます。
ファインチューニング/継続的な事前トレーニング
Amazon Bedrock を使用すると、データを使用して FM をカスタマイズし、特定のタスクやビジネスコンテキストに合わせてカスタマイズされた応答を提供できます。ラベル付けされたデータを使用してモデルを微調整することも、ラベル付けされていないデータで継続的な事前トレーニングを行うこともできます。テキスト生成モデルのカスタマイズでは、モデルが処理したトークンの数 (トレーニングデータコーパス内のトークン数 x エポック数) に基づいてモデルトレーニング費用が課金されます。また、モデルのストレージはモデルごとに毎月課金されます。エポックとは、ファインチューニングプロセス中にトレーニングデータセットを 1 回完全に通過することを指します。
特定のワークロード要件とコスト目標に応じて、カスタムモデルをオンデマンドデプロイで作成するか、プロビジョンドスループットを購入することで、カスタムモデルに推論を設定できます。オンデマンド推論オプションには、推論中に処理されたトークンの数に基づいて課金されるトークンベースの料金モデルが含まれます。プロビジョンドスループットを購入した場合、カスタマイズされたモデルでは、1 つのモデルユニットを契約期間なしで、推論に使用できます。この単一モデルユニットがカスタムモデル推論に使用した時間数に対して課金されます。スループットを 1 つのモデルユニットを超えて増やしたい場合は、1 か月または 6 か月の契約期間を購入する必要があります。
プロンプトキャッシュ
Amazon Bedrock でのプロンプトキャッシュを使用すると、複数の API コールで繰り返されるコンテキストをキャッシュして、コストを削減し、応答のレイテンシーを低減できます。プロンプトには、長いマルチターンの会話、多ショットの例、モデルの動作を改善する詳細な手順など、共通のコンテキストまたはプレフィックスが含まれることがよくあります。既存の Amazon Bedrock API を使用して、AWS アカウント固有のキャッシュに 5 分間にわたってキャッシュするプロンプトプレフィックスを指定できます。その間、一致するプレフィックスを持つリクエストでは、キャッシュされたトークンで最大 90% の割引を受けることができるほか、レイテンシーが最大 85% 改善されます。料金とパフォーマンスにおける改善はモデルとプロンプトの長さによって異なりますが、キャッシュは常に AWS アカウントに分離されます。
プロンプトの管理と最適化
Amazon Bedrock Prompt Management は、直感的な UI と一連の API を通じてプロンプトの作成、テスト、実行を迅速化します。プロンプトは、簡単にテストとバージョニングを行い、さまざまなバリエーションを比較して、セキュアなサーバーレスインフラストラクチャで実行することができます。
Amazon Bedrock のプロンプト最適化機能は、より優れたパフォーマンスと、基盤モデルからのより簡潔な応答のためにプロンプトを自動的に書き直します。この機能は、元のバージョンと最適化されたバージョンの対照比較やプロンプトのライフサイクル管理のために Prompt Management と統合されています。プロンプト最適化機能は、Bedrock Playground で使用、または API 経由で直接使用することもできます。
ツール
Guardrails
Amazon Bedrock Guardrails は、大手クラウドプロバイダーが提供する唯一の責任ある AI 機能です。これは、生成 AI アプリケーションの安全性、プライバシー、信頼性の保護手段を構築およびカスタマイズするのに役立ちます。ユーザーによる入力を評価し、ユースケース固有のポリシーに基づいて応答をモデル化することで、ネイティブで利用できるものを超える追加の保護手段を提供します。Guardrails の保護対策は、Amazon Bedrock でホストされているモデル、または ApplyGuardRail API を介した任意のサードパーティーモデル (OpenAI や Google Gemini など) に適用できます。Guardrails は、Amazon Bedrock AgentCore を使用してデプロイされたエージェントを含む、Strands Agents などのエージェントフレームワークと併用することもできます。Guardrails は、RAG コンテンツに対するコンテキストに基づくグラウンディングチェックと、証明可能な真実の回答を提供するための自動推論チェックにより、ハルシネーションをフィルタリングし、事実の正確性を向上させるのに役立ちます。
ナレッジベースとデータオートメーション
Amazon Bedrock のナレッジベースは、フルマネージド検索拡張生成 (RAG) ワークフローです。これにより、お客様は独自のデータソースから取得したコンテキスト情報を組み込むことで、高精度、低レイテンシー、安全なカスタム生成 AI アプリケーションを作成できます。プレビューでは、S3、Confluence、Salesforce、SharePoint などのさまざまなデータソースをサポートしています。ストリーミングデータのドキュメント取り込みも提供しています。Bedrock のナレッジベースは、非構造化データを埋め込みに変換し、ベクトルデータベースに保存して、さまざまなデータストアからの取得を可能にします。また、マネージド取得のために Kendra と統合し、自然言語から SQL への変換を使用して構造化データの取得をサポートします。
Amazon Bedrock のデータオートメーションは、インテリジェントドキュメント処理、動画分析、RAG などのユースケース向けに、非構造化マルチモーダルコンテンツを構造化データ形式に変換します。Bedrock のデータオートメーションは、動画のシーンごとの説明、音声文字起こし、自動ドキュメント分析など、モダリティ固有の事前定義済みのデフォルトを使用して、標準出力コンテンツを生成できます。お客様は、独自のデータスキーマに基づいてブループリントで出力要件を指定することでカスタム出力を追加で作成し、既存のデータベースまたはデータウェアハウスに簡単にロードできます。ナレッジベースとの統合により、Bedrock のデータオートメーションを使用して RAG アプリケーション用にコンテンツを解析することもできます。これにより、画像とテキストの両方に埋め込まれた情報を含めることで、結果の精度と関連性を高めることができます。
エージェント
Amazon Bedrock のエージェントを使用すると、アプリケーション内で自律エージェントを構築および設定できます。これらのエージェントは、会社のデータソースに安全に接続するとともに、ユーザーリクエストを適切な情報で補足して、正確な応答を生成します。わずか数ステップで単一およびマルチエージェントのアプリケーションを作成できるため、生成 AI アプリケーションの構築にかかる時間を短縮できます。これらのエージェントは、コードを動的に生成して実行するコード解釈と Return of control をサポートしているため、アクションスキーマを定義して、エージェントがアクションを呼び出すたびにコントロールを取り戻すことができます。さらに、Amazon Bedrock のエージェントは、複数のやり取りにまたがって記憶を維持できるため、よりシームレスでパーソナライズされたユーザーエクスペリエンスを実現できます。
フロー
Amazon Bedrock Flows は、生成 AI アプリケーション向けの Bedrock のワークフローオーサリングおよび実行特徴量です。直感的なビジュアルビルダーと一連の API により、ユーザー定義の生成 AI ワークフローの作成、テスト、デプロイを加速します。これにより、最新の基盤モデル、プロンプト、エージェント、ナレッジベース、ガードレール、AWS サービス (Amazon Lex、AWS Lambda、Amazon S3 など) をビジネスロジックとシームレスにリンクして、生成 AI ワークフローを構築できます。独自のインフラストラクチャを構築しなくても、ビジュアルインターフェイスや API を通じてワークフローを簡単にテストおよびバージョン管理し、安全なサーバーレス環境で実行できます。
評価
モデル評価: Amazon Bedrock のモデル評価では、お支払いいただくのは使用した分の料金であり、プロンプトやレスポンスの数に対する最小使用量の確約は不要です。自動評価 (プログラムによる) の場合は、評価で選択したモデルから推論した分のみお支払いいただきます。自動生成されたアルゴリズムスコアは追加料金なしで提供されます。自動 (モデル/LLM-as-a-judge) 評価でお支払いいただくのは、選択したジェネレーターモデルと評価者モデルからの推論についての料金のみです。LLM-as-a-judge モデル評価ジョブでは、組み込みのメトリクスは、各メトリクスに固有のシステム判断プロンプトテンプレートと、トークンの使用量の一部として課金される利用可能な判断モデルを使用します。判断プロンプトは、透明性を高めるために公開されている AWS ドキュメントで入手できます。自分の作業チームを連れてくる人間ベースの評価では、評価におけるモデル推論の料金と、完了したヒューマンタスクごとに 0.21 USD の料金がかかります。ヒューマンタスクとは、人間の作業者が単一のプロンプトとそれに関連する推論応答の評価をヒューマン評価ユーザーインターフェイスに送信したこととして定義されます。評価ジョブに含まれるモデルが 1 つでも 2 つでも、また、含める評価メトリクスや評価方法の数にかかわらず、タスクあたりの料金は同じです。ヒューマンタスクの料金は AWS 請求書の Amazon SageMaker セクションに表示され、すべての AWS リージョンで同じです。人件費はお客様負担となりますので、別途人件費はかかりません。評価ジョブ中に Bedrock モデルを呼び出す代わりに「独自の推論応答を持ち込む」特徴量を使用している場合は、評価者のモデル推論 (LLM-as-a-judge ジョブ)、または完了したヒューマンタスクあたり 0.21 USD (人間ベースの評価ジョブ) についてのみ課金されます。AWS が管理する評価では、AWS エキスパート評価チームと連携しながら、プライベート契約でお客様の評価ニーズに合わせて料金をカスタマイズします。
RAG 評価: Amazon Bedrock の RAG 評価では、お支払いいただくのは使用した分の料金であり、プロンプトやレスポンスの数に対する最小使用量の確約は不要です。Amazon Bedrock ナレッジベースを評価する場合、お支払いいただくのは、選択したジェネレーターモデルと評価者モデル (評価ジョブでは LLM-as-a-judge を使用) からの推論についての料金と、Amazon Bedrock のナレッジベースの料金に従って評価ジョブでナレッジベースを使用したことから発生した料金のみです。「独自の推論応答を持ち込む」特徴量を使用している場合は、評価者のモデル推論についてのみ課金されます。RAG 評価ジョブでは、組み込みのメトリクスは、各メトリクスに固有のシステム判断プロンプトテンプレートと、トークンの使用量の一部として課金される利用可能な判断モデルを使用します。判断プロンプトは、高い透明性を実現するために公開されている AWS ドキュメントでご覧いただけます。メトリクスによっては、入力プロンプトに加えて、ナレッジベース/RAG システムから取得したコンテキストや Ground Truth の回答に基づいて判断のモデル推論を行う必要があるため、各メトリクスに関連するコストに影響が生じます。各メトリクスの詳細については、評価に関する AWS の公開ドキュメントをご覧ください。
モデルの料金の詳細
料金は、モダリティ、プロバイダー、モデルによって異なります。詳細な料金を確認するには、モデルプロバイダーを選択してください。
Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した��盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論用に提供しています。モデルのリストについては、こちらをご覧ください。
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
DeepSeek
-
Luma AI
-
Meta
-
Mistral AI
-
OpenAI
-
TwelveLabs
-
Stability AI
-
Writer
-
Qwen
-
カスタムモデルインポート
-
AI21 Labs
-
AI21 Labs
オンデマンド料金
-
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
その他の Amazon
-
Amazon Nova
-
Amazon Nova
モデルを理解するための料金
クリエイティブコンテンツ生成モデルの料金
音声理解および生成モデルの料金
Speech to Speech 基盤モデルのオンデマンド料金
注: *テキストトークンの入力および出力の料金は、音声からテキストへの文字起こし、タスクの完了や知識グラウンディングのためのツール呼び出し、セッションへの会話履歴の追加などの特定のユースケースに適用されます。
カスタム Nova モデルのオンデマンド推論の料金は、基本の Nova 推論と同じです。
-
Amazon Titan
-
Amazon Titan
-
その他の Amazon
-
-
-
Anthropic
-
Anthropic
オンデマンド料金とバッチ料金
レイテンシー最適化推論
プロビジョンドスループットの料金
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
Anthropic モデル モデルごとの1時間あたりの価格と
コミットメントなし1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
44.00 USD 39.60 USD
22.00 USD
Claude 2.0/2.1
70.00 USD 63.00 USD
35.00 USD
親リージョン: アジアパシフィック (東京)
Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
53.00 USD
29.00 USD
Claude 2.0/2.1
86.00 USD
48.00 USD
AWS リージョン: 欧州 (フランクフルト)
Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Claude Instant
49.00 USD
27.00 USD
Claude 2.0/2.1
79.00 USD
44.00 USD
モデルユニットの詳細については、AWS アカウントチームにお問い合わせください。
-
Cohere
-
Cohere
オンデマンド料金
Cohere モデル 1,000 クエリあたりの料金** Rerank 3.5 2.00 USD ** 1 つのクエリに最大 100 個のドキュメントチャンクを含めることができるクエリの数に対して課金されます。クエリに 100 個を超えるドキュメントチャンクが含まれている場合は、複数のクエリとしてカウントされます。たとえば、リクエストに 350 のドキュメントが含まれている場合、4 つのクエリとして扱われます。各ドキュメントには最大 500 個のトークン (クエリとドキュメントの合計トークンを含む) しか含めることができず、トークンの長さが 512 トークンを超える場合は複数のドキュメントに分割されることに注意してください。 モデルのカスタマイズ (微調整) の料金:
*トレーニングされたトークンの総数 = トレーニングデータコーパス内のトークン数 x エポック数
プロビジョンドスループットの料金
Cohere モデル モデルごとの 1 時間あたりの価格
コミットメントなしで1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金
Cohere Command
49.50 USD 39.60 USD
23.77 USD
Cohere Command - Light 8.56 USD 6.85 USD
4.11 USD Embed 3 English 7.12 USD 6.76 USD
6.41 USD Embed 3 Multilingual 7.12 USD 6.76 USD
6.41 USD モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。
-
DeepSeek
-
DeepSeek
オンデマンド料金
-
Luma AI
-
オンデマンド料金
-
Meta
-
Meta
Llama 4
オンデマンド料金とバッチ料金
Llama 3.3
オンデマンド料金とバッチ料金
Llama 3.2
オンデマンド料金とバッチ料金
モデルのカスタマイズ (ファインチューニング) の料金
プロビジョンドスループットの料金
Llama 3.1
オンデマンド料金とバッチ料金
モデルのカスタマイズ (微調整) の料金
プロビジョンドスループットの料金
Llama 3
オンデマンド料金
Llama 2
オンデマンド料��
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
Meta のモデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格 Llama 2 Chat (13B)
0.00075 USD
0.001 USD
Llama 2 Chat (70B) 0.00195 USD
0.00256 USD モデルのカスタマイズ (微調整) の料金
メタモデル 1000 個のトークンをトレーニングする場合の料金* 各カスタムモデルの 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金) Llama 2 Pretrained (13B)
0.00149 USD
1.95 USD
23.50 USD
Llama 2 Pretrained (70B) 0.00799 USD
1.95 USD 23.50 USD *カスタムモデルストレージ = 1.95 USD
プロビジョンドスループットの料金
メタモデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金 Llama 2 Pretrained と Chat (13B)
21.18 USD
13.08 USD
Llama 2 Pretrained (70B) 21.18 USD
13.08 USD *Llama 2 Pretrained モデルは、カスタマイズ後にプロビジョニングされたスループットでのみ利用可能です。
モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。
-
Mistral AI
-
Mistral AI
-
OpenAI
-
OpenAI
-
TwelveLabs
-
TwelveLabs
オンデマンド料金
-
Stability AI
-
Stability AI
オンデマンド料金
Stability AI が提供する、前世代の画像モデルは、ステップ数と画像解像度に応じて、画像ごとに料金設定されています。
リージョン: オレゴン、バージニア北部、オハイオ
モデル 各モデルの世代あたりの料金 Stable Image 背景を削除 0.07 USD Stable Image オブジェクトを消去 0.07 USD Stable Image 制御構造 0.07 USD Stable Image スケッチを制御 0.07 USD Stable Image スタイルガイド 0.07 USD Stable Image ���索と置換 0.07 USD Stable Image インペイント 0.07 USD Stable Image 検索と色変更 0.07 USD Stable Image スタイル転送 0.08 USD -
Writer
-
Writer
オンデマンド料金
Writer のモデル 1,000 入力トークンあたりの料金 1,000 出力トークンあたりの料金 Palmyra X4 0.0025 USD 0.010 USD Palmyra X5 0.0006 USD 0.006 USD -
Qwen
-
Qwen
-
カスタムモデルインポート
-
カスタムモデルインポート
-
Llama
-
マルチモーダル Llama
-
Mistral
-
Mixtral
-
Flan
-
Qwen
-
Llama
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。
*5 分単位で請求
-
マルチモーダル Llama
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。
*5 分間のウィンドウで課金
-
Mistral
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。
*5 分間のウィンドウで課金
-
Mixtral
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニット��必要です。
*5 分間のウィンドウで課金
-
Flan
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。
*5 分間のウィンドウで課金
オンデマンド推論の料金:
最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: デフォルトの最大数はインポートされたモデルごとにアカウントあたり 3 個のモデルコピーですが、これは Service Quotas を通じて引き上げることができます。
-
Qwen
-
リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.05718 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD リージョン: 欧州 (フランクフルト)
カスタムモデルユニットのバージョン v1.0 カスタムモデルユニットあたりの料金/分* 0.07144 USD カスタムモデルユニットあたりのストレージコスト/月 1.95 USD 注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。
*5 分間のウィンドウで課金
オンデマンド推論の料金:
最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: デフォルトの最大数はインポートされたモデルごとにアカウントあたり 3 個のモデルコピーですが、これは Service Quotas を通じて引き上げることができます。
-
ツールと最適化の料金の詳細
-
フロー
-
ナレッジベース
-
ガードレールを設定
-
モデル評価
-
データオートメーション
-
インテリジェントプロンプトルーティング
-
プロンプト最適化
-
フロー
-
Amazon Bedrock Flows
アプリケーションを実行するために必要となるノード遷移の数に基づいて請求されます。Bedrock Flows は、ワークフロー内のノードが実行されるたびにノード遷移をカウントします。フロー全体のノード遷移の合計数に対して料金が発生します。
すべての料金は毎日計測され、2025 年 2 月 1 日から毎月請求されます。
1,000 ノード遷移あたりの料金 0.035 USD 追加料金
���プリケーションワークフローの実行で AWS の他のサービスを利用した場合やデータを転送した場合は、追加料金が発生する可能性があります。例えば、ワークフローで Amazon Bedrock Guardrail ポリシーを呼び出す場合、ポリシーによって処理されたテキストユニット数に対して請求されます。
-
ナレッジベース
-
構造化データの取得 (SQL 生成)
構造化データの取得は、SQL クエリを生成するリクエストごとに課金されます。生成された SQL クエリは、構造化データストアからデータを取得するために使用されます。
Rerank モデル
Rerank モデルは検索拡張生成 (RAG) アプリケーションにおける応答の関連性と精度を向上させるように設計されています。クエリごとに課金されます。
**1 つのクエリに最大 100 個のドキュメントチャンクを含めることができるクエリの数に対して課金されます。クエリに 100 個を超えるドキュメントチャンクが含まれている場合は、複数のクエリとしてカウントされます。たとえば、リクエストに 350 のドキュメントが含まれている場合、4 つのクエリとして扱われます。各ドキュメントには最大 512 個のトークン (クエリとドキュメントの合計トークンを含む) しか含めることができず、トークンの長さが 512 トークンを超える場合は複数のドキュメントに分割されることに注意してください。クエリは検索ユニットと同等です。
-
ガードレールを設定
-
Amazon Bedrock のガードレール
ガードレールのポリシー*
料金
コンテンツフィルター (テキストコンテンツ)
1,000 テキストユニットあたり 0.15 USD
コンテンツフィルター (画像コンテンツ)
処理された画像あたり 0.00075 USD
拒否されたトピック
1,000 テキストユニットあたり 0.15 USD
機密情報フィルター
1,000 テキストユニットあたり 0.10 USD
機密情報フィルター (正規表現)
無料
ワードフィルター
無料
コンテキストグラウンディングチェック
1,000 テキストユニットあたり 0.10 USD
自動推論チェック
1,000 テキストユニットあたり 0.17 USD/自動推論ポリシー
オンデマンド料金
* 各ガードレールポリシーはオプションであり、アプリケーションの要件に基づいて有効にできます。料金は、ガードレールで使用されているポリシーの種類に基づいて発生します。例えば、ガードレールにコンテンツフィルターと拒否トピックが設定されている場合、これらの 2 つのポリシーについては料金が発生しますが、機密情報フィルターに関連して発生する料金はありません。
注: テキスト単位には最大 1,000 文字まで含めることができます。テキスト入力が 1,000 文字を超える場合、それぞれ 1,000 文字以下を含む複数のテキスト単位として処理されます。例えば、テキスト入力に 5,600 文字が含まれている場合、6 テキスト単位について課金されます。コンテキストグラウンディングチェックでは、参照ソースとクエリを使用して、モデルの回答がソースを根拠としており、クエリに関連しているかどうかを判断します。課金されるテキストユニットの合計数は、ソース、クエリ、およびモデル応答のすべての文字を組み合わせて計算されます。
-
モデル評価
-
モデル評価
モデル評価では、選択したモデルからの推論について課金されます。自動生成されたアルゴリズムスコアは追加料金なしで提供されます。独自のワークストリームを持ち込むヒューマンベースの評価では、評価におけるモデル推論の料金と、完了したヒューマンタスクごとに 0.21 USD の料金がかかります。
モデル
1,000 入力トークンあたりの料金
1,000 出力トークンあたりの料金
ヒューマンタスクあたりの料金
評価対象として選択されたモデル
選択したモデルに基づく
選択したモデルに基づく
0.21 USD
-
データオートメーション
-
データオートメーション
Amazon Bedrock ナレッジベースでは、マルチモーダルデータに対してより適切で正確な回答を提供するために、Bedrock データ自動化統合を提供しています。ナレッジベースを設定する場合、解析方法として Bedrock データオートメーションを選択して、図、グラフ、図などの画像やドキュメントから意味のある洞察を分析および抽出できます。処理中、Bedrock データオートメーションは、取り込まれたドキュメントや画像から意味のある情報を抽出し、それを以降のナレッジベースのステップでチャンク化、埋め込み、保存に使用します。ナレッジベースと統合された Bedrock データオートメーションは、標準化された出力を提供し、それについて課金します。
-
インテリジェントプロンプトルーティング
-
プライスポイント 料金ディメンション 料金プラン インテリジェントプロンプトルーティング 1,000 件のリクエストあたり 1 USD オンデマンド インテリジェントプロンプトルーティング
インテリジェントプロンプトルーティングを使用すると、質とコストを最適化するのに役立つよう、同じモデルファミリーの基盤モデル (FM) を組み合わせて使用できます。例えば、Anthropic の Claude モデルファミリーを使用すると、Amazon Bedrock はプロンプトの複雑さに応じて、Claude 3.5 Sonnet と Claude 3 Haiku の間でリクエストをインテリジェントにルーティングできます。同様に、Amazon Bedrock は Meta Llama 3.3 70B と 3.18B、Nova Pro と Nova Lite の間でリクエストをルーティングできます。プロンプトルーターは、応答の質とコストを最適化するのをサポートしながら、各リクエストについてどのモデルが最適なパフォーマンスを提供するかを予測します。これは、カスタマーサービスアシスタントなどのアプリケーションで特に役立ちます。このようなアプリケーションでは、単純なクエリはより小さく、より高速で、よりコスト効率の高いモデルで処理でき、複雑なクエリはより高性能なモデルにルーティングされます。インテリジェントプロンプトルーティングを使用すると、精度について妥協することなく、コストを最大 30% 削減できます。
-
プロンプト最適化
-
Amazon Bedrock のためのプロンプト最適化
入力プロンプトと最適化されたプロンプトのトークン数に基づいて課金されます。
すべての料金は、2025 年 4 月 23 日から毎月請求されます。
1,000 トークンあたりの料金 0.030 USD
料金の例
-
AI21 Labs
アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: AI21 の Jurrasic-2 Mid モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。
発生した合計コスト = 10K トークン/1,000 * 0.0125 USD + 2K トークン/1,000 * 0.0125 USD = 0.15 USD
-
Amazon
オンデマンド料金
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Amazon Titan Text Lite モデルに対して、入力テキストの 1K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生した 1 時間あたりの総コストは = 2 K トークン/1000 * 0.0003 USD + 1 K トークン/1000 * 0.0004 USD = 0.001 USD です。
アプリケーションデベロッパーが Amazon Bedrock に対して次の API コールを行います。Amazon Titan Image Generator の基本モデルに、標準品質の 1,024 x 1,024 サイズのイメージを 1000 個生成するようにリクエストします。
発生するコストの合計: 1000 画像 x 0.01 USD/画像 = 10 USD
カスタマイズ (微調整と継続的な事前トレーニング) の価格設定
アプリケーション開発者は、1000 組の画像とテキストを使用して Amazon Titan Image Generator モデルをカスタマイズします。トレーニング後、開発者はカスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は次のとおりです。微調整トレーニング (0.005 USD* 500* 64)。ここで、0.005 USD は表示される画像あたりの価格、500 USD はステップ数、64 はバッチサイズ + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD
プロビジョンドスループットの料金
アプリケーション開発者は、テキスト要約のユースケースとして、Titan Text Express の 2 つのモデルユニットを 1 か月契約で購入します。
発生する月間コストの合計: 2 モデルユニット x 18.40 USD/時間 x 24 時間 x 31 日間 = 27,379.20 USD
アプリケーションデベロッパーは、Amazon Titan Image Generator の基本モデルのモデルユニットを 1 か月契約で 1 ユニット購入します。
発生した合計コスト = 1 モデルユニット* 16.20 USD * 24 時間 * 31 日間 = 12,052.80 USD
-
Amazon Bedrock のガードレール
例 1: カスタマーサポートチャットボット
アプリケーション開発者は、カスタマーサポートチャットボットを作成し、コンテンツフィルターを使用して有害なコンテンツや拒否されたトピックをブロックし、望ましくないクエリや応答をフィルタリングします。
チャットボットは 1 時間あたり 1000 件のユーザークエリを処理します。各ユーザークエリの平均入力長は 200 文字で、1500 文字の FM 応答を受け取ります。
200 文字の各ユーザークエリは 1 つのテキスト単位に対応します。
1,500 文字の FM 応答は、それぞれ 2 つのテキスト単位に対応します。
1 時間あたりに処理されるテキスト単位 = (1 + 2) * 1000 クエリ = 3000 テキスト単位
コンテンツフィルタと拒否トピックの 1 時間あたりに発生する合計コスト = 3000 * (USD 0.15 + USD 0.15)/1000 = USD 0.90
例 2: コールセンターのトランスクリプトの要約
アプリケーション開発者は、ユーザーとサポートエージェント間のチャット記録を要約するアプリケーションを作成します。機密情報フィルターを使用して、生成された10,000件の会話の要約に含まれる個人を特定できる情報(PII)を編集します。
生成された各要約は、4 つのテキスト単位に相当する平均3,500文字です。
10,000 件の会話を要約するために発生した合計コスト = 10,000 * 4 * (0.1 USD/1,000) = 4 USD例 3: 医療プロトコル検証エンジン
あるヘルスケアテクノロジー企業では、自社の臨床意思決定支援システムに自動推論チェックを導入して、治療法の提案を医療ガイドラインに照らし合わせて検証しています。
このシステムは、1 か月あたり 5,000 件の症例を処理します。各ケースには以下が含まれます。
- 患者データの概要: 500 文字 (1 テキスト単位)
- 診断評価: 2,000 文字 (2 テキスト単位)
- 推奨治療法: 4,500 文字 (5 テキスト単位)
1 か月あたりに処理されるテキスト単位 = (1 + 2 + 5) 5,000 ケース = 40,000 テキスト単位
自動推論チェックで 1 か月あたりに発生した合計コスト = 40,000 (0.17 USD)/1,000 = 6.80 USD -
Amazon Bedrock ナレッジベース
料金例 1 (Amazon Rerank 1.0 モデルを使用したリランク)
特定の月に、Amazon Rerank 1.0 モデルを使用して Rerank API に対して 200 万回のリクエストを行います。100 万件のリクエストに含まれるドキュメント数はそれぞれ 100 件未満であるため、1 回のリクエストに対して請求されます。 残りの 100 万件のリクエストには 120~150 件のドキュメントが含まれているため、1 回のリクエストにつき 2 件分の請求が発生します。
1 回のリクエストの料金 = 0.001 USD
合計料金 = 1,000,000* 0.001 USD + 1,000,000*2*0.001 USD = 3000 USD料金例 2: (構造化データの取得)
アプリケーション開発者が、Amazon Redshift に保存されている構造化データをクエリするサポートチャットボットを作成します。開発者は Bedrock ナレッジベースを作成し、Amazon Redshift に接続します。チャットボットは 1 時間あたり 10000 件のユーザークエリを処理します。ユーザークエリから SQL を生成する場合、ユーザークエリごとに GenerateQuery API あたり 0.002 USD の費用がかかります。
1 時間あたり SQL を生成するために発生する合計コストは、0.002 USD*10000 = 20 USD です。
その月に発生した合計コスト = 20*24*30 USD = 1,440 USD -
Anthropic
オンデマンド料金
アプリケーション開発者は、米国西部 (オレゴン) リージョンの Amazon Bedrock に対して次の API コールを行います: Anthropic の Claude モデルに対して、入力テキストの 11K トークンの入力を 4K トークンの出力にまとめるリクエスト。
発生するコストの合計: 11,000 トークン/1000 x 0.008 USD + 4,000 トークン/1000 x 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD
プロビジョンドスループットの料金
あるアプリケーション開発者が米国西部 (オレゴン) リージョンで Anthropic Claude Instant のモデルユニットを1つ購入しました。
1 か月あたりの発生した合計コスト = 1 モデルユニット * 39.60 USD * 24 時間 * 31 日間 = 29,462.40 USD
-
Cohere
オンデマンド料金
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生するコストの合計: 6,000 トークン/1000 * 0.0015 USD + 2,000 トークン/1000 *0.002 USD = 0.013 USD
アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command-Light モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。
発生するコストの合計 = 6K トークン/1000 * 0.0003 USD + 2K トークン/1000 * 0.0006 USD = 0.003 USD
アプリケーション開発者は、Amazon Bedrock に次の API 呼び出しを行います: Cohere の Embed English モデルまたは多言語モデルに、10K トークンの入力に対して埋め込みを生成するようリクエストします。
発生するコストの合計 = 10K トークン/1000 * 0.0001 USD = 0.001 USD
モデルのカスタマイズ (微調整)
アプリケーション開発者は、1000 トークンのデータを使用して Cohere コマンドモデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は、微調整トレーニング (0.004 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (49.50 USD) = 55.45 USD
カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 39.60 USD
プロビジョンドスループットの料金
アプリケーションデベロッパーは、テキスト要約のユースケースとして、Cohere Command の 1 モデルユニットを 1 か月の契約で購入します。
1 か月あたりの発生した合計コスト = 1 モデルユニット * 39.60 USD * 24 時間 * 31 日間 = 29,462.40 USD
-
カスタムモデルインポート
料金の例: アプリケーションデベロッパーは、サイズが 8B パラメータ、シーケンス長が 128K である、カスタマイズされた Llama 3.1 タイプのモデルを us-east-1 リージョンにインポートし、1 か月後にそのモデルを削除します。これには 2 つのカスタムモデルユニットが必要です。つまり、2 カスタムモデルユニットが必要であるため、1 分あたりの料金は 0.1570 USD となります。その月の 2 カスタムモデルユニットのモデルストレージコストは 3.90 USD となります。
モデルのインポートには料金はかかりません。最初の呼び出しが成功したのは午前 8 時 3 分で、その時点で計測が開始されます。5 分間の計測ウィンドウは、午前 8 時 3 分~午前 8 時 7 分、午前 8 時 7 分~午前 8 時 11 分などです。ある 5 分間に少なくとも 1 回の呼び出しがあった場合、そのウィンドウはアクティブであるものとみなされ、課金されます。午前 8 時 3 分に呼び出しが実行され、午前 8 時 7 分を過ぎた後に呼び出しがない場合、メータリングは午前 8 時 7 分に停止します。この場合、請求額は次のように計算されます: 0.1570 USD * 5 分間 * 1 つの 5 分間のウィンドウ = 0.785 USD。
-
データオートメーション
料金の例 1
BDA カスタム出力を使用して 1,000 ページのドキュメントを処理するとします。1,000 ページすべてが 15 個のフィールドがあるブループリント 1 を使用して処理されます。フィールド数が 30 以下のブループリントの 1 ページあたりの料金は 0.040 USD です。合計コストは 40 USD となります。
処理する総ページ = 1,000
フィールド数が 30 未満のブループリントの 1 ページあたりの料金 = 0.040 USD
合計料金 = 1,000 * 0.040 USD = 40 USD料金の例 2
BDA カスタムアウトプットを使用して 2 つのドキュメントを処理するとします。ドキュメント 1 は 40 ページあり、20 個のフィールドがあるブループリント 1 を使用して処理されます。ドキュメント 2 は 10 ページあり、40 個のフィールドがあるブループリント 2 を使用して処理されます。ブループリント 1 の 1 ページあたりの料金は 0.040 USD です。これは、ブループリント 1 に含まれるフィールド数が 30 個以下であるためです。ブループリント 2 の 1 ページあたりの料金は 0.045 USD です。ブループリント 1 を使用したドキュメント 1 の処理コストは 1.60 USD です。ブループリント 2 を使用したドキュメント 2 の処理コストは 0.45 USD です。両方のドキュメントを処理するための合計コストは 2.05 USD になります。
処理する総ページ = 50
フィールド数が 30 未満のブループリント 1 の 1 ページあたりの料金 = 0.040 USD
40 個のフィールドがあるブループリント 2 の 1 ページあたりの料金 = 0.040 USD + (30 を超える追加フィールドの数* 1 フィールドあたり 0.0005 USD)
30 を超える追加フィールドの数 = 40 - 30 = 10
フィールドが 40 個あるブループリント 2 の 1 ページあたりの料金 = 0.040 USD + (1 フィールドあたり 10 *0.0005 USD) = 0.045 USD
ブループリント 1 を使用したドキュメント 1 の料金 = 40 ページ x 1 ページあたり 0.040 USD = 1.6 USD
ブループリント 2 を使用したドキュメント 2 の料金 = 10 ページ x 1 ページあたり 0.045 USD = 0.45 USD
合計料金 = ドキュメント 1 の料金 + ドキュメント 2 の料金 = 1.6 USD + 0.45 USD = 2.05 USD
料金の例 3:
Bedrock データオートメーションをパーサーとして使用するように Bedrock ナレッジベースを設定し、1,000 ページのドキュメントを取り込むとします。コスト構造はナレッジベースの解析オプションによって異なることに注意してください。BDA はページ単位の料金を使用しますが、基盤モデルパーサーは入力トークンと出力トークンに基づいて課金します。コンテキストとして、1,000 ページ (30% が表、30% が図) を処理する場合、通常 2,900 個の入力トークンと 750 個の出力トークンが必要です。トークンの消費量はコンテンツの種類によって異なるため、より正確な見積もりを得るには、お客様独自のデータを使用してテストすることをお勧めします。Bedrock ナレッジベースと Bedrock データオートメーションの統合では、1 ページあたりの料金が 0.010 USD である標準出力が使用されることに注意してください。合計コストは 10 USD となります。処理する総ページ = 1,000
標準出力の 1 ページあたりの料金 = USD 0.010
合計料金 = 1,000 × 0.010 USD = 10 USD料金の例 4:
BDA 標準出力を使用して 60 分の動画を処理するとします。ビデオ標準出力の 1 分あたりの料金は 0.050 USD です。合計コストは 3.00 USD となります。
合計処理時間 = 60
ビデオ標準出力の 1 分あたりの料金 = 0.050 USD
合計料金 = 60 × 0.050 USD = 3.00 USD
料金の例 5:
BDA カスタム出力を使用して 2,000 枚の画像を処理するとします。最初の 1,000 枚の画像は、10 個のフィールドがあるブループリント 1 を使用して処理されます。最後の 1,000 ページは、40 個のフィールドがあるブループリント 2 を使用して処理されます。ブループリント 1 の画像あたりの料金は 0.005 USD です。これは、ブループリント 1 に含まれるフィールドが 30 個以下であるためです。ブループリント 2 のイメージあたりの料金は 0.01 USD です。ブループリント 1 を使用した最初の 1,000 枚の画像の処理コストは 5.00 USD です。ブループリント 2 を使用した 2 番目の 1,000 枚の画像の処理コストは 10.00 USD です。2,000 枚の画像すべてを処理する場合の合計コストは 15.00 USD です。
最初の 1000 枚の画像のコスト = 1,000 枚の画像 x 1 画像あたり 0.005 USD = 5.00 USD
2 つ目の 1,000 枚の画像のコスト = 1,000 枚の画像* (0.005 USD + (30 を超える追加フィールドの数* 1 フィールドあたり 0.0005 USD))
= 1,000* (0.005 USD + ((40-30) *0.0005 USD))
= 1,000* (0.005 USD + (10*0.0005 USD)) = 10.00USD
合計コスト = 5.00 USD + 10.00 USD = 15.00 USD
料金の例 6:
Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。15,000 分すべての音声処理にかかる合計コストは 90 USD です。
合計処理時間 = 15,000 分
合計料金 = 15,000 分 × 0.006 USD = 90 USD -
DeepSeek
オンデマンド料金
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:
1 時間あたりの発生した合計コスト = 2K トークン/1,000 * 0.00135 USD + 1K トークン/1,000 * 0.0054 USD = 0.0081 USD
-
フロー
例: ニュースの要約
アプリケーションデベロッパーが、トレーダー向けのニュースの要約を自動化するフローを作成するとします。このフローには、S3 ロケーションを取得する Input ノードと、S3 内の 10 の主要通信社からの記事を含む 10 個のファイルを取得する S3 取得ノードが含まれます (2 ノード遷移)。次に、イテレータノードを使用してモデルを呼び出し、プロンプトノードで各ファイル (+ 10 ファイル x 2 ノード遷移) を要約します。次に、コレクターノードを使用してすべての結果を収集し、S3 ストレージノードを使用して結果を S3 に書き込み、出力ノードで完了します (+ 3 ノード遷移)。このフローは毎平日 30 分おきに実行されます。フロー実行ごとのノード遷移の数: 2+1+10*2 + 3 = 25 ノード遷移/フロー実行
1 か月あたりのフロー実行回数: 24 時間 * 2 * 5 日 * 4 週間 = 960 フロー実行/月。
毎月の請求額合計: 25 * 960 * 0.035 USD/1000 = 0.84 USD
追加料金
この請求には、検索ノードとストレージノードでの Amazon S3 の使用量や、プロンプトノードでの Amazon Bedrock 基盤モデルの使用など、ワークフローの実行で利用される AWS サービスの追加料金も含まれます。
-
Meta
オンデマンド料金
アプリケーションデベロッパーは、Amazon Bedrock に対して次の API コールを行います: Meta の Llama 2 Chat (13 B) モデルに対して、入力テキストの 2K トークンの入力を 500 トークンの出力にまとめるリクエスト。
発生するコストの合計 = 2K トークン / 1,000 * 0.00075 USD + 500 トークン / 1,000 * 0.001 USD = 0.002 USD
モデルのカスタマイズ (微調整)
アプリケーションデベロッパーは、1000 トークンのデータを使用して Llama 2 Pretrained (70B) モデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。
微調整にかかる月額費用は、微調整トレーニング (0.00799 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (23.50 USD) = 33.44 USD
カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 21.18 USD
プロビジョンドスループットの料金
アプリケーションデベロッパーは、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。
1 か月あたりの発生した合計コスト = 1 モデルユニット * 21.18 USD * 24 時間 * 31 日間 = 15,757.92 USD
-
Mistral AI
オンデマンド料金
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral 7B モデルに対するリクエスト。
発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00015 USD + 1K トークン/1,000 * 0.0002 USD = 0.0005 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mixtral 8x7B モデルに対するリクエスト。
発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00045 USD + 1K トークン/1,000 * 0.0007 USD = 0.0016 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral Large モデルに対するリクエスト。
1 時間あたりの発生した合計コスト = 2K トークン/1,000 * 0.008 USD + 1K トークン/1,000 * 0.024 USD = 0.04 USD
-
モデル評価
モデル評価の例 1:
オンデマンド料金
あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。データセットには50のプロンプトが含まれており、開発者は各プロンプト-レスポンスセットの評価に1人のワーカーを必要とする(評価ジョブの作成時に「プロンプトごとのワーカー」パラメータとして設定可能)。
この評価ジョブには 50 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク)。50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。
このモデル評価ジョブには次の料金が発生します:項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計 クロード・インスタント推論 5,000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD 0.04 USD クロード 2.1 推論 5,000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD 0.52 USD ヒューマンタスク 50 0.21 USD 10.50 USD 10.50 USD 合計 11.06 USD モデル評価例 2
オンデマンド料金
あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。
データセットには 50 個のプロンプトが含まれており、開発者は各プロンプト/応答セットを評価するために 2 人のワーカーを必要とします (評価ジョブの作成で「プロンプトあたりのワーカー数」パラメーターとして設定可能)。この評価ジョブには 100 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク:2 人の作業者 x 50 個のプロンプト応答セット = 100 個のヒューマンタスク)。
50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。
このモデル評価ジョブには次の料金が発生します:
項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計 クロード・インスタント推論 5,000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD 0.04 USD クロード 2.1 推論 5,000 0.008 USD 0.0400 USD 20,000 0.024 USD 0.48 USD 0.52 USD ヒューマンタスク 100 0.21 USD 21.00 USD 21.00 USD 合計 21.56 USD -
プロンプト最適化
例: ニュースの要約
アプリケーションデベロッパーは、Claude 3.5 を使用してトレーダーのためにニュースを要約するプロンプトを作成します。元のプロンプトは 429 トークンです。最適化されたプロンプトは 511 トークンで、FM がより簡潔な回答を生成できるようにより具体的な指示と例が含まれています。このデベロッパーは、511 トークンの最適化されたプロンプトをプロンプトオプティマイザーの入力として使用し、Claude 3.7 と Nova Pro 向けに 582 トークンと 579 トークンの 2 つの新しいバリアントを作成します。プロンプト最適化の入力トークンと出力トークンの合計数: 429 + 511 + 511 + 582 + 511 + 579 = 3,123
1 か月あたりの合計請求額: 3,123 / 1,000 * 0.03 USD = 0.09 USD
-
Stability AI
オンデマンド料金
アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: SDXL モデルに対して、ステップサイズ 70 (高画質) の 512 x 512 の画像を生成するリクエスト。
発生するコストの合計: 1 画像 x 0.036 USD/画像 = 0.036 USD
アプリケーション開発者は Amazon Bedrock に対して次の API コールを行います: SDXL 1.0 モデルに対して、ステップサイズ 70 (高画質) の 1024 x 1024 の画像を生成するリクエスト。
発生するコストの合計: 1 画像 x 0.08 USD/画像 = 0.08 USD
プロビジョンドスループットの料金
アプリケーション開発者は、SDXL1.0の 1 つのモデルユニットを 1 か月契約で購入します。
発生した合計コスト = 1 * 49.86 USD * 24 時間 * 31 日間 = 37,095.84 USD
-
TwelveLabs
オンデマンド料金
アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Pegasus 1.2 モデルに対して、10 秒の長さの動画に伴うことを説明するリクエスト (それにより 2,000 トークンの出力が提供される)。
発生した合計コスト = 10 秒 * 0.00049 USD + 2K トークン/1000 * 0.0075 USD = 0.0199 USD
アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Marengo Embed 2.7 モデルに対して、合計 100 分の長さの動画コンテンツがある 10 個の動画のリポジトリ全体で、テキストリクエストを介して特定のビジュアルを検索するリクエスト。この検索では、10 件の一致する結果が返されます。
発生した合計コスト = 100 分 (6,000 秒) * 0.00070 USD + 1 リクエスト * 0.00007 USD = 4.20007 USD
-
Writer
アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Writer の Palmyra X5 モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。
発生した合計コスト = 10K トークン/1,000 * 0.003 USD + 2K トークン/1,000 * 0.015 USD = 0.06 USD