この記事にはアフィリエイトリンクが含まれる場合があります。

業務アプリケーションにLLMを組み込む際、どのAPIを選ぶかは長期的なコストと開発体験を左右する重要な判断です。2026年5月時点では、AnthropicのClaude APIとGoogleのGemini APIが、開発者向けの本命2択として並んでいます。本記事では、料金、コンテキスト、SDK、Tool use、構造化出力、Vertex AI経由まで、API級の観点で徹底比較します。
料金はAnthropic公式PricingとGoogle AI Pricingを参照しています。SDKはAnthropic Python SDK 0.100.0以降と、Googleの最新のgoogle-genaiを前提にしています。
2026年5月時点のClaude APIとGemini APIの位置づけ
Claude APIは、Anthropicが提供する純粋なテキスト+ビジョン+Tool useのAPIです。SDKはanthropic(Python / TypeScript / Java / Go)、APIエンドポイントはAnthropicのクラウド、Amazon Bedrock、Google Vertex AI、Microsoft Foundryから選べます。エージェント実装とMCP連携が強みです。
Gemini APIは、GoogleのGemini 2.5 Pro、Flash、Flash-Liteなどを呼び出すAPIです。SDKはgoogle-genai(旧google-generativeaiの後継)で、Google AI Studio経由の手軽な利用と、Vertex AIによるGoogle Cloud統合の両方が選べます。Google検索によるグラウンディング、Code Execution、長尺のマルチモーダル処理に強みがあります。
モデルラインナップ比較
| 区分 | Claude(Anthropic) | Gemini(Google) |
|---|---|---|
| 最上位 | Claude Opus 4.7 | Gemini 2.5 Pro |
| 中位 | Claude Sonnet 4.6 | Gemini 2.5 Flash |
| 軽量 | Claude Haiku 4.5 | Gemini 2.5 Flash-Lite |
| 最大コンテキスト | 1M tokens(Opus / Sonnet) | 1M tokens(Pro / Flash) |
| マルチモーダル入力 | テキスト / 画像 / PDF | テキスト / 画像 / 音声 / 動画 |
2026年5月時点では、両者ともに「最上位+中位+軽量」の3段構成で、最大1Mトークンのコンテキストに対応しています。Geminiは音声と動画まで入力できる点で、扱える素材の幅が広いのが特徴です。
料金とコンテキストウィンドウ

API料金は入出力トークンの従量課金です。2026年5月時点の代表的なモデルの単価を並べると以下のとおりです(per MTok = 100万トークンあたり)。
| モデル | 入力 | 出力 | コンテキスト |
|---|---|---|---|
| Claude Opus 4.7 | $5 / MTok | $25 / MTok | 1M tokens |
| Claude Sonnet 4.6 | $3 / MTok | $15 / MTok | 1M tokens |
| Claude Haiku 4.5 | $1 / MTok | $5 / MTok | 200k tokens |
| Gemini 2.5 Pro | $1.25 / MTok(〜200k) | $10 / MTok(〜200k) | 1M tokens |
| Gemini 2.5 Flash | $0.30 / MTok前後 | $2.50 / MTok前後 | 1M tokens |
| Gemini 2.5 Flash-Lite | $0.10 / MTok前後 | $0.40 / MTok前後 | 1M tokens |
純粋な単価で見ると、Geminiが全体的に安価です。とくにFlash-LiteとFlashは大量のテキスト処理向けに非常にコスト効率が高く、長いコンテキストを多く投げる用途では月額コストが大きく変わります。一方Claudeは、Prompt Cachingでキャッシュヒット部分が入力単価の0.1倍になるため、同じ長文コンテキストを何度も使うアプリでは実質コストが急減します。
SDKと最小コード(Hello World 並列比較)
同じ「Pythonでフィボナッチ関数を書いて」というプロンプトを両APIに投げる最小コードを並べます。
# Claude API(anthropic 0.100.0+)
from anthropic import Anthropic
client = Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system="あなたはPythonエンジニアです。",
messages=[
{"role": "user", "content": "Pythonでフィボナッチ数列を返す関数を書いてください。"}
],
)
print(message.content[0].text)
# Gemini API(google-genai)
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Pythonでフィボナッチ数列を返す関数を書いてください。",
config={
"system_instruction": "あなたはPythonエンジニアです。",
},
)
print(response.text)
2026年5月時点のGoogle公式SDKはgoogle-genaiです。旧google-generativeaiは移行対象なので、新規開発ではgoogle-genaiを採用します。Anthropic側はanthropicパッケージで、Pythonの場合pip install -U "anthropic>=0.100.0"で導入します。
システム指示と会話履歴の扱い
システム指示の渡し方は両者で似ているが微妙に違います。Claude APIではトップレベルのsystem引数、Gemini APIではconfig.system_instructionです。会話履歴はClaudeがmessages配列(role: user/assistant)、Geminiがcontents配列(role: user/model)です。Geminiでは「assistant」ではなく「model」というロール名になる点に注意してください。
マルチターンチャットを実装する場合、Claudeは履歴をすべてmessagesに積む素直な作りで、Geminiはclient.chats.create()で会話セッションを作ってsend_message()で逐次送る方式が用意されています。長期セッションでは、どちらもキャッシュ機構(Claudeはこのテキストブロックにcache_controlを付与、GeminiはcachesAPI)でコストを抑えられます。
Tool use / Function calling

外部処理を呼び出す仕組みは、Claudeでは「Tool use」、Geminiでは「Function calling」と呼ばれますが、本質はほぼ同じです。モデルが必要に応じて関数呼び出しを提案し、アプリ側が実行結果を渡し直すことで、判断と実行を分離します。
Claudeはtool_useブロックを返し、アプリはtool_resultとして次のリクエストに含めます。GeminiはFunctionCallパートを返し、アプリはFunctionResponseとして渡し直します。並列ツール呼び出しはどちらも対応しています。MCPのような標準ツールプロトコル統合まで含めて作り込む場合は、Claude側のエコシステムがやや進んでいます。
構造化出力(JSON)
JSON出力を確実に得たい場合、Geminiはresponse_mime_type="application/json"とresponse_schemaでスキーマを指定でき、SDK側でPython型からの自動変換にも対応しています。Claudeでは、Tool useで「JSONを返す関数」を1つだけ定義してその関数を強制呼び出しさせるパターンが定番で、結果として確実な構造化出力が得られます。
業務アプリで「型が決まったJSONを必ず返す」という要件があるなら、Geminiは宣言的に書けて簡潔、Claudeはやや手数が要るが柔軟という違いがあります。どちらも実用に耐える品質です。
マルチモーダルとビジョン
画像入力は両者ともに対応しています。PDF入力もどちらもサポートしています。音声・動画入力に対応しているのはGeminiです。例えば、会議の録画から議事録を作る、長尺の動画から要約とタグを抽出する、といった用途はGeminiが向いています。
画像生成は両者とも提供していません。Anthropicは画像生成APIを持たず、Googleは別途Imagen系のAPIを提供しています。生成系を絡めたい場合は、Imagen APIやOpenAIのgpt-image-1と組み合わせる構成になります。
Code Execution / Grounding(Web Search連携)
Geminiは「Code Execution」というサンドボックス機能と、「Grounding with Google Search」というWeb検索連動グラウンディングをモデル側機能として提供しています。データ分析や最新情報を参照したい用途では、SDKの設定数行で組み込めるのが大きな魅力です。
Claudeは公式のWeb検索ツールを提供しており、Tool useから呼び出して使います。Code Executionに相当する処理は、アプリ側で実行環境(Pythonサブプロセスやコンテナ)を用意し、Tool useで結果を渡す方式が一般的です。エージェントの作り方として、Claudeは「アプリ側で自由に組む」、Geminiは「Googleが用意した機能を呼ぶ」というスタンスの違いがあります。
Vertex AI経由 vs Anthropic API直接
ClaudeはAnthropic API直接のほか、Amazon Bedrock、Google Vertex AI、Microsoft Foundry経由でも利用できます。Google CloudをすでにメインクラウドにしているチームならClaudeをVertex AI経由で使うと、請求とIAMが統一できます。GeminiもGoogle AI Studio経由(個人開発・プロトタイプ向け)とVertex AI経由(本番・エンタープライズ向け)で利用可能で、後者ではVPC統合や監査ログ、リージョン制御が使えます。
移行ガイド:Claude→Gemini / Gemini→Claude
既存コードを別APIに移植するときに見直すポイントを整理します。
- システム指示の渡し方:Claudeは
system引数、Geminiはconfig.system_instruction - ロール名:Claudeは
assistant、Geminiはmodel - Tool use:
tool_use/tool_result⇔FunctionCall/FunctionResponse - 構造化出力:Claudeは強制ツール、Geminiは
response_schema - キャッシュ:Claudeは
cache_control、GeminiはcachesAPI - SDK:
anthropic⇔google-genai(旧google-generativeaiからの移行も必要)
プロンプト自体は、システム指示とmessagesの構造が似ているため、コアロジックは大半が再利用できます。差分はSDK呼び出し層に閉じ込めるよう設計しておくと、後で切り替えやすくなります。
用途別の選び方
| 用途 | おすすめ |
|---|---|
| コード生成・大規模リファクタリング | Claude(Opus 4.7 / Sonnet 4.6) |
| 大量バッチ要約・分類(低コスト最優先) | Gemini(Flash / Flash-Lite) |
| 音声・動画を含むマルチモーダル | Gemini 2.5 Pro |
| Web検索連動の最新情報応答 | Gemini(Grounding)またはClaude(Web search tool) |
| エージェント・MCP連携 | Claude |
| Google Cloud前提の本番運用 | Vertex AI(Gemini or Claude on Vertex) |
まとめ
Claude APIとGemini APIは、2026年5月時点で「最上位+中位+軽量」「1Mコンテキスト」「Tool use対応」という基本構造が揃っており、純粋なテキスト生成では用途による相性差で選ぶ段階に入っています。コードとエージェント中心ならClaude、コスト最優先と音声・動画を含むマルチモーダルならGemini、というのが2026年5月時点の最短の指針です。両方触ってから判断するのがもっとも失敗が少ない選び方です。
Claude APIとGemini APIを実践で学ぶ
Claude API・Gemini APIの実務利用とAIアプリ開発を体系的に学べるUdemy講座を公開しています。