, ,

【完全自動化】AIで議事録を作成する方法:音声文字起こしから要約・アクション抽出まで

約5分で読めます

この記事にはアフィリエイトリンクが含まれる場合があります。

【完全自動化】AIで議事録を作成する方法:音声文字起こしから要約・アクション抽出まで

meeting notes pipeline

会議後の議事録作成は、多くのビジネスパーソンにとって時間のかかる作業です。しかし、AIを活用すれば、音声の文字起こしから要約、アクションアイテムの抽出まで、ほぼ自動化することが可能です。本記事では、WhisperとClaude APIを組み合わせた議事録自動作成の仕組みと実装手順を解説します。

自動議事録の仕組み

AI議事録自動作成のパイプラインは、大きく3つのステップで構成されます。

  1. 音声文字起こし(STT):会議の録音データをテキストに変換します。
  2. 要約・構造化:文字起こしテキストをLLMで要約し、議題ごとに整理します。
  3. アクション抽出:決定事項やタスクを自動的に抽出し、担当者と期限を明確にします。

この一連の処理を自動化することで、1時間の会議の議事録を数分で作成できるようになります。

使用ツール:Whisper + Claude

本記事で推奨するツール構成は以下のとおりです。

音声文字起こし:OpenAI Whisper

Whisperは、OpenAIが公開した高精度な音声認識モデルです。日本語を含む多言語に対応しており、ローカル実行とAPI利用の両方が可能です。API版は1分あたり約0.6セントと低コストで、実用的な精度を提供します。

要約・構造化:Claude API

文字起こしテキストの要約にはClaude APIが適しています。長文コンテキストの処理に優れており、最大20万トークンの入力に対応しているため、数時間分の会議内容でも一度に処理できます。

実装手順

Pythonを使った実装手順を説明します。

手順1:環境構築

必要なライブラリをインストールします。openaiパッケージ(Whisper API用)とanthropicパッケージ(Claude API用)の2つが必要です。それぞれのAPIキーを環境変数に設定しておきます。

手順2:音声ファイルの文字起こし

Whisper APIに音声ファイルを送信し、テキストを取得します。対応フォーマットはmp3、mp4、wav、m4aなどです。25MBを超えるファイルは分割して送信する必要があります。

import openai

client = openai.OpenAI()
with open("meeting.mp3", "rb") as f:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        language="ja"
    )

手順3:Claude APIで要約・アクション抽出

文字起こしテキストをClaude APIに送信し、構造化された議事録を生成します。プロンプトで出力形式を指定することで、議題・決定事項・アクションアイテムを整理した形式で出力できます。

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": f"""以下の会議の文字起こしから議事録を作成してください。
        出力形式:
        - 会議概要(3行以内)
        - 議題ごとの要約
        - 決定事項一覧
        - アクションアイテム(担当者・期限付き)

        文字起こし:
        {transcript.text}"""
    }]
)

手順4:自動化スクリプトの完成

上記の処理を1つのスクリプトにまとめ、会議録音ファイルを指定するだけで議事録が生成される仕組みを構築します。cronやタスクスケジューラと連携すれば、定期会議の議事録作成を完全自動化することも可能です。

活用のコツ

精度を向上させるためのポイントをいくつか紹介します。

  • 録音品質を確保する:マイクの品質が文字起こし精度に直結します。指向性マイクの使用や静かな環境での録音を心がけましょう。
  • 話者分離を活用する:複数の参加者がいる会議では、話者分離(Speaker Diarization)を追加すると、誰が何を発言したかを明確にできます。
  • プロンプトを改良する:会議の種類(定例、ブレスト、意思決定など)に応じてプロンプトを調整すると、より適切な議事録が生成されます。
  • 用語集を準備する:社内固有の専門用語やプロジェクト名をWhisperのpromptパラメータに渡すと、認識精度が向上します。

まとめ

WhisperとClaude APIを組み合わせることで、議事録作成を大幅に効率化できます。音声認識の精度は年々向上しており、実用的なレベルに達しています。まずは社内の定例会議から試してみることをおすすめします。

Claude APIやPythonによるAI自動化の詳しい実装方法は、私がUdemyで公開しているClaude API完全マスターやPython×AI自動化完全マスターで体系的に学べます。全13コースを公開中ですので、ぜひご確認ください。

📚 この記事の内容をさらに深く学ぶ

Claude Code 完全マスター【2026年最新】
全97講義|Claude Codeを使ったAIエージェント開発・実務自動化を体系的に学べるコース。

関連記事