会議音声をAIに渡す時の不安
AI議事録サービスは便利です。会議が終わると、文字起こし、要約、決定事項、ToDoまで整理してくれるサービスも増えています。
一方で、仕事の会議音声には、外に出しにくい情報が含まれることがあります。
顧客名、社内相談、未公開の事業内容、契約前の提案内容、人事や採用に関する話、経営判断に関わる会話などです。
こうした音声を外部AIサービスへ送ってよいのか。会社のルール上、どこまで許されるのか。個人情報や機密情報の扱いとして問題がないのか。
この不安があると、AIは便利だと分かっていても、実務では使いにくくなります。
今回の動画では、会議音声を外部AIサービスに送らずに、ローカルLLMとWhisperを使って議事録化する仕組みを作っています。
ローカルAI環境とは何か
ローカルAI環境とは、自分のPCや社内ネットワーク内のPCを使って、AI処理を手元で動かす環境です。
クラウドAIを否定するものではありません。ChatGPTやClaudeのようなクラウドAIは、汎用的な相談、文章作成、調査、アイデア出しに強いです。
ただ、音声や資料の中に外へ出しにくい情報が含まれる場合は、処理する場所を分ける考え方が必要になります。
動画では、次のような構成を扱っています。
- iPhoneで会議音声を録音する
- MacでWhisperを使って文字起こしする
- LAN内のWindows PCでOllamaのローカルLLMを動かす
- 文字起こしをローカルLLMに渡して議事録の下書きを作る
transcript.txtとsummary.mdを会議フォルダに保存する
ここで大事なのは、「インターネットを一切使わない」と言い切らないことです。
iCloud Driveなどのファイル同期を使う場合もありますし、モデルやツールの取得時にはインターネットを使うことがあります。正確には、会議音声や議事録化の本文を外部AIサービスへ送らず、手元の環境で処理する構成です。
Codexは環境づくりの伴走役になります
ローカルAI環境は、考え方としては分かりやすくても、実際に作ろうとすると少し複雑です。
音声ファイルの保存場所、文字起こしツール、ローカルLLMの起動、要約用プロンプト、出力フォルダ、エラー時の扱いなど、決めることが多いからです。
ここでCodexのようなAIエージェントが役に立ちます。
たとえば、次のような作業を一緒に進められます。
- フォルダ構成を整理する
- 処理手順をスクリプト化する
- Whisperを呼び出す流れを作る
- Ollamaに要約を依頼する処理を書く
- 出力ファイル名や保存先を整える
- エラー時に止める条件を決める
- 実行結果を見て修正する
AIに丸投げするというより、作りたい業務フローを言葉で説明しながら、Codexに実装や調整を手伝ってもらうイメージです。
非エンジニアにとっても、「こういう業務を安全に回したい」という目的から始められる点が大きいです。
今回の議事録化フロー
動画で扱っている中心は、会議音声から議事録を作る流れです。
まず、iPhoneのボイスメモなどで会議音声を録音します。録音した音声をMeetingNotesフォルダに置きます。
次に、Macでスクリプトを実行します。スクリプトの中では、音声変換、Whisperによる文字起こし、ローカルLLMによる要約が順番に進みます。
処理が終わると、会議ごとのフォルダに次のようなファイルが保存されます。
- 元の音声ファイル
- 文字起こし全文の
transcript.txt - 議事録下書きの
summary.md
この形にしておくと、あとから全文を確認できます。AIの要約だけに頼らず、必要に応じて文字起こし全文へ戻れる点が重要です。
議事録をゼロから書くのではなく、AIが作った下書きを人間が確認して整える。この使い方が現実的です。
WhisperとローカルLLMの役割
今回の構成では、WhisperとローカルLLMの役割を分けています。
Whisperは、音声を文字に変える部分を担当します。会議音声を文字起こしし、AIが扱いやすいテキストにします。
ローカルLLMは、その文字起こしを読み、議題、要点、決定事項、ToDoのような形に整理します。
この分担にすると、処理の流れが分かりやすくなります。
- 音声を文字にする
- 文字を整理する
- 議事録として保存する
- 人が確認する
会議音声を直接AIに投げて終わりにするのではなく、途中の文字起こしと要約をファイルとして残すことで、確認しやすい運用になります。
ローカルLLMは設定調整が重要です
ローカルLLMは、動けば終わりではありません。
動画では、最初の要約が薄くなった場面も扱っています。原因の一つは、モデルの性能だけではなく、文脈長の設定でした。
長い文字起こしを渡しても、設定が小さいと会議全体を読めません。途中までしか読めない状態では、議事録も薄くなります。
一方で、文脈長を大きくしすぎると、GPUのVRAMからあふれて処理が遅くなる場合があります。
今回の環境では、WindowsゲーミングノートPCのGPUを使いながら、num_ctx のような設定を調整しています。8GB程度のVRAMでは、用途に応じた落としどころを探す必要があります。
ローカルAI環境は、クラウドAIのように全部お任せではありません。自分のPC、GPU、会議の長さ、求める要約の深さに合わせて育てていくものです。
Windows PCをAIサーバとして使う考え方
今回の構成では、2〜3年前のWindowsゲーミングノートPCを、LAN内のAIサーバのように使っています。
Macで作業しながら、重いLLM処理はWindows側のGPUに任せます。家や事務所の中にGPU搭載PCがあるなら、それをローカルAI用の処理役として再活用できる可能性があります。
この考え方は、実務ではかなり大事です。
ローカルLLMというと、今使っているPC1台ですべて処理するイメージを持ちがちです。しかし、同じネットワーク内のGPU PCを使えば、普段使いのMacやノートPCからローカルAI環境を呼び出す形も考えられます。
ただし、ネットワークに出す時は公開範囲に注意が必要です。
- LAN内だけで使う
- インターネットに公開しない
- ルーターのポート開放をしない
- 認証やアクセス制限を確認する
- 業務データの保存場所を決める
便利にするほど、どこからアクセスできるかの確認が重要になります。
画像生成もローカルで試せる
動画では、同じWindows機でComfyUIを使った画像生成も試しています。
文章の要約はOllama、画像生成はComfyUIという形です。
ローカル画像生成は、ブログのアイキャッチ、YouTubeサムネイルの背景案、資料用の雰囲気画像などに使える可能性があります。
一方で、日本語の文字を画像の中に正確に入れる用途では、まだ注意が必要です。仕事で使うなら、AIには背景や素材のたたき台を作ってもらい、文字はCanvaやPowerPointなどで後から載せる方が現実的です。
ローカルAI環境は、文章だけではありません。音声、文章、画像、将来的にはRAG検索まで含めて、仕事の素材づくりに広げられます。
安心安全と言い切る前に確認したいこと
今回の動画タイトルでは「安心安全なAI環境」という表現を使っています。
ただし、実務で使う場合は、ローカルだから完全に安全と考えない方がよいです。
確認すべき点があります。
- 録音してよい会議か
- 参加者への説明や同意が必要か
- 音声ファイルの保存場所は適切か
- iCloud Driveなどの同期先を使ってよいか
- PCにログイン制限があるか
- LAN内サービスが外部公開されていないか
- 生成された議事録を誰が確認するか
- 誤認識や要約漏れがあった時にどう直すか
ローカルAI環境は、外部AIサービスに音声を送らない選択肢を作れます。
けれど、情報管理の責任がなくなるわけではありません。安心して使うためには、技術だけでなく、運用ルールも一緒に整える必要があります。
動画で見られること
動画では、ローカルLLM、Whisper、Codexを使って、会議音声を議事録化するローカルAI環境を作る流れを紹介しています。
主な内容は、会議音声を外部AIサービスに送らない考え方、iPhone録音からMacでの文字起こし、Windows側Ollamaによる要約、transcript.txt と summary.md の保存、文脈長やVRAMの調整、ComfyUIによるローカル画像生成です。
技術検証だけでなく、ローカルAIを仕事の流れにどう組み込むかを見る内容になっています。
AI議事録は使いたいけれど、会議音声を外に出すことに不安がある方は、動画とあわせて確認していただくとイメージしやすいです。
まず試すなら
最初から本番会議で試す必要はありません。
まずは、架空の会議音声や自分だけのテスト音声で試すのがおすすめです。
試す順番は、次のように小さくできます。
- サンプル音声を用意する
- Whisperで文字起こしする
- 文字起こし全文を保存する
- ローカルLLMで短い要約を作る
- 議事録形式に整える
- 人が確認して直す
この一連の流れが動くと、ローカルLLMは単なるチャットではなく、仕事の工程に組み込める道具として見えてきます。
次の段階では、過去の議事録や資料を検索するRAG、ローカル音声入力、ローカル画像生成などへ広げられます。
まずは、「どの音声を外に出したくないのか」「どこまで自動化したいのか」「最後に誰が確認するのか」を決めることから始めるのがよいと思います。