いしくろひであき事務所キャリアコンサルタント × IT導入支援
ブログ一覧へ戻る

2026年5月29日

もう情報漏洩を気にしない。無料のローカルLLM × Codexで作る「安心安全なAI」環境

会議音声や社内情報を外部AIサービスに送ることに不安がある方向けに、ローカルLLM、Whisper、Codexを使って、音声を外に出さず議事録化するローカルAI環境の考え方を整理します。

会議音声をAIに渡す時の不安

AI議事録サービスは便利です。会議が終わると、文字起こし、要約、決定事項、ToDoまで整理してくれるサービスも増えています。

一方で、仕事の会議音声には、外に出しにくい情報が含まれることがあります。

顧客名、社内相談、未公開の事業内容、契約前の提案内容、人事や採用に関する話、経営判断に関わる会話などです。

こうした音声を外部AIサービスへ送ってよいのか。会社のルール上、どこまで許されるのか。個人情報や機密情報の扱いとして問題がないのか。

この不安があると、AIは便利だと分かっていても、実務では使いにくくなります。

今回の動画では、会議音声を外部AIサービスに送らずに、ローカルLLMとWhisperを使って議事録化する仕組みを作っています。

ローカルAI環境とは何か

ローカルAI環境とは、自分のPCや社内ネットワーク内のPCを使って、AI処理を手元で動かす環境です。

クラウドAIを否定するものではありません。ChatGPTやClaudeのようなクラウドAIは、汎用的な相談、文章作成、調査、アイデア出しに強いです。

ただ、音声や資料の中に外へ出しにくい情報が含まれる場合は、処理する場所を分ける考え方が必要になります。

動画では、次のような構成を扱っています。

  • iPhoneで会議音声を録音する
  • MacでWhisperを使って文字起こしする
  • LAN内のWindows PCでOllamaのローカルLLMを動かす
  • 文字起こしをローカルLLMに渡して議事録の下書きを作る
  • transcript.txtsummary.md を会議フォルダに保存する

ここで大事なのは、「インターネットを一切使わない」と言い切らないことです。

iCloud Driveなどのファイル同期を使う場合もありますし、モデルやツールの取得時にはインターネットを使うことがあります。正確には、会議音声や議事録化の本文を外部AIサービスへ送らず、手元の環境で処理する構成です。

Codexは環境づくりの伴走役になります

ローカルAI環境は、考え方としては分かりやすくても、実際に作ろうとすると少し複雑です。

音声ファイルの保存場所、文字起こしツール、ローカルLLMの起動、要約用プロンプト、出力フォルダ、エラー時の扱いなど、決めることが多いからです。

ここでCodexのようなAIエージェントが役に立ちます。

たとえば、次のような作業を一緒に進められます。

  • フォルダ構成を整理する
  • 処理手順をスクリプト化する
  • Whisperを呼び出す流れを作る
  • Ollamaに要約を依頼する処理を書く
  • 出力ファイル名や保存先を整える
  • エラー時に止める条件を決める
  • 実行結果を見て修正する

AIに丸投げするというより、作りたい業務フローを言葉で説明しながら、Codexに実装や調整を手伝ってもらうイメージです。

非エンジニアにとっても、「こういう業務を安全に回したい」という目的から始められる点が大きいです。

今回の議事録化フロー

動画で扱っている中心は、会議音声から議事録を作る流れです。

まず、iPhoneのボイスメモなどで会議音声を録音します。録音した音声をMeetingNotesフォルダに置きます。

次に、Macでスクリプトを実行します。スクリプトの中では、音声変換、Whisperによる文字起こし、ローカルLLMによる要約が順番に進みます。

処理が終わると、会議ごとのフォルダに次のようなファイルが保存されます。

  • 元の音声ファイル
  • 文字起こし全文の transcript.txt
  • 議事録下書きの summary.md

この形にしておくと、あとから全文を確認できます。AIの要約だけに頼らず、必要に応じて文字起こし全文へ戻れる点が重要です。

議事録をゼロから書くのではなく、AIが作った下書きを人間が確認して整える。この使い方が現実的です。

WhisperとローカルLLMの役割

今回の構成では、WhisperとローカルLLMの役割を分けています。

Whisperは、音声を文字に変える部分を担当します。会議音声を文字起こしし、AIが扱いやすいテキストにします。

ローカルLLMは、その文字起こしを読み、議題、要点、決定事項、ToDoのような形に整理します。

この分担にすると、処理の流れが分かりやすくなります。

  • 音声を文字にする
  • 文字を整理する
  • 議事録として保存する
  • 人が確認する

会議音声を直接AIに投げて終わりにするのではなく、途中の文字起こしと要約をファイルとして残すことで、確認しやすい運用になります。

ローカルLLMは設定調整が重要です

ローカルLLMは、動けば終わりではありません。

動画では、最初の要約が薄くなった場面も扱っています。原因の一つは、モデルの性能だけではなく、文脈長の設定でした。

長い文字起こしを渡しても、設定が小さいと会議全体を読めません。途中までしか読めない状態では、議事録も薄くなります。

一方で、文脈長を大きくしすぎると、GPUのVRAMからあふれて処理が遅くなる場合があります。

今回の環境では、WindowsゲーミングノートPCのGPUを使いながら、num_ctx のような設定を調整しています。8GB程度のVRAMでは、用途に応じた落としどころを探す必要があります。

ローカルAI環境は、クラウドAIのように全部お任せではありません。自分のPC、GPU、会議の長さ、求める要約の深さに合わせて育てていくものです。

Windows PCをAIサーバとして使う考え方

今回の構成では、2〜3年前のWindowsゲーミングノートPCを、LAN内のAIサーバのように使っています。

Macで作業しながら、重いLLM処理はWindows側のGPUに任せます。家や事務所の中にGPU搭載PCがあるなら、それをローカルAI用の処理役として再活用できる可能性があります。

この考え方は、実務ではかなり大事です。

ローカルLLMというと、今使っているPC1台ですべて処理するイメージを持ちがちです。しかし、同じネットワーク内のGPU PCを使えば、普段使いのMacやノートPCからローカルAI環境を呼び出す形も考えられます。

ただし、ネットワークに出す時は公開範囲に注意が必要です。

  • LAN内だけで使う
  • インターネットに公開しない
  • ルーターのポート開放をしない
  • 認証やアクセス制限を確認する
  • 業務データの保存場所を決める

便利にするほど、どこからアクセスできるかの確認が重要になります。

画像生成もローカルで試せる

動画では、同じWindows機でComfyUIを使った画像生成も試しています。

文章の要約はOllama、画像生成はComfyUIという形です。

ローカル画像生成は、ブログのアイキャッチ、YouTubeサムネイルの背景案、資料用の雰囲気画像などに使える可能性があります。

一方で、日本語の文字を画像の中に正確に入れる用途では、まだ注意が必要です。仕事で使うなら、AIには背景や素材のたたき台を作ってもらい、文字はCanvaやPowerPointなどで後から載せる方が現実的です。

ローカルAI環境は、文章だけではありません。音声、文章、画像、将来的にはRAG検索まで含めて、仕事の素材づくりに広げられます。

安心安全と言い切る前に確認したいこと

今回の動画タイトルでは「安心安全なAI環境」という表現を使っています。

ただし、実務で使う場合は、ローカルだから完全に安全と考えない方がよいです。

確認すべき点があります。

  • 録音してよい会議か
  • 参加者への説明や同意が必要か
  • 音声ファイルの保存場所は適切か
  • iCloud Driveなどの同期先を使ってよいか
  • PCにログイン制限があるか
  • LAN内サービスが外部公開されていないか
  • 生成された議事録を誰が確認するか
  • 誤認識や要約漏れがあった時にどう直すか

ローカルAI環境は、外部AIサービスに音声を送らない選択肢を作れます。

けれど、情報管理の責任がなくなるわけではありません。安心して使うためには、技術だけでなく、運用ルールも一緒に整える必要があります。

動画で見られること

動画では、ローカルLLM、Whisper、Codexを使って、会議音声を議事録化するローカルAI環境を作る流れを紹介しています。

主な内容は、会議音声を外部AIサービスに送らない考え方、iPhone録音からMacでの文字起こし、Windows側Ollamaによる要約、transcript.txtsummary.md の保存、文脈長やVRAMの調整、ComfyUIによるローカル画像生成です。

技術検証だけでなく、ローカルAIを仕事の流れにどう組み込むかを見る内容になっています。

AI議事録は使いたいけれど、会議音声を外に出すことに不安がある方は、動画とあわせて確認していただくとイメージしやすいです。

まず試すなら

最初から本番会議で試す必要はありません。

まずは、架空の会議音声や自分だけのテスト音声で試すのがおすすめです。

試す順番は、次のように小さくできます。

  • サンプル音声を用意する
  • Whisperで文字起こしする
  • 文字起こし全文を保存する
  • ローカルLLMで短い要約を作る
  • 議事録形式に整える
  • 人が確認して直す

この一連の流れが動くと、ローカルLLMは単なるチャットではなく、仕事の工程に組み込める道具として見えてきます。

次の段階では、過去の議事録や資料を検索するRAG、ローカル音声入力、ローカル画像生成などへ広げられます。

まずは、「どの音声を外に出したくないのか」「どこまで自動化したいのか」「最後に誰が確認するのか」を決めることから始めるのがよいと思います。

動画は YouTube の埋め込みプレーヤーで再生されます。