字幕テロップは大切ですが、手作業だと重い仕事です
YouTube動画を作っていると、字幕テロップの重要性を感じる場面が多いです。
音声を出せない環境でも内容が伝わります。聞き取りづらい言葉を補えます。強調したいポイントを視覚的に残せます。視聴者にとっても、字幕がある動画は理解しやすくなります。
一方で、字幕入力はかなり手間がかかります。
動画を聞きながら文字起こしをする。タイミングを合わせる。長すぎる文章を分ける。誤字を直す。見やすい位置や色に調整する。これを毎回やると、1本の動画に1〜2時間かかることもあります。
動画づくりで本当に時間を使いたいのは、企画、構成、伝え方です。字幕入力だけに毎回大きな時間を取られるのは、かなりもったいないです。
Claude Code で字幕作成を「作業」から「仕組み」に変える
今回のテーマは、Claude Code を使って動画字幕を自動でつける方法です。
ポイントは、単に文字起こしツールを使うだけではありません。動画ファイルを渡して、「字幕をつけて」と頼める状態を作ることです。
そのために、次のような仕組みを作ります。
- 動画の音声を文字起こしします。
- 日本語として読みやすい文節で区切ります。
- 1画面に表示する字幕を1つにします。
- 固有名詞や専門用語の誤認識を辞書で補正します。
- 字幕の色、位置、サイズを設定で変えられるようにします。
- 完成した字幕付き動画を別ファイルとして保存します。
ここまでできると、字幕作成は毎回ゼロから手で打つ作業ではなくなります。動画制作の中に組み込める仕組みになります。
必要な3つのコンポーネント
動画では、必要なコンポーネントとして3つが紹介されています。
1. ffmpeg
ffmpeg は、動画や音声を処理するための定番ツールです。
今回の流れでは、字幕を動画に焼き込むために使います。字幕ファイルを作るだけでなく、最終的に視聴者が見られる字幕付き動画として出力するために必要です。
2. whisper.cpp
whisper.cpp は、音声を文字起こしするためのツールです。
日本語音声をテキストに変換する部分を担当します。動画では、日本語モデル ggml-large-v3-turbo を使う流れが紹介されています。
文字起こしの精度は、字幕全体の品質に大きく影響します。ここが安定すると、後工程の修正がかなり楽になります。
3. fugashi と unidic-lite
fugashi と unidic-lite は、日本語を自然な単位に分けるために使います。
字幕では、単に一定文字数で改行すればよいわけではありません。単語の途中で切れると読みづらくなります。「Claude Code」のような語が分断されると、意味も取りづらくなります。
日本語の文節境界を意識して字幕を分けることで、視聴者にとって読みやすいテロップになります。
自動字幕で大切なのは、見た目より先に読みやすさです
字幕の色や位置も大切です。けれど、最初に大事なのは読みやすさです。
1画面に長い文章が何行も出ると、視聴者は読むのに疲れます。話している内容と字幕のタイミングがずれると、見づらくなります。単語の途中で切れると、内容が頭に入りにくくなります。
今回の仕組みでは、次のような点を重視しています。
- 1画面に表示する字幕は1つだけにします。
- 長いセリフは文節境界で複数字幕に分けます。
- 複数行を同時に表示しないようにします。
- 単語の途中で切らないようにします。
- 視聴者が読みやすい白文字と黒縁取りを基本にします。
動画編集で字幕を入れる目的は、飾ることではありません。視聴者が内容を理解しやすくすることです。そこを最初に決めておくと、AIへの依頼もぶれにくくなります。
固有名詞と専門用語は辞書で補正する
自動文字起こしでよく起きるのが、固有名詞や専門用語の誤認識です。
たとえば、サービス名、人名、ツール名、業界用語は、音声認識で間違われることがあります。動画ごとに手で直すこともできますが、毎回同じ語を直しているなら仕組みにした方がよいです。
今回の方法では、誤認識の補正を辞書ファイルで管理する考え方が入っています。
スクリプト内に直接書き込むのではなく、別ファイルで辞書を持つ。そうしておけば、次回以降の動画にも補正ルールを使い回せます。
これはかなり実務的です。字幕作成を続けるほど、辞書が育ちます。自分のチャンネルや仕事でよく使う言葉に強い字幕生成環境になっていきます。
自然言語で見た目を調整できるのが Claude Code らしさです
字幕の見た目を変えたいとき、通常は設定ファイルや字幕スタイルの書き方を調べる必要があります。
けれど Claude Code を使うなら、「字幕を黄色にして」「少し上に出して」「文字を大きくして」のように、日本語で頼めます。
もちろん、最終的には設定ファイルやスクリプトが変更されます。けれど人間側は、専門的な記法を最初から覚えなくても、やりたい見た目を言葉で伝えられます。
これは、動画編集クリエイターにとってかなり大きな価値です。
自分がやりたいことを日本語で伝え、Claude Code が必要なファイルや設定を整える。動画編集の周辺作業にも、この進め方はよく合います。
手作業の置き換えではなく、制作時間の使い方を変える
字幕自動化の価値は、単に時短だけではありません。
字幕入力に使っていた1〜2時間を、企画、構成、サムネイル、タイトル、説明欄、視聴者への伝わり方に回せます。
動画づくりで差が出るのは、ただ作業をこなす部分だけではありません。何を伝えるか、どんな順番で伝えるか、視聴者がどこでつまずくか。そうした部分に時間を使えるようになることが大切です。
AI や Claude Code は、クリエイターの仕事を奪うものではなく、繰り返し作業を減らして、考える時間を増やす道具として使えます。
動画で見られること
動画では、Claude Code を使って動画字幕を自動でつける方法を実演しています。
主な内容は、必要なツールの準備、Before/After の確認、ffmpeg、whisper.cpp、fugashi の役割、誤字補正辞書、自然な改行、字幕スタイル設定です。
また、概要欄には環境構築用プロンプトと、動画ファイルを渡すたびに使う実行用プロンプトも掲載されています。実際に手元の動画で試したい方は、動画と概要欄を見ながら進めるのが分かりやすいです。
まず試すなら
最初は、長い動画ではなく1〜2分の短い動画で試すのがおすすめです。
短い動画なら、文字起こし、字幕分割、焼き込み、見た目調整の流れを確認しやすいです。うまくいったら、よく使う固有名詞を辞書に追加し、次の動画で再利用します。
字幕作成は、毎回の根性作業にしなくてもよいです。
Claude Code と必要なツールを組み合わせれば、動画編集の中でも特に重いテロップ作業を、少しずつ仕組みに変えていけます。