YouTubeの字幕エディタが9月末で廃止され、それまで活動されて来られた方の中には、活動が停止してガッカリされている方もいるのではないでしょうか?
また、中には推しのYouTuberを応援するために、これから字幕を付けようと思われていた方もいるかもしれません。
YouTubeの字幕エディタが使えなくなっても、今は色んなプログラムやサイト、アプリがある時代に感謝しています。🙏
そこで、字幕制作に役立つプログラムや海外サイトを2回に分けてご紹介します。
- Vrew (AI自動翻訳プログラム)
- Amara (海外の動画字幕用サイト)
字幕制作にご興味のある方は、是非ご活用ください。
Vrewで字幕・テロップを付けてみよう!
YouTubeエディタが使えなくなるということで、急遽『Vrew』の動画編集プログラムを使ってみました。
動画音声からAI(人工知能)自動翻訳されたテキストを編集し、テロップや字幕起こしが可能なプログラムです。
ゼロから字幕起こしするより、便利に感じる方も多いのではないでしょうか。
私は普段、ゼロ派ですが試しに使ってみました。
Vrewで動画字幕を起こすために必要なもの
まず、Vrewを活用するには、AIに翻訳してもらう為の音声付き動画ファイル、mp4が必要です。
YouTube動画はURLなので、mp4に変換するソフトが必要になります。
そこでまずは、知人に教えて貰って普段私も使っている、ファイル変換ソフト『Offilibety』をご紹介します。
動画のURLからmp4へ変換【Offiliberty】
Offilibertyは、YouTube動画のURLから、mp4やmp3に変換してくれる変換ソフトです。
手順を簡単に説明すると
① 動画のURLを黒い枠に入力
② その下にある黒枠OFFを押せば、変換スタート
③ 変換が終わると、下記の黄色い枠が表示されるので、クリックしてファイルに名前
を付けて保存します。
音声ファイル(mp3)が欲しい場合は、この黄色の枠の下に【音声ファイルの抽出】が表示されるので、そこをクリックすると音声ファイルに変換してくれます。
変換後のファイル保存は、③と同じです。
字幕を起こす動画ファイルが出来たらいよいよ『Vrew』の出番です。
Vrewの始め方
まず、Vrewのサイトに行って、プログラムソフトをダウンロードします。
(上の画像をクリックするとVrewのサイトへ飛びます)
ダウンロード後、『Vrew』を開くと見本が現れます。
新規の動画を字幕起こしする場合は、下の画像でいうと①の【新しい動画で始める】を選んでmp4ファイルをアップロードすると、自動翻訳が開始されます。
前回の字幕編集の続きを行う場合は、②の【プロジェクトを開く】を選んで、前回セーブしたプロジェクトを呼び出します。
新規の場合は、自動翻訳のために時間がちょっと必要ですが、20分ぐらいの動画が数十秒で翻訳されます。
Vrewエディタの操作方法
翻訳が終わったら、編集に取り掛かります。
まず、動画をスタートさせてみましょう。
動画のスタート・停止のショートカットキーは、【スペース】キーでできます。
親指1本でスタート・停止が可能なので、ノンストレスで作業が可能な点が気に入ってます。
テキスト部の構成を見ると、同じようなテキストが2段で表示されています。
上【A】:AIによる自動翻訳
➡ テキストの長さを編集・削除
下【B】:動画に表示される字幕テキスト ➡ 字幕の表示テキストの編集
※ 以下、AIの自動翻訳を【A】・字幕表示を【B】で表示しています。
字幕の表示テキストの編集は、そんなに難しくありません。
テキストの長さを調整する場合は、テキストを合体させたり、分割・削除を行って編集します。その合体・分割・削除もショートカットキーを使えばめちゃめちゃ簡単に行うことができます。
- 合体:【backspace】 or 【Delete】
- 分割:【Enter】
テキストの合体
テキストの長さ調整する際は、【A】のテキストにカーソルを持って行きます。
合体場面によって、使うキーが異なりますが
- 前のテキストに合体する場合 :【backspace】
- 後ろのテキストに合体する場合 :【Delete】
です。
テキストの分割・削除
1つのテキストを2つに分割させる場合、【A】のテキストの分割箇所にカーソルを持って行き、【Enter】を押せば分割されます。
テキスト枠ごと削除する場合は、枠の右端(タイム表示)部分を左クリックすると
枠に色が付くので、この状態で【Delete】を押せばサクッと削除されます。
テキスト上でクリックすると、テキストの編集が有効になります。
Vrewの編集ポイントは、無音区間・小音区間がと呼ばれる区間にあるように感じました。
編集の際に、音ズレが発生しやすいからです。
無音区間・小音区間とは?
【A】のテキストを見ると、[・・][?][・・〇〇秒]などの表記があります。
これは
などです。
要は、AIが
- 聞こえませんでした
- 何言ってんのか、よく分からないんだけど...
の部分です。
文章や言葉の意味が理解できていないAI
人間の脳のように、AIが言葉の意味や文章を柔軟に理解できるようになるには、まだ時間がかかりそうな感じがします。
...というか、人間同士でさえ言葉の意味をよく理解できない場合が多いのに、AIが理解しだしたら最早、人間の存在意義ってあるのかな?🙄...と考えてしまいます。
...それは置いといて、動画をスタートさせると、【A】のテキスト部分にオレンジのマーカーが音声に合わせて移動表示されます。
その【A】のテキスト部分をダブルクリックすると、音の波形が現れます。字幕起こしをする上で、この音の波形は結構便利な存在です。
なぜなら、文章の括り、まとまりが分かるからです。
ただ、AIには文章や言葉の意味といった概念がないので、本当だったら音の波形は1つの文章に合わせて1つにまとまって表示されているとスッキリわかりやすいのですが...
Vrewの場合、音の波形をAIは、プツプツ途切れた状態で翻訳しているので、テキストのまとまりが一見するとおかしい場合があります。
どういうことかというと
- 1つの文章が複数のテキストに分割されていたり
- 2つの文章が1つのテキスト枠に収まっていたり
- 繋がっている言葉の途中でテキストが分割されていたり
...と、ハチャメチャな部分があるからです。
そこが今後の改善点だと思っています。
そうやって考えると、YouTubeの字幕エディタは、自動翻訳こそお笑いネタで楽しめたものの、音声波形にテキストが結構うまく噛み合ってたんですよね。改めて、いい仕事してたなぁ、って感動します。
例えば、下の図で説明すると、テキストが8~10、3つのテキストに分割されていますが、実際には2つの文章が入っています。
聞き取った音声の内容は、こんな感じでした。
ゴールデンブーツ賞を3人のアフリカ出身の選手に与えられましたよっていう話で、おめでたい話です。でもその3人はガボン出身で...
ひとつの文章は実際には、8・9・10の途中まで繋がっていて、10の後半部は次の文章に移っています。
要するに、文章として認識はされていません。だから「3人」の部分でテキスト分割されたり、「与えられましたよっていう話で...」も途中で分割されています。
8の波形図を見てみると、こんな感じでした。
実際の音声は
ゴールデンブーツ賞は
なのですが、[]の波形図の音は、「ゴールデンブ」なので、変なところで分割され、次の波形の音は「ッ賞が」となり、「ブーツ」のワードが認識できず、AIが精一杯頑張って知ってるワードを引っ張り出した結果、「武将が」になっています。(笑)
そこが、Vrewを使う際に気になった点でした。
後、テキスト中の無音区間・小音区間を削ると、動画の再生時間に影響を与えることを、実際に削除してみてわかりました。
落ち着いて考えれば、そりゃそうだよね!...って事でした。😅
じゃあ、Vrewは使えないのか?というと、そんなことはなく、テキスト編集は凄く簡単にできるので、最終的な音のズレなどは、Adobeのpremiere Proなどを使って行えば、問題は解決されます。
2ステップが必要になります。
私も実際に『Vrew+Premiere Pro』の方法を試してみました。ザァーッとVrewで字幕を起こして、Premiere Proで音の調整をしてみました。
ただ私のPCの場合、動画ファイルを扱うには、キャパオーバーだったようで😅、仕方なく...断念しました。
PCの調子がその後、最悪だったので、ファイルの整理をして、バックアップを取ってゴソゴソやりながら動画を全部削除したら、PCも落ち着きました。ホッ♥
...という事で、動画編集用のPCを持っている方だったら、おすすめできます!Vrew...
作業を中断する場合
字幕起こしの途中で作業を中断する際は、プロジェクトの保存を行うことで、次回の作業が簡単に始められます。
ファイル ➡ 【プロジェクトを保存】
若しくは【別名でプロジェクト保存】を選択します。
保存を忘れるとせっかくの作業がパァーになってしまうので、しっかり保存しましょう。
多彩なファイル形式でエクスポートが可能
最後まで字幕起こしが出来たら、ファイルをエクスポートして終わりましょう。
まずは、2択です。
- 動画でエクスポート
- 他の形式でエクスポート
動画でエクスポート
動画でエクスポートを選ぶと、次のような選択設定画面が現れます。
動画でエクスポートする場合、対象クリップとハードウェア加速は2択ですが、解像度と画質は以下の通り、3択です。
解像度:
- qHD(元の動画、960×540)
- HD(1280×720)
- FHD(1920×1080)
画質
- 標準
- 高画質(推薦)
- 最高画質
他の形式でエクスポート
動画以外にも多彩に対応しています。
- 字幕ファイル(.srt)
- テキストファイル(.txt):タイムコードあり/なし
- 透明背景の字幕付き動画
解像度
1. qHD(元の動画、960×540)
2. HD (1280×720)
3. FHD (1920×1080)
4. QHD(2560×1440)
5. 4k (3840×2160)
- 音声ファイル : .mp3 / WAV
- 画像ファイル : .png / GIF
まとめ
Vrewで字幕を起こす場合、premiere Proとの併用が無難なように感じました。
1. Vrewでテキスト内容を編集
2. premiere Proで音のずれ、文章のまとまりを修正
この2ステップで字幕制作は可能です。
ただ、premiere Proを使いこなすには、パソコンの容量など考慮する必要はありますけどね。
そして、Vrewの良さは何といっても2つあります。
- AIによる自動翻訳されたテキストがある
- 編集も簡単にできる
という点です。
細かい部分は改善する余地があるように感じましたが、Vrew側も頑張って日々、改善してくれているので、音ズレなどの問題が解決されれば、『Vrew』1本で簡単に字幕起こしが可能になります。
今後の改善に期待しましょう♥
あなた推しのYouTube動画に、Vrewとpremiere Proを使って、あなたも字幕付けで応援してみませんか?
次回は、YouTubeのための海外の字幕付け専用サイト『Amara』についてお伝えします。