最近「生成AIで英語を効率よく勉強するには」というnote記事で、自分が興味のある題材の教材を手に入れるために生成AIを活用するノウハウが紹介されていた。
これには共感できて、私も「海外ドラマを使って英語学習しよう!」というメソッドに乗って実践しては「ドラマ興味ねぇ〜」と挫折を繰り返すことが多かった(ディズニーの英語と映画アラジンがライブラリに眠っている)。自分の好きなテーマで教材を作ればモチベーションが保ちやすいのはそのとうりだと思う。
私の場合、読み書きよりもリスニングをもっと鍛えたいという気持ちが強い。理由はソフトウェア技術関連の動画やポットキャスト(カンファレンスの録画とかテックインフルエンサーの配信とか)の音声を翻訳を挟まずに理解できるようになりたいから。即時性の高い一次情報が英語かつ音声でしか入手できないことが結構ある。以前感想を書いたOSSのドキュメンタリー番組とか。
では自分の興味のあるジャンルの動画を片っ端から見まくればいいのではないかとやってみたものの聞き取りやすい動画とそうでない動画があることに気づいた。これは発音の訛りや音声変化にまつわる部分と、カジュアルな口語の語彙や文の違い(つまりテキストになっても理解できない)によって起こっているのだと理解した。例えば目的から逸れるが、非ネイティブでかつ日本訛りの英語は発音についていけて文がシンプルなので聞き取りやすい。なので自分のレベルで聞き取りやすい動画教材を探す旅が始まってしまう。しかしちょうどいい教材が自分の興味に沿う可能性は低い。
そこで活用できるのが Google の NotebookLM。これは研究・ノート作成ツールのノリでウェブやファイルのソースを放り込んでおくとRAGのように使えたりテキストを生成してくれる。先日正式アップデートがされて有料プランなど充実したので突然サ終することはなさそう。
しかし、米国ではどうもテキスト生成よりも「ポッドキャスト生成機能」がウケているようだ*1。この機能は登録したソースから15分くらいの男女の英会話を自動生成してくれるもので*2、指示次第で「簡単な語彙を使って」とか「10歳児でもわかるように説明して」みたいに自由にカスタマイズできる。要は、好みのトピックを音声にしてくれるAIラジオが手に入る*3。面白い使い方としては日本語のソースを登録して英語のポッドキャストを生成するユーザーもいるようだ。
*(NoteBookLMの様子。日本語で使うとCSSを完全に理解してるのがちょっと面白い)
例として以下にブログ記事「NotebookLM goes global with Slides support and better ways to fact-check」をポッドキャスト生成したサンプルをあげておくので聞いてみてほしい。
この機能でノイズがほとんどない発音と語彙がフラットな英語音声を入手できる。ノイズが少なければ文字起こしも精度が出る。そういうときに役立つのが「MacWhisper」。正確にはAppストア版の「Whisper Transcription」や、Gumroadでライセンス販売されてる「MacWhisper」と呼ばれる2つのアプリがあるが、どちらも同じアプリで、最小の文字起こしモデルならどちらも無料で使える*4
この MacWhisperをリスニング訓練のUIとして活用できる。音声を再生しながら同時に文字起こしを表示してくれるし、セグメント(発言者)ごとにUIが分割されてるので、どこを話してるか一目瞭然。さらに、翻訳も手軽に実現できて、DeepLアプリを別途インストールして⌘+C+Cのショートカットで一行だけ訳したり、macOS標準の辞書機能で⌘+Ctrl+Dでポップアップ表示させて意味を調べられる。再生速度を1.0以下に落とせるので、聞き取りづらい箇所をゆっくり再生しながら「このフレーズってこう発音してるのか」とチェックできる(自分で発音できる言葉は聞き取れる)。
こんな感じで、NotebookLMのポッドキャスト生成→MacWhisperの文字起こし→DeepLやDictionaryで補助、という流れを作れば、読み書き中心だった生成AIの活用法がリスニング寄りに広がる。ドラマ英会話は視覚情報があるので利点はあるが、このポッドキャスト生成機能は個人的に重宝している。
AI翻訳がリアルタイム化することで、もう英語を勉強する必要がなくなると考える人もいるかもしれない。しかし、先のnote記事で示されたように、要不要がゼロイチで決まるわけではなく実際にはグラデーションがある。AI翻訳の進化は単に言語バリアを取り除くだけでなく、多様な言語の情報にアクセスしやすくすることで一次情報に触れる機会を増やしてくれる。むしろ望んでいる人にとっては外国語が必要な場面が今後増えてくるというのが個人の見解だ。実際にウェブフロントエンドのOSSでは中国語ドキュメントや企業ブログが一次情報になっているものがすでにある。
それに外国語を理解できることは人生を楽しむ手段としても価値があるだろう。その良い例が、コミックやアニメなどのオタクコンテンツを楽しむために日本語を学ぼうとする人たちの強いモチベーションだ。それはAIに奪われても良いことはない。
AI翻訳が進化しても、直接的に外国語を学ぶことで得られる深い理解や喜びは引き続き重要なものとなるだろうと思っているので私は生涯続ける意思を持っている。他の人は知らんけど。その過程からできるだけストレスを取り除きたいというのが本記事の主旨だ。
*1:グーグルの「NotebookLM」を使ったAIポッドキャストが注目されている | WIRED.jp
*2:注意点として日本語対応したら音声も日本語で生成されるようになってしまうかもしれない。そのままの君でいて
*3:まだ試してないが最近のアップデートで会話に参加してこっちの音声を聞きとってくれるようになったらしい https://blog.google/technology/google-labs/notebooklm-new-features-december-2024/
*4:Windowsニキの人は良い文字起こしアプリがあったら教えてほしい。