音声で聴く
前述のチュートリアルのかなり奥の方に出てくる次の1文は、示唆的だと思った。ここでモアハウスが触れているのは、あるノートブックを音声ポッドキャスト形式にして聴ける機能のことである。
「これは私の大学院での勉強にとって、大きな転機になりました。仕事の後に勉強時間をひねり出すのは難しいのですが、音声の概要があれば、運転中や運動中の時間を学習に回せます」。
私が思うに、この機能の魅力の1つは、手がふさがらないことである。スマートフォンを顔の前に持ち続ける必要がない。それに、情報のやり取りも、場合によってはむしろ速い。とりわけ自分が何かを伝えるときはそうだ。タップは要らない。話せばよい。
これはNotebookLMの中でも大きく過小評価されている面だと思う。近い将来、私たちがすることのほとんどは、テキストではなく音声モードで行うようになると私は見ている。文字でやり取りするのは、ぎこちなく、手間も注意力も食う通信手段だ。だから、運転中にそれをすれば罰金や訴追の対象になり得ると警告する看板が、そこら中に立っているのだ。
そのことを教訓に、NotebookLMをはじめとするテクノロジーを、周囲の世界から注意を逸らさない形で使う新しいやり方を考えるべきだ。
インフォグラフィックの力
では、自宅でくつろぎながら画面を見ているときや、聴衆の前で画面を使って何かを説明するときはどうか。そんな場面では、NotebookLMのビジュアル機能が役に立つ。
「これはクイズほど学習には役立たないかもしれませんが、ソース資料の情報を見せるにはとても便利です」と、モアハウスは視覚的なインフォグラフィックの手法について書いている。「向きや詳しさを選べますし、スタイルを導くカスタムのプロンプト指示を加えることもできます」。
NotebookLMのこの側面は、ピクセル化された画像と文字認識を融合させ、画像の中に実際のテキストを生成するというLLMの能力を示している。思い出してほしいのは、2023年ごろのDall-E(ダリ)のような初期の画像生成モデルは、これができず、代わりに夢の中で見るようなでたらめな文字列を吐き出していたことだ。
だが今や、ビジュアルは見事である。しかも、情報もきちんと伝えてくれる。
第一印象
以前の私の記事を覚えているなら、昨年夏にNotebookLMを使い始めたとき、私がそれに圧倒されたことも覚えているだろう。この新しいモデルには、とにかく機能が多い。技術の焦点が絶えず変わる世界でも、マルチモーダルな結果を出す点では、今なお群を抜いていると私は思う。
ぜひ試してみて欲しい。


