【重要なお知らせ:当社を装った偽サイトにご注意ください】

AI

2025.02.16 09:15

もうほぼ人間、自然に雑談する音声対話AIを名古屋大学が開発

shutterstock

shutterstock

人間同士で会話をすれば、相手の話にかぶせて相づちを打ったり、多少言葉が重なっても話が途切れることはない。そうした、不完全なようでじつは非常に高度な人間同士の会話を再現できる音声対話モデル「J-Moshi」(ジェイモシ)を名古屋大学が開発した。

サンプル音源を聞くとビックリする。これまでのAIとの質疑応答のような対話ではなく、ごく自然な雑談が可能だ。言葉が重なっても話が続けられる同時双方向性の会話は、通信方式で言うところのFull-duprex(全二重通信)だが、AIとの会話でこれを実現したということだ。

J-Moshiは、フランスの非営利AI研究機関Kyutai(キュタイ)が開発したMoshiを日本語対応にしたもの。名古屋大学大学院情報学研究科の東中竜一郎教授は、これまで日本語のFull-duprex音声対話に関する研究があまりなかったためMoshiを取り入れたということだ。J-Moshiには名古屋大学のスーパーコンピューター「不老」が使われているが、元になったMoshiのパラメータ数(言語モデルの規模を示す数値)は70億。大規模言語モデルは数百億から数千億に達するものもあるため、比較的コンパクトで応用範囲も広い。

これだけ自然な会話ができれば、高齢者施設のお年寄りの話相手や、バーのバーチャルバーテンダーの役割は十分に熟せそうだ。ロボットに搭載されたなら、人間との距離がぐっと縮まって、お友だちになれそうだ。

プレスリリース

文 = 金井哲夫

タグ:

ForbesBrandVoice

人気記事