Google I/Oに先立つ2月、同社のスンダー・ピチャイ最高経営責任者(CEO)は、マイクロソフトのBing/ChatGPT公開に先駆けて、グーグルの会話型AI「Bard」のデモを急がせた。しかし、それはうまくいかなかった。プレゼンテーションの動画再生は、エラーと不具合だらけだった。同社の株価は急落し「マイクロソフトのAIの方がリードしている」という雰囲気が生まれてしまった。
しかし、一般のイメージとは異なり、グーグルはAIの覇権争いでマイクロソフトに後れを取っていたわけではなかった。マイクロソフトは、ChatGPTを開発した新興企業OpenAI(オープンAI)とのパートナーシップのおかげで、AIでいくつかのすばらしい進歩を遂げたが、グーグルは依然として、AI研究開発のいくつかの重要な分野で手ごわい競争相手だ。
そんな重要分野の1つが、機械が人間の言葉を理解し、生成する能力である自然言語処理(NLP)だ。グーグルは創業以来、Google検索、Google翻訳、Googleアシスタントなどの製品で、NLPのパイオニアとなってきた。これら最先端のアプリケーションは、洗練されたNLPアルゴリズムに依存している。また、グーグルの最先端NLPモデル「BERT」「T5」「Meena」は、質問応答、テキスト要約、会話エージェントの新しい基準となった。
グーグルはまた、コンピュータ・ビジョン(CV、画像を認識・分析する能力を機械に教えることに特化したAI分野)にも秀でている。グーグルによるCVの開発は、2006年の動画共有サービス「YouTube」買収から始まった。この買収によりグーグルのエンジニアは、大量の画像データにアクセスできるようになった。エンジニアたちはすぐにCVの専門知識を活用し、Googleフォト、Googleレンズといった革新的なプロダクト、そして高度な物体検出を使う自動運転車を開発する子会社Waymo(ウェイモ)を生み出した。
さらにグーグルは、ディープラーニングを使った最初の大規模プロジェクトの1つである「Google Brain」を2011年に立ち上げて以来、人工ニューラルネットワーク(ANN)のリーダーでもある。ANNは、ChatGPTのように言いやすい言葉ではないかもしれないが、この技術はほとんどのAIアプリケーションの基礎となっている。
グーグルにおけるAIの問題は、エンジニアリングの問題ではない。マーケティングの問題だったのだ。
ChatGPTがすごいと人々が感じたのは、テクノロジーの現状を考えると「人間のようなチャットボット」の実現は不可能に感じられていたからだ。コンピュータは「考える」ことを想定されておらず、もちろん「理性的な会話」をすることも想定されていなかった。