3.2023年のChatGPTは、83年のロータス1-2-3だ
表計算ソフトのロータス1-2-3を覚えているだろうか。この表計算ソフトは、最初に市販されたPC用のスプレッドシートではなかったが、1983年初頭に発売されるやいなや、パソコンブームの火付け役となり、パソコンの「キラーアプリ」とみなされるようになった。ロータス1-2-3は、従業員の生産性向上にも大きな役割を果たした。それまでは不可能だった数値データの追跡、計算、管理が可能になったのだ。今ではHP(ヒューレット・パッカード)の電卓に頼って計算し、いちいち書き写さなければならなかった時代を覚えている社会人は、ほとんどいないだろう。
ロータス1-2-3で生産性は大幅に向上したものの、いくつかの問題があった。(1)ユーザーが計算ミスをハードコーディングしたため、一部の企業では大きな問題が発生した。(2) スプレッドシートに入力する前提条件の文書化が不十分だったため(というより存在せず)、透明性が欠けていた。(3)スプレッドシートのデザインと利用に関する一貫性と標準化が、欠けていた。
40年前にロータス1-2-3で企業が悩んだのと同じ問題が、現在、ChatGPTや他の生成AIツールの利用においても存在している。人々はChatGPTが出力するしばしば間違った出力に依存し、ツールの利用に関する文書(または「紙の証跡」)も存在しない。そして同じ会社はもちろん、同じ部署の従業員間でさえ、ツールの利用法に一貫性がない。
その昔、ロータス1-2-3は、スプレッドシートの機能を強化するプラグインを数多く生み出した。同様に、ChatGPT用のプラグインはすでに何百も存在している。実際、音声、ビデオ、プログラミングコードなど、テキスト以外の出力を生成する能力の多くは、ChatGPT自身ではなく、これらのプラグインから来ている。
4.データ品質が、生成AIへの取り組みを左右する
コンサルタントは何年もの間、社内データの整理整頓を促してきたが、生成AIツールを使い始めると、その言葉の意味を実感できるだろう。「ガベージ・イン、ガベージ・アウト」(ゴミを入れればゴミが出てくる)という格言は、まさしく生成AIのためのものだ。インターネット上の公開データを利用するオープンソースのLLMの場合には、データの品質には細心の注意を払う必要がある。インターネットはデータの金鉱ではあるものの、それはデータの埋立地の真ん中にある金鉱なのだ。データを求めて手を突っ込んでも、金塊を手に入れたのか、それともゴミを手に入れたのか、はっきりしない。
企業はもう何十年も、従業員が意思決定や業務に必要なデータにアクセスできるようにすることに苦心してきた。その際の課題は、データにアクセスできるツールを用意すること、そして従業員にトレーニングを受けさせ、それを使いこなせるようにすることだ。
生成AIツールは、データアクセスやレポーティングソフトウェア・アプリケーションを使用する際に、いくつかの問題を抽象化することに役立つ。これは大きなメリットだ。そしてこうした新しいツールが、人間のパフォーマンスを加速させる理由のひとつでもある。
しかし、残るはデータの品質だ。逆説的に聞こえるかもしれないが、データを一般的に語るのはやめるべきなのだ。その代わり、顧客データや顧客対話データ、トランザクションデータ、財務実績データ、運用実績データなど、特定タイプのデータの品質、可用性、アクセシビリティを評価しよう。これらのデータがそれぞれ、生成AIツールの材料となる。