伝えられるところによれば、OpenAIはもともと、GPT-3.5を搭載した初の一般公開版ChatGPTのリリースを2023年以降に延期する予定だった。安全性に確信が持てなかったためである。
しかし、Googleをはじめとする競合各社が独自のLLM(大規模言語モデル)チャットボットの開発を急いでいたため、OpenAIは予定を繰り上げてリリースに踏み切った。
一部ではこれを、むしろ安全性を重視した判断だったと見る向きもある。当初は大型発表の目玉としてGPT-4を投入する計画だったが、あえて基本性能にとどまる3.5版で先行リリースすることで、より強力なアップグレード版が世に出る前に、実際のユーザーの手で危険性を洗い出してもらおうとしたというのだ。
ChatGPTの公開から約3年半。AIがどの程度危険なのかという問いの答えはいまだ定まっていないが、脅威の性質そのものは大きく変容している。
たしかに、チャットボットが誤解を招く文章を生成したり、事実でない情報をもっともらしく提示する「ハルシネーション(AIが事実に基づかない情報をあたかも正しいかのように生成する現象)」を起こしたりする問題はある。しかし今日の最先端モデルはAIエージェント(自律的に判断・実行するAI)であり、単なるテキスト生成にとどまらず、実際に行動を起こす能力を持つ。複雑なコードを書き、各種システムと連携し、自律的に動くことができるのだ。
そして懸念すべきことに、AIは常に私たちの期待どおりに振る舞うわけではない。AIが欺瞞的な行動を取ったり、人間を騙そうとしたり、意図も想定もされていなかった人格のようなものを発現させたりする事例がユーザーから報告されている。こうした事実は、AIの脅威の全容がいまだ十分に把握されていないことを改めて裏付けている。
現在、この危険が現実のものであることを示す最も明確なシグナルのひとつは、AI業界の内側から発せられている。AnthropicのCEOダリオ・アモデイは最近の論考で、AIは社会にとって良い力となりうるとしながらも、安全策の整備が十分な速度で進んでいないと指摘した。そして、社会が対処する準備のできていないリスクをAIが生み出しているという兆候が増えていると述べている。
では、AIはいつ「危険すぎる存在」になるのか。リスクが潜在的な恩恵を上回ると認めて立ち止まるべきなのは、どの時点なのか。そして、ビジネスや日常生活でAIを安全に活用するために注視すべき「危険信号」とは何か。
警鐘を鳴らす
OpenAIで働いたのち、安全性を重視したAIを開発するためにAnthropicを設立したアモデイは、AIのリスクに対して「冷静で、事実に基づき、状況の変化にも耐えうるアプローチ」で臨むべきだと主張している。
リスクについて、彼は十分な知見を持っている。AnthropicのLLMベースのチャットボット「Claude」は各種性能ベンチマークで常に上位に位置しており、アモデイは、現世代のAIが自律的に次世代AIを構築する段階まであと1〜2年しかない可能性があると予測している。
その段階に達すれば、AIが「本質的にあらゆる分野で人間を上回る」ようになるまで、そう時間はかからないと彼は言う。



