AI技術の動向に興味をお持ちなら、これまでプレビュー版だった「o1」モデルが正式版となり、その高速版である「o1-mini」とともに、これら最新モデルを利用できる「ChatGPT Pro」が月額200ドル(約3万円)と、ChatGPT Plusの実に10倍の価格設定で提供されることはすでにご存知のことだろう。
いきなり10倍の価格設定に驚いた読者もいるだろうが、より多くのリソース(計算量=コスト)を使うことで、ここまで大規模言語モデルは到達できると未来を示したことで、OpenAIだけではなくその競合各社、さらには開発者やユーザーに「次のステップ」を示唆している。
o1モデルの本質と改良点
o1は前身であるo1 Previewの改良版だが、その性能は決定的に異なる。o1 PreviewでOpen AIが示したのは、それまでの一連の「GPT」と比べて推論能力に長け、ユーザーが入力する質問に対してより深く考察した上で、丁寧に思考を組み立てて答えを生成することで、GPT-4oと比べて生成する回答の傾向に決定的な違いを感じていた方も多いのではないだろうか。
しかし、この「違う」ことと「正確」なことは違う。
o1はo1 Previewを大幅に洗練し、より高い知性を感じさせる応答、複雑な問題に対する解決能力、画像などマルチモーダル入力に対する識別能力の向上、応答時間の短縮などを達成し正答率も大幅に上昇している。
また、これまでのAIサービスは簡単な質問であっても深く思考する問題があったが、o1は簡単な質問には瞬時に簡単に答え、複雑な問いには熟慮した上で時間をかけて答える仕組みも備える。
特に科学技術演算やプログラミングなどの性能は顕著に高く、また「長い出力」にも対応できている。
たとえば手書きの図や設計図、科学的実験過程を示す画像をアップロードし、その解析結果と文章による資料を組み合わせ、考察できる内容を質問で引き出すといったことが可能だ。技術計算を行う上での図式メモなどはもちろん、歴史的な資料の解釈といった比較的曖昧な問題も解決できる。
数学、科学技術、プログラミングなど、膨大な知識を集約させなければ解決できない領域で、人の思考に近い過程を踏んで推論するのはo1 Previewも同様だが、著しく思考ミスの発生率を減らした上で、出力するトークンの速度は2倍に達する。