AI

2025.12.15 15:30

ChatGPTの新モデル「GPT-5.2」、GeminiやClaudeと比較してわかったこと

結果

Gemini 3.0 Proの「思考モード」では、スプレッドシートそのものは生成されず、代わりに、手動でコピーしたりグーグルのスプレッドシートにエクスポートしたりできるテーブルが提示された(下図:Forbes Japan編集部での実行結果のため、ここで説明されている内容とは異なる)。

Gemini 3 Proの例(上記日本語プロンプトをForbes Japan編集部で実行した結果)
Gemini 3 Proの例(上記日本語プロンプトをForbes Japan編集部で実行した結果)

まったく同じプロンプトをClaude Opus 4.5 で試したところ、今度は、グーグルのスプレッドシートにどのように書式を適用するかに関する手順まで含めた、非常に長い結果が返ってきた。Claudeは、各タブや各列向けのテキストと書式設定に加え、一連のルールも提示した。最後には「システムの実装」に関する注意事項で出力を締めくくっていた(下図:Forbes Japan編集部での実行結果のため、ここで説明されている内容とは異なる)。

Claude 4.5 Opusの例(上記日本語プロンプトをForbes Japan編集部で実行した結果)
Claude 4.5 Opusの例(上記日本語プロンプトをForbes Japan編集部で実行した結果)

私の見方では、AnthropicもGeminiも、すぐに使えるという意味ではさほど有用とは言い難かった。確かに、ニューヨークで仕事を探すプロジェクトマネージャーという仮想の立場からすると役に立つ情報や助言は提供してくれた。しかし、そのレイアウトのままでは、内容をはっきり読み取り実務で使えるレベルにするまでに、こちら側でかなり手を加える必要があると感じた(訳注:ただし上図のようにForbes Japan編集部の実験ではClaude[Anthropic]でもそのまま使えるExcelシートが生成されている、実際こうした出力は時々刻々と変異している)。

一方で、私の経験上、ClaudeとGeminiが非常に優れていた点は応答速度である。Claudeの生成は高速で(Geminiも同様だ)、どちらのモデルも回答に1分以上かかることはなかった。

もう1つすぐに目についたのは、Claudeがかなり詳細な情報も提供していた点である(一部はGPT-5.2が出した回答とよく似ていたが、ところどころ異なる箇所もあった)。その詳細の多くは書式設定に関する指示に割かれており、正直なところ、すべてに目を通しているうちに頭が過熱し始めた。

求職者の立場になって考えると、今すぐ自分の行動計画と求職戦略をすべて盛り込んだスプレッドシートが必要だという状況であれば、こうした出力を現実の世界で活用するのは負担が大きく、難しいだろう。

次ページ > 結果ーーGPT-5.2 Extended thinking、結論

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事


advertisement