AI

2025.12.15 15:30

ChatGPTの新モデル「GPT-5.2」、GeminiやClaudeと比較してわかったこと

Shutterstock

Shutterstock

先週末の終わりごろ、OpenAIがChatGPTの最新モデルであるバージョン 5.2(GPT-5.2)のリリースを発表して以来、このモデルをめぐって少なからぬ盛り上がりが起きている。当時の私はかなり忙しく、自分で試す時間は取れなかったが、LinkedInのタイムラインに流れてくる投稿に出てくるフィードバックには強く興味をそそられていた。

advertisement

そこで今朝、私は起きてノートパソコンを開き、この高度なモデルを自分で試して、いったい何がそんなに騒がれているのかを確かめることにした。さらに重要な目的として、現在市場で最も人気のあるLLM(大規模言語モデル)および生成AIチャットボットの2つ――AnthropicのClaudeと、グーグルのGemini――とGPT-5.2を比較検証することにした。

GPT-5.2、Gemini、Claudeをどのように比較テストしたか

私はそれぞれのモデルに対し、現実の知識労働に基づいた、非常に具体的なプロンプトを与えてテストした。とりわけ求職者である読者にとって役に立つ内容になるように設定したプロンプトだ(実際には、職場での重要なプレゼンテーションに備えるビジネスパーソンといった別のユースケースでもいくつかプロンプトを試したが、それらの結果まで挙げると長くなりすぎるため、ここでは1つのプロンプトに絞っている)。

プロンプトの内容は一切変更せず、追加入力による説明要求や、出力内容に影響を与えるような指示も行っていない。

advertisement

各モデルをテストするために用いたプロンプトとその結果の説明に入る前に、念のため、GPT-5.2とはそもそも何なのかを簡単に整理しておきたい。

GPT-5.2は、GPT-5.1とどう違うのか

OpenAIは自社ウェブサイト上で、GPT-5.2を「プロフェッショナルな知識労働にこれまでで最も適したモデルシリーズ」だと謳っている。

GPT-5.1と比べると精度が高められており、同社サイトによれば「ハルシネーション」(幻覚。事実と異なる出力)の発生も減っているという(とはいえ、あらゆる内容について自分でファクトチェックする必要は依然としてある)。知識労働者向けにより適したモデルになったとも説明されている。OpenAIの説明文では、レポート、スプレッドシート、ホワイトペーパー、契約書や合意書などをはじめとする長文ドキュメントの分析と処理を得意としている点が強調されている。前バージョンのGPT-5.1と比べると、GPT-5.2はスプレッドシートの作成能力も大幅に向上している。

次ページ > GPT-5.2 vs Gemini 3 Pro vs Claude Opus 4.5

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事