2024.12.10 11:00

OpenAI o1登場、AIを「育てる時代」に　経営者が知っておくべきこと

正式版「OpenAI o1」が発表（CFOTO/Future Publishing via Getty Images）

経営者が承知しておくべきAIの近未来

さて、ここまで個人向けのAIサービスを中心に、その大幅なアップデートについて紹介してきたが、経営者あるいは経営に近い幹部が知っておくべき情報は別にある。それは2日目に発表された強化学習に関する大幅なアップデートだ。

新しい強化学習に関する機能及びツールに関しては、主にAI関連の開発者に向けたものだが、ビジネスの効率を高め、自らの授業にどのように組み込むべきなのか。経営者こそが知っておくべき情報だと思う。

加入型サービスで提供されるAIモデルは、注意深く幅広い知識について学習が行われているが、特定ジャンルのビジネスや専門領域に応用する際には、標準モデルでは十分に対応できない場合がある。

OpenAIが一連の発表における2日目に発表したのはo1シリーズのモデルを強化学習（Reinforcement Learning）することで、ファインチューニングを行うためのツールとその効果についてだ（Reinforcement Fine-Tuning、以下RFT）。

特定ジャンルや業務の内容を学習させておく強化学習はよく行われる手法だが、その強化学習を通じて回答のニュアンスや細かな回答精度を高め、リスクの少ない出力を得るための調整をユーザ企業自身が行うことができるようになる。

法律、金融、医療、さらには研究開発の専門分野といった多様な領域において、AIサービスは参考になる情報を提供してくれるが、さらにファインチューニングを行うことで「有能なアシスタント」へと育てることができるのだ。

従来のファインチューニングは、「模範解答」をAIモデルに与え、文字通り「教科書的な回答スタイル」へと結びつくように調整するという手法だった。

これによって文体の調整や特定の書式への適応は可能となるが、推論そのものの経路が変化するわけではない。

たとえば法律文書や専門的な研究データを扱う場合、学習された情報に対する本当に正しい答えが何なのか。その背景として必要な関連知識などはAIモデルの中に散在したままで、ファインチューンで正しい答えを模倣させたとしても、AIモデルは正しい答えに辿り着くための方法、情報は不十分なままだ。

そこではOpen AIが開発したのがRFTというわけだ。

次ページ＞「推論結果」ではなく「推論プロセス」を調整