「Inflection-2」と呼ばれる同社のモデルは、5月に発表されたグーグルの「PaLM 2」やメタが開発したオープンソースの「LLaMA 2」よりも多くの指標で優れているという。インフレクションAIのモデルは同規模のLLMの中でトップのパフォーマンスであると同社は述べている。ただし、より規模が大きいOpenAIのGPT-4には追いつけていないという。
「私たちは、当社のモデルの新たな機能が非常に画期的なものであると信じている」と、インフレクションAIのCEOのムスタファ・スレイマン(Mustafa Suleyman)はインタビューで述べた。
同社の新たなモデルは、5月にリリースしたチャットボット「Pi」にまもなく統合される予定だ。「人種やジェンダー、政治といったデリケートなテーマの会話をしたいときでも、Piは非常に繊細かつ注意深く、リアルタイムで情報にアクセスしながら、事実に基づいた方法であなたと関わってくれます」と彼は説明する。
スレイマンは、Piの最新のユーザー数については明らかにしなかったが「非常に人気があり、リテンションも非常に高い」と述べた。先日、CEOのサム・アルトマンを一時的に会社から追放するという混乱に陥ったOpenAIは、その騒動の直前のカンファレンスで、ChatGPTが1億人超の週間アクティブユーザーと200万人の開発者を抱えていると説明していた。
「世界で2番目に高性能なLLM」を自称するインフレクションAIの最新プロダクトの発表を、OpenAIの混乱と関連づけて見ないわけにはいかないだろう。しかし、スレイマンは、今年初めに13億ドル(約1880億円)の資金調達を行った彼のスタートアップが、新モデルのリリース日を早めたわけではないと主張した。このリリースは実際には1週間遅れだったという。
Inflection-2のトレーニングには、5000個のNVIDIA H100 Tensor コア GPUが使用された。インフレクションAIは、マイクロソフトやエヌビディア、CoreWeaveらと緊密に提携し、自社のコンピュータクラスタを管理している。
同社は、この新モデルを、MMLUと呼ばれる高校生や専門家レベルの一般的なベンチマークでテストした。MMLUでは、世界の知識から問題解決、倫理まで57のテーマに関する問題が出題される。スレイマンによると、Inflection-2の性能は、700億パラメータバージョンのLLaMA 2や、イーロン・マスクのxAIのGrok-1、グーグルのPaLM 2、AnthropicのClaude 2らの性能を上回り、敗れたのはGPT-4のみだったという。