ChatGPTやGeminiなど生成AIが登場してから2年以上が過ぎ、テキストや画像を人間のように理解し、生成するために訓練された「大規模言語モデル(LLM)」を巡る話題がテクノロジー分野を席巻している。その間AI開発競争は、より大きなモデルやより多くのデータ、より強力な計算能力といった「規模の大きさ」で定義されてきた。
そしてここ最近は、GPT-4やGeminiなどのLLMとは別に、より小型でスリムかつ特定のビジネス用途に強みを持つモデルに移行する動きも活発化している。
ビジネスニーズに応える「小規模言語モデル(SLM)」の強み
「次のAIのトレンドは、特定の目的のために設計されているモデルだ。SLMは、特定分野の専門知識に絞って学習させられるため、現実世界のビジネスニーズに対してはるかに強みを発揮する」。戦略的ITサービスを提供するコンサルタント企業、MobileLive創業者のジャハン・アリCEOは、筆者とのインタビューで語った。
SLMは、特定の業界、タスク、業務ワークフローに合わせて微調整されたAIモデルと定義されている。膨大な一般知識を処理するLLMとは異なり、SLMは精度と効率を重視して設計されている。そのため少ない計算リソースでコストを抑えた運用が可能で、ビジネス関連でより多くのインサイトをもたらすことが可能だ。
「SLMは単なるLLMの縮小版ではない。金融、医療、ソフトウェア開発など特定分野で優れた成果を出せるよう最適化されている。このため組織固有のニーズに即した、より正確で信頼性の高い結果を提供できる」とアリは説明する。
Hailo共同創業者で最高技術責任者(CTO)を務めるアヴィ・バウムも、これに同意する。「LLMが最初に登場したときは、かつてない規模の知性に重点が置かれていたが、実用性のニーズの高まりの中でより小型で洗練されたモデルが登場した。これらSLMは、効率を高めつつも強力な推論能力を維持しており、クラウドに依存しないローカルでの動作が可能になっている」。
SLMの需要の高まりの背景には、LLMにまつわるプライバシーやセキュリティの懸念があるとバウムは指摘する。多くの企業は、データ漏洩やコンプライアンス違反のリスクから、クラウドベースの生成AIツールの使用に慎重だ。しかしSLMの場合、企業はノートパソコン、ロボット、携帯電話などのエッジデバイス上で直接AIを稼働させられるため、データのセキュリティを維持できる。



