2023.07.21 13:00

メタの最新大型言語モデルLlama 2について知っておくべき10のポイント

Getty Images

米国時間6月18日、メタ社は人気の高い大規模言語モデル（LLM）の第2バージョン、Llama 2（ラマ2）を発表した。これまでのバージョンとは異なり、Llama 2は研究および商用利用が自由にできる。そのすばらしい能力のため、生成AIのコミュニティでは大きな話題となっている。

以下に、Llama 2モデル関する10の事実を紹介する。

1. Llama 2は、メタが公開した資料の使用、複製、配布、複写、派生物作成、改変を許可するライセンスが付随する。完全なオープンソースライセンスではないものの、一部の制約付きで商用利用を許可している。

2. Llama 2には3つのバリエーションがあり、それぞれパラメーターの数が異なる。7B、13B、70Bの3種類だ。パラメーター数が多いほど、モデルの精度が上がる。パラメーターの大きさは、大量のコーパス（文書集）を用いて訓練されたことを示し、より正確で信頼性の高い応答が可能になる。

3. Llama 2の各バリエーションには、ChatGPTを模倣したチャットボット作成に役立つ会話に特化したバージョンがある。これらの特別にチューニングされた大規模言語モデルは、Llama-2-Chatと呼ばれ、ダイアログの使用に最適化されている。

4. Llama 2は、公開されているオンラインデータを混合して訓練されている。訓練中、単語は「トークン」と呼ばれる数値表現に変換される。Llama 2モデルは2兆トークンで訓練され、これは非常に大規模な訓練データセットを意味する。モデルの全バリエーションは、入力トークンサイズとして4K（英文では約3500ワードに相当）をサポートしている。

5. Microsoft Inspireでサティア・ナデラが発表したように、マイクロソフトはLlama 2の優先パートナーだ。このモデルは現在、Azure AIのモデルカタログで利用可能であり、Microsoft Azureの開発者はそれを利用してクラウドネイティブのツールを用いたコンテンツフィルタリングやセーフティ機能を強化できる。

次ページ＞モバイルデバイスでも提供の予定