以下に、Llama 2モデル関する10の事実を紹介する。
1. Llama 2は、メタが公開した資料の使用、複製、配布、複写、派生物作成、改変を許可するライセンスが付随する。完全なオープンソースライセンスではないものの、一部の制約付きで商用利用を許可している。
2. Llama 2には3つのバリエーションがあり、それぞれパラメーターの数が異なる。7B、13B、70Bの3種類だ。パラメーター数が多いほど、モデルの精度が上がる。パラメーターの大きさは、大量のコーパス(文書集)を用いて訓練されたことを示し、より正確で信頼性の高い応答が可能になる。
3. Llama 2の各バリエーションには、ChatGPTを模倣したチャットボット作成に役立つ会話に特化したバージョンがある。これらの特別にチューニングされた大規模言語モデルは、Llama-2-Chatと呼ばれ、ダイアログの使用に最適化されている。
4. Llama 2は、公開されているオンラインデータを混合して訓練されている。訓練中、単語は「トークン」と呼ばれる数値表現に変換される。Llama 2モデルは2兆トークンで訓練され、これは非常に大規模な訓練データセットを意味する。モデルの全バリエーションは、入力トークンサイズとして4K(英文では約3500ワードに相当)をサポートしている。
5. Microsoft Inspireでサティア・ナデラが発表したように、マイクロソフトはLlama 2の優先パートナーだ。このモデルは現在、Azure AIのモデルカタログで利用可能であり、Microsoft Azureの開発者はそれを利用してクラウドネイティブのツールを用いたコンテンツフィルタリングやセーフティ機能を強化できる。