AI

2025.12.01 16:33

オープンソースAIの可能性と課題:信頼性と主権の観点から

Shutterstock.com

Shutterstock.com

大規模言語モデルを運用する際、チームには選択肢がある。システムの仕組みをパラメータ、学習データ、重み付け入力の詳細とともに、あるいはそれらなしで世界に公開するか?それともこれらの情報をすべて秘密にし、開発者が保護するか?その結果生じる「オープンソース」対「クローズドソース」の議論は、AIについて語られるとき、政府やビジネスの場で常に響き渡るものだ。

テクノロジー企業のリーダーたちも、これらの問題と格闘している。彼らは戦略的にも、その他の観点からも、関連データを公開するべきか否かを判断しなければならない。

「AIの安全性に関する新たな市民社会の議論—特にオープンな基盤モデルについて—は特に注目に値する」と戦略国際問題研究所のマサオ・ダールグレンは書いている。彼は「非常に活発な議論」を引用し、その背景を説明している。「GPT-4のようなクローズドモデルとは異なり、Llama、Mistral、Qwenなどのオープン基盤モデルの開発者は、モデルの基礎となるパラメータ(『重み』)を公開し、エンドユーザーによる検査、修正、操作を可能にしている。オープンモデルのパフォーマンスがクローズドモデルに近づくにつれ、オープンモデルの配布が悪用の『極端なリスク』をもたらす可能性があると示唆する声もある。一方で、研究、セキュリティ、国家競争力におけるオープンモデルの利点を強調する声もある」

この記事は米国の防衛応用に焦点を当てているが、オープンソースの議論は他の場所でも浮上している。

主権、信頼、そして協力

最近の専門家パネルでは、オープンソースまたはクローズドソース設計を選択する背景にある理論的根拠の一部が示された。マッケンジー・シガロスは、ディネシュ・マヘシュワリ、カール・ジャオ、チャールズ・ファン、ホセ・プレーンにこれらの選択とその決定方法について、国家安全保障などの観点からインタビューした。

浮かび上がった一つのコンセンサスは、米国は一般的にオープンソースのリーダーが少ないということだ。

「米国のAIエコシステムは少し閉鎖的になってきているようだ」とプレーンは述べ、著作権や所有権侵害に関する懸念に対処する「ユニークなグローバル識別子」に関する自社の取り組みを説明した。

「私たちはデータのオープンソース化に関してできることをしようとしています。つまり、そのデータをモデルのトレーニングに使用し、またモデルをより事実に基づいたものにすることができるということです」と彼は述べた。

「基盤モデルの観点から見ると、現在、中国からより多くのオープンソースモデルが登場しており...米国のフロンティアラボは本質的により閉鎖的なアプローチを選択しています」とジャオは付け加えた。

信頼の問題

この二重性について語るマヘシュワリは、オープンソースシステムは信頼環境で普及させることができると示唆した。

「オープンソースは信頼に関するものです」と彼は言った。「それは単に重みをオープンソース化するだけでなく、データをオープンソース化することです。モデル、アーキテクチャ、メタパラメータをオープンソース化し、それが複製可能で監査可能であることを(知ること)です。それが信頼を構築するものです」

中国の優位性については、「オープンソース」システムとして広く称賛されているDeepSeekは、実際には完全にオープンソースではないと彼は指摘した。

「敬意を込めて言いますが、DeepSeekは半分オープンで半分クローズドです」と彼は言った。「データはオープンではありません。何で訓練されたのかわかりません。モデルのパラメータはオープンである必要があります」

ファンは、オープンソースかクローズドソースかの選択に影響する、新しい方法でのメモリの活用について語った。

「公開されているすべての知識はモデルによって捕捉されています」と彼は説明した。「しかし、私たちに属するメモリ、あるいは企業に属するメモリはインターネット上にないため、それらの重みによって捕捉されていません。それらのものを保存するためのシステム設計が必要です」

フロンティアラボはこれに関する作業を行っていると彼は言ったが、彼の定義によれば、それらはオープンソースではない。

「それだけでなく、彼らは互いのモデルをサポートしていません」とファンは付け加えた。「つまり、特定のメモリシステムを使用している場合、その特定のモデルに縛られています。そして、私たちが今日オープンソース化しているのはメモリモデルです。私たちはメモリはそのメモリの所有者に属するべきだと考えています。したがって、オープンソース化することで、どのモデルを使用するかに関わらず、オープンソースであれクローズドソースであれ、これがあなたのもとに留まるという信頼とセキュリティを可能にします」

利益の動機

シガロスは質問を設定し、オープンソースとクローズドソースのプロジェクトについて次のように述べた:

「ある人との会話で、テクノロジーをオープンソース化する動機が少ない理由の一つは、企業のお客様がさまざまな理由でクローズドシステムを望んでいるからであり、B2Bセグメントを考えると、おそらくそれがより収益性が高いからだと言われました」

マヘシュワリはこれに対応し、「オープンソース」と呼ばれる異なるタイプのシステム間の違いを再び指摘し、実際にはOSはスペクトラムであることを示唆した。

「モデルの価値はアプリケーションでの使用にあり、アプリケーションはファインチューニングされたモデルの上に構築されており、それらはさらに『カスタマイズ』されている可能性が高く、...オープンウェイトモデルを持っています」と彼は言った。「それをオープンソースモデルと呼ばないでください。オープンウェイトモデルでさえ、異なるインフラストラクチャでホストすることを可能にします。それは人々が実験することを可能にします。それは実験できるインフラストラクチャのコストを『選択』できることを意味します。そしてそれが改善を可能にします」

21世紀のAI主権

「主権は国家安全保障とレジリエンスのために必要なステップなのか、それともAIの分断されたスプリンターネットのリスクがある罠なのか?」とシガロスは尋ねた。

「人々はテクノ・ナショナリズムに陥っています」とマヘシュワリは言った。「残念ながら、『外から内へ』定義される国家的誇りは、人々が『内から外へ』であるには魅力的すぎます...主権とは、社会が何をするかの未来をコントロールする能力を持つことです...AIを社会的利益のために、その地域のコンテキストで展開できる必要があります。主権が『努力を分断する』方法で行使されなければならないとは思いません...思慮深く行われれば、努力を分断することなく、地域社会が自分たちの運命をコントロールできるようにする理由はありません」

プレーンはAIに関する米国行動計画とその仕組み、そして彼の会社の役割について説明した。

「政策の重要な要素は実際にオープンソースであり、その促進です。確かにアメリカ・ファーストの視点からですが、確かにオープンソースです」と彼は述べ、彼の会社であるBrightQueryが「国家安全データサービス」と呼ばれるものに取り組んでいることを明らかにした。

「それは米国政府の最初の中央集権的データエコシステムであり、全人口と機関、そして世界中にサービスを提供し、米国とそのさまざまな構成要素について一般市民に情報を提供するのを助けるでしょう」と彼は言った。

プレーンは検閲との闘いについても語った。

「歴史的事実の消去や修正は、世界中のいくつかの政府や国で行われていることです。私たちは皆それを承知していると思います」と彼は言った。「そして米国はそのような政策に反対しています」

ジャオは、私が過去に書いたことのあるKieferという会社によって構築されているギリシャの国家AIシステムに関する彼の仕事について語った。

「彼らにとってそれを行うことが魅力的なのは、それがとてもサービスが行き届いていないからです」と彼は言った。「これらの国々にとって重要なこと、特に言語の観点から重要なのは、彼らが自分たちの言語、特定の文化を使って自分たちの運命をコントロールし、モデルがそれを表現することを確実にすることです」

「データと知識に国境はありません」とプレーンは付け加えた。「それは私たちが心に留めておく必要がある基本的な概念です。知識が一度外に出ると、それは外にあり、過度の検閲が行われない限り、それを封じ込めるのは非常に難しいです。そして、フロンティアAI企業が彼らが発表し公開している基礎となるモデルや重みなどを保存し封じ込めるかもしれませんが、その対抗策は可能な限り多くのデータをオープンソース化することです」

これらすべてが、データを一般に公開するかどうかについての本当の議論を強調している。世界中で新しいモデルが登場するのを見ながら、私たちはこのことについて考え続ける必要がある。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事