2026.06.15 20:05

3万4000社の中小企業が「AIは効果あり」と回答、しかしデータが示す現実は異なる

TerDawn DeBoe | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

stock.adobe.com

2026年版QuickBooksAI Impact Reportは、シカゴ大学との提携により、米国各地の中小企業3万4000社を対象にした調査を収録した。紙面上では、データは印象的に見える。少なくとも定期的にAIを使っていると答えた割合は77%に上り、2024年半ばの48%から大きく増加した。さらに、調査対象の41%はAI利用によって売上が増えたと報告し、生産性が74%改善したとも述べた。こうした数字は、中小企業におけるAI活用の一側面を示している。しかし、この調査の「細則」を読むと、別の側面が浮かび上がる。中小企業の現場でAI利用を測るうえで最も重要なのは、企業がAIを使っているかどうかではなく、そのAIが成功しているかを測定できる能力があるかどうかだ。

研究者が、そうした成果をどのように測定しているのかを尋ねると、回答はかなり曖昧になった。50%超が「事業が良くなったという全体的な感覚」を挙げた。具体的な指標を追跡していると答えたのは半数未満だった。生産性の数字は自己申告に基づくもので、タイムスタディに基づいてはいない。「AI」による売上は、統制された測定ではなく相関に基づいて算出されていた。多くの中小企業がまさにこの領域にとどまっている。こうした状況のもと、ガートナーは、2026年の世界のAI支出が2.52兆ドルに達すると予測する。この資金の大きな部分は、リターンを測る明確な方法がないまま投じられてきた。

なぜ多くの企業はAIの成果を測れないのか

AIは、測定の問題を乗り越えた地点から始めなければならない。多くの中小企業には、AIに任せようとしている業務を人間が行うのに要する時間といったベースラインデータが欠けている。このデータがなければ、AIがタスク遂行においてどれだけ時間を節約したのか、その割合を測る術がない。同様に、過去の「人間が作ったキャンペーン」のコンバージョン率を追跡していなければ、AIが生成したものと比較する土台がない。ベースラインが欠落しているのだ。ゆえに、改善を測れる比較も存在しない。

2つ目の問題は、同じ期間に複数の変化が起きた場合、変化の要因にどう「功績」を割り当てる（アトリビューションする）かである。例えば、顧客向けメールに人工知能システムを使いながら、同時期に新しい営業担当者も雇った場合、事業主は、売上増がAIの利用によるものなのか、新しい営業担当者の採用によるものなのか、季節要因なのか、あるいは技術と無関係な市場の変化なのかを判別できない。筆者は以前、AI投資のギャップについて論じた。根本問題は同じである。企業はシステムを購入しているが、導入前に成功の定義がない。

55%という数字は、フォレスターが、多くのAIプロジェクト（55%）が意図した目標を達成できないと予測したものだ。これは必ずしも、取り組みが技術のせいで失敗するという意味ではない。単に、プロジェクト開始時点で成功を測る方法がなかったことを意味する。利用前に「成功」がどう定義されるかを明確にしていないと、有効なツールであっても無効に見えてしまう。同様に、指標上は成功に見えても、その指標が広範で偶発的な出来事まで含むようであれば、組織にほとんど、あるいはまったく価値を加えないまま終わることがある。

中小企業が追跡すべき5つの数字

昨年公開したAIのROIを測定する5つの方法は、今も有効である。だが、QuickBooksのデータは、多くの企業がそれらを追跡していないことを示している。ここでは、どの中小企業でも今週から始められる、簡易なAI測定フレームワークを紹介する。

ibai_metrics_table — 中小企業が追跡すべき5つの数字
Source: Institute Of Business AI

まず、各タスクにどれだけ時間がかかるかを特定する。AIベースで最もよく使うタスクを3つ選ぶ。AIを使う前に同じタスクを完了するのに必要な時間（秒）を記録する。実際のストップウォッチやタイマーで計測する。その後、2つの時間を比較し、時間差に自分の時給を掛けて、節約できた時間を金額換算する。例えば、以前は1.5時間かかっていたタスクが、AI利用で0.33時間になったなら、1.17時間の節約である。事業主の時間を時給100ドルとするなら、1回当たり116ドルの時間節約になる。これらの数字を週次で記録する。

次に、アウトプットの品質である。人工知能が生成した各コンテンツについて、どれだけの編集が必要か（あるいは必要ないか）を追跡する。AIが作ったコンテンツの80%が軽微な調整だけで済むなら、AIツールから価値を得られている。反対に、AIが作ったコンテンツの80%が全面的な書き直しを要し、そのための時間も必要であれば（正味の時間節約がない）、追加の生産性を得ないままワークフローを変えただけである。

3つ目は、AIが支援した活動あたりの売上である。AIで書いたキャンペーンの売上と、人間が下書きしたキャンペーンの売上を、同じ顧客数かつ同じ期間で比較する。両者は、顧客リストやオファーの種類などが比較可能であるべきだ。AIが下書きしたキャンペーンで生み出した売上を、人間が下書きしたキャンペーンと比べた差分が、AIマーケティングのROIとなる。売上に差がない場合、AIの利用はメールマーケティングの文章作成時間を節約したことになるが、それは売上増とはまったく別の価値である。

4つ目は、エラー率である。データ入力処理、簿記、レポート生成などのタスクでAIを使う場合、誤りの修正がどれだけ頻繁に必要かを監視する。現在のエラー率を、手作業で行っていた頃と比較する。以前よりエラーが減っているなら、AIは作業の正確性を高めている可能性が高い。逆に、エラー数が同じか増えていて、しかも全体の作業量が増えているなら、AIが追加の誤りを持ち込み、レビューにより多くの時間が必要になっている。

5つ目は、ツールコストと提供価値の比較である。自社が契約しているAIサブスクリプションすべてに、毎月いくらかかっているかを算出する。次に、その数字を、これまでの測定で文書化された価値（時間節約および／または収入増）で割る。例えば、毎月500ドルをAIに支払い、これらのツールの利用によって毎月2000ドルの追加価値（時間節約および／または収入増）を測定できているなら、ROIは明確だ。しかし、毎月500ドルを支払っているにもかかわらず、見返りとして生み出した金額を一定以上特定できないなら、測定方法を修正するか、使うツールを見直す必要がある。おそらくその両方だ。

測定なき導入がもたらす危険

米国商工会議所は、中小企業の58%が現在、生成AIを利用していると報告している。一方で、93%が2026年に自社事業が成長すると見込んでいる。事業の楽観にとっては朗報だ。しかし、一定の確実性や証拠をもって結果を測れないなら、実証されていないツールに金を使い続けることになる。さらに悪いことに、新しいツールが「以前のツールが解決しなかったかもしれない問題」を解決すると謳うたびに、さらに多くのツールを買いたくなるだろう。

マッキンゼーの2026年AIトラスト調査が示すのは、AIプロジェクトにおいて「信頼のインフラ」（測定やガバナンスを含む）の構築に投資できる企業は、構築をより速く進められ、コンプライアンス上の問題も減らせるということだ。この考え方は、小規模な事業にも当てはまる。中小企業のチームは、AIがどれだけ時間を節約したか、あるいはいくら稼いだかを示すことで、AIに対する「信頼」を育むことができる。

レストランに限らず、他の事業でも似たような結果が報告されている。例えば、ある飲食店経営者は、AIベースの予約サービスを導入した後、予約が20%増えたと話した。彼は、今年5月の予約数と昨年5月の予約数を比較して、この増加を説明した。しかし、Googleのようなサイト上の口コミ活動の変化、食事スペースの数（屋外か屋内か）、比較時点で提供していたメニューといった差異を考慮せずに予約数を比べると、収集されるデータは変数を切り分けられず、エビデンスに基づくデータではなく逸話的なストーリーになってしまう。

中小企業は、人工知能の適切な測定のためにデータサイエンスチームを雇う必要はない。必要なのは規律である。どの指標を測るのか、それらをいつから開始するのかを決める。AIのメールキャンペーンを開始したのと同時期に変更が加えられていないかを確認する。同じ月に新しい営業担当者を採用している可能性も高い。各要素を別々に測定する。営業担当者が生み出した案件の売上を1列に、AIキャンペーンが生み出した売上を別の列に記録する。切り分けは明確さをもたらす。あらゆる指標を1つの塊にまとめ、全体像が良く見えることを期待するべきではない。

QuickBooksが示した77%の導入率は事実である。これらの企業の多くは、AIによって生産性の向上を実感するだろう。しかし、「多く」は事業計画ではない。今後12カ月でAIを活用できる企業とは、（「役に立つと思う」といった）見込みに基づく推測をやめ、数えることを始める企業である。自動化すべきものを3つ特定する。要している時間を記録する。以前と比べて品質を評価する。総売上のうち、AIが行っている仕事からどれだけの割合が生まれているかを算出する。AI利用に伴うコストを算出する。これらの数字が、AIが機能しているかどうかを示す。同じ数字がまた、どこを修正すべきかも示してくれる。

30日間、測定を実行する。良い結果が出れば、この領域に追加投資する判断に必要な証拠が得られる。改善が見られなければ、これ以上1ドルも無駄にする前に、戦略をどう改善できるかを評価する理由になる。いずれにせよ、分かるのだ。多くの企業はいまも推測で動いている。大多数と違う存在であれ。

（forbes.com 原文）