AI

2025.12.11 07:56

見て・聞いて・理解する ― マルチモーダルAIが企業IT支援を革新する時代

Adobe Stock

Adobe Stock

Lenin Gali氏は元CIOで、現在はAtomicworkのチーフデジタルオフィサーを務めている。

advertisement

AIが大きな進歩を遂げているにもかかわらず、正直に言って、ほとんどの従業員は職場のチャットボットを信頼していない。

従業員は仮想アシスタントに助けを求めるよう言われるが、彼らはそれを試し、待ち、最も単純な要求さえ理解できずに失敗するのを見てきた。

その疲労感は本物だ。しかし、その感情は変わり始めている。

advertisement

マルチモーダルAI—テキストだけでなく、音声、画像、動画も理解できるシステム—は、企業サポートの仕組みに大きな利点をもたらす。AIアシスタントは実際にエンドユーザーが見ているものを見て、リアルタイムでニーズを聞き、文脈に応じて対応できる。

実際、ガートナーは2030年までに企業ソフトウェアとアプリケーションの80%がマルチモーダルになると予測している。これは従業員が職場のテクノロジーとやり取りする方法の完全な変革であり、この潮流を先取りするCIOはより大きなビジネスの俊敏性を推進することになるだろう。

なぜ今、ITチームにとってマルチモーダルAIが重要なのか

AIモデルは日々進化している。OpenAIのChatGPTであれ、GoogleのGeminiであれ、その開発はユーザーの意図をより正確に理解することを目指している。これらは現在、自然言語、コード、音声、画像、動画を同時に理解し、それらの間をシームレスに切り替えることができるよう開発されている。

では、この消費者世界での利便性を企業の便益に変換してみよう。実際にはどういう意味だろうか?

仮想アシスタントに問題をテキストで説明する代わりに、従業員はエラーメッセージを表示している画面を直接共有できる。一方、GeminiスタイルのマルチモーダルAIは、エラーコードを「見て」、フリーズしたインターフェースを理解し、アプリケーションのコンテキストを認識し、それらすべてを関連付けて文脈に沿ってトラブルシューティングを行う。

ガートナーが述べているように、マルチモーダル生成AIは、これまで文字通り不可能だった機能を可能にすることで企業アプリケーションに革命をもたらし、精度を向上させ、運用を自動化し、彼らが「文脈的意思決定インテリジェンス」と呼ぶものを推進する。

パーソナライズされたエンドユーザーサポートのために聞き、見るAI

マルチモーダルAIは、エンドユーザーサポートを画一的なサービスデスクから、パーソナライズされた、コンテキストを認識する体験へと変革する。ユーザーは、移動中に話す、混乱したときに画面を見せる、複雑な要求をタイプする、あるいは定型タスクのためにAIに代わりに行動してもらうなど、好みのモードでヘルプを得ることができる。

マルチモーダルAIが即時の価値をもたらす3つの一般的な企業シナリオを考えてみよう:

• リアルタイムのトラブルシューティング:クライアントプレゼンテーションの準備をしている営業幹部がディスプレイ接続の問題に遭遇する。チケットを提出してITチームからの対応を待つのではなく、音声対応アシスタントに単純に助けを求める。AIは会議室にいながらセットアップを段階的に案内し、ビジネスの勢いと生産性の両方を維持する。

• アクセス要求の合理化:従業員がキャンペーンのためにマーケティングリソースへのアクセスを必要としている。許可ポータルをナビゲートしたりフォームに記入したりする代わりに、AIがコンテキストを理解し、関連する詳細を事前入力し、必要に応じて承認のために適切にリクエストをルーティングし、完了を確認できるように画面を共有するだけでよい。

• 複雑なソフトウェアオンボーディング:新入社員は企業アプリケーションで急な学習曲線に直面する。AIはセットアップ中に彼らの画面を監視し、特定の環境とペースに適応したパーソナライズされたリアルタイムガイダンスを提供する。彼らの構成に合わない可能性のある一般的なドキュメントの代わりに、彼らが見ていることや行っていることにぴったり対応するコンテキストヘルプを受け取る。

これらの複合モダリティを通じて、解決時間は劇的に短縮され、セルフサービスの採用率が上昇し、ITサポートは生産性のボトルネックから差別化要因へと変わる。ITチームは反応的なチケット管理から積極的なサポートオーケストレーションへとシフトする。

マルチモーダルサポートのためにCIOが正しく行うべきこと

企業サポートのためのマルチモーダルAIを成功裏に展開するには、4つの重要な領域に注意を払う必要がある:

1. コンテキスト知識の統合

マルチモーダルAIは、アクセスできるシステムと理解するコンテキストによってのみ効果を発揮する。CIOはITSMプラットフォーム、HRシステム、ID管理、エンドポイント管理ツール、SaaSアプリケーションとの統合を確保する必要がある。AIはヘルプを要求している人、彼らがアクセスできるシステム、役割に特化したワークフロー、過去の問題を知る必要がある。このコンテキストに基づく基盤がなければ、高度なマルチモーダル機能でさえ、浅く一般的な応答しか提供できない。

2. セキュリティ、プライバシー、ガバナンス

音声と視覚データは新たなセキュリティ上の考慮事項をもたらす。CIOは機密情報のデータマスキング、画面共有と記録のための同意レイヤー、AIアクションの包括的な監査証跡、役割ベースのアクセス制御、AIの幻覚に対するガードレールを実装する必要がある。

3. スケーラビリティとモデル運用

大規模なマルチモーダルAIの管理には堅牢なモデル運用が必要である。これには、モデルが改善されるにつれてのバージョン管理戦略、人間のサポートにエスカレーションする際のコンテキスト引き継ぎメカニズム、AIが限界に達したときのフォールバック手順、品質とコンプライアンスのための継続的なモニタリングが含まれる。

4. 変更管理と採用

技術の展開は戦いの半分に過ぎない。CIOは従業員が日常的なヘルプのためにマルチモーダルサポートを実際に使用するようにすることに焦点を当てる必要がある。これには、アクセス要求、一般的なアプリケーションエラー、オンボーディングタスクなどの影響力が高いが管理可能なワークフローから始める段階的な展開が必要である。成功は明確な価値をすぐに示し、継続的にフィードバックを収集し、実際の使用パターンに基づいて反復することにかかっている。

CIOはまた、マルチモーダルAIを戦略的なレンズを通して評価すべきである:どのワークフローが—向上すれば—単なる効率ではなく、実際に競争上の優位性を生み出すのか?1分速い解決がどこで顧客体験、従業員の生産性、収益の速度を実質的に変えるのか?重要なのはマルチモーダルをあらゆる場所に展開することではなく、差別化された体験が実際に生み出される場所に展開することである。

ITを体験エンジンとして再構築する

CIOにとっての戦略的機会は、運用効率を超えて広がっている(もちろんそれも実現しなければならない)。マルチモーダルAIは、ITサポートの根本的な再構築を可能にし、ITを反応的なヘルプデスクから生産性の積極的な促進者へと変革する。

前進する道は、明確なROIを示すワークフローを小規模に始め、パイロット運用することである。消費者AI体験の容易さと企業ITの摩擦の間の断絶が最も痛みを伴うシナリオを選ぶ。

技術は成熟し、モデルは有能で、労働力はより良いものを期待している。

この変化を受け入れるCIOにとって、マルチモーダルAIは、AIの時代において仕事がどのように行われるかの戦略的な促進者としてITを位置づける機会であり、ヘルプを得ることが家庭でのように職場でも自然に感じられるようになる。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事