画像とテキストを融合し理解する「ビジョン＆ランゲージ」で、製造業DXを目指すオムロンサイニックエックス〜AI ジャイアンツ Vol.3

Forbes JAPAN BrandVoice Studio

著者フォロー

記事を保存

著者フォロー

記事を保存

オムロンサイニックエックスプリンシパルインベスティゲーター牛久祥孝

経営の中枢にAIを取り入れる。PwCコンサルティングが推進する「AI経営」が日本の企業にも浸透し始めている。同ファームマネージングディレクターの馬渕邦美は、キーパーソンとなる“AIジャイアンツ”がその成否の鍵を握っているという。いま、日本の企業で、誰がどのような変革を起こしているのか。日本のデジタル大国化を予見させる変革の現場を紹介する連載企画。第3弾は、オムロンサイニックエックスのプリンシパルインベスティゲーター牛久祥孝。画像を認識した機械が自然な文章でその状況を説明する――。牛久が研究する「ビジョン＆ランゲージ」では、そんなSFのような世界が現実になりつつある。牛久に現在地と目指すビジョンについて話を聞いた。

ディープラーニングの登場で精度が飛躍的に向上

オムロンサイニックエックスは、オムロンの子会社として2018年に設立された研究会社だ。オムロンにはコーポレートR&Dである技術・知財本部があるにもかかわらず、なぜ新たに研究開発を目的とした会社を立ち上げたのか。それは「サイニックエックス」と名付けられた理由を知るとよくわかる。

オムロンの創業者・立石一真は1970年に未来を予測する「サイニック（Seed-Innovation to Need-Impetus Cyclic Evolution）理論」を国際未来学会で発表し、当時すでにコンピュータの発展によるIT革命の到来（情報化社会）を予測していた。同社の社名には、近未来の象徴である「サイニック」に、未知なる技術「エックス」を組み合わせ、新たなコア技術を創出していく決意が込められている。つまり、オムロン本体の研究開発部門が、事業に革新的な商品を生み出す研究と新たな事業開発に取り組んでいるのに対し、オムロンサイニックエックスでは近未来を予測し、その社会を実現するために必要となる技術の研究開発を行っているのだ。

東京大学で教鞭を執っていた牛久祥孝はこのビジョンに共鳴し、同社の立ち上げから関わっている。同社には十数名の研究者が在籍しており、そのいずれもがオムロン本体からではない、多様なキャリアをもった幅広い領域の最先端技術に精通した人材だ。また、グローバルに若手研究者のインターンも積極的に受け入れている。

牛久はもともとコンピュータビジョンを研究していたが、2010年頃から自然言語処理の領域にも足を踏み入れ、ビジョン＆ランゲージへと拡張。画像の内容を説明する文章を生成する「画像キャプション生成」を世界に先駆けて研究するようになる。

ディープラーニングが登場すると画像認識領域と自然言語処理領域の精度は飛躍的に上がった。牛久によると、画像認識領域の従来のエラー率は25％程度で停滞していたが、ディープラーニングの登場によっていきなり15％にまで改善され、その後のさらなる発展によって現在は1％台にまで昇華されている。自然言語処理も同じだ。機械翻訳は、以前は複雑なモジュールを組むことでエラー率を抑制していたが、シンプルなプログラムで同等の精度を出せるようになり、精度は一気に向上した。

両者の進化により、画像キャプションもより複雑な生成が可能になった。例えば人間には瞬時に見つけられないような小さな対象物でも、「あの白い建物の近くに人がいる」といったようなわかりやすい説明が可能になった。

画像について投げかけた質問をAIエンジンが答えることも可能になった。例えばフルーツがたくさんある画像を認識させ、「色が黄色と茶色のフルーツは？」と質問文を入力するとその色をもつ「バナナ」と答えてくれるのだ。この質問の仕方が画像認識の精度をさらに高めるうえでカギとなる。

「画像を認識できる製品やサービスはたくさん生まれていますが、どこまで進化してもユーザーの身の回りのものを100％認識できるようにはなりません。ではどうすればいいかというと、AIエンジン自体がわからないことを聞いてくれればいいのです。ただ、『これはなんですか』だけでは曖昧なので、『犬の横にあるおもちゃはなんですか』といったように具体的に質問させる必要があります。これがAIエンジンでは理解できないラストワンマイルの部分を理解するための質問の仕方で、そういう質問文が出せるような開発をしています」

つまり、AIと人間との対話が可能になるということだ。画像を文章化するだけでなく、文章から画像や動画を探すことも可能で、多くの動画から自分が見たいシーンだけを見つけることもできる。

オムロンサイニックエックスのプリンシパルインベスティゲーター　牛久祥孝

生産プロセスに「変革」をもたらす

牛久は現在、京都大学やクックパッド社などと人の作業を機械が理解して言語化する研究に取り組んでいる。AIエンジンに調理している画像を見せるだけでレシピを生成しようというのだ。牛久がその先に見据えるのは、工業分野への応用だ。

「ものづくりは鉄粉から箱ができたり、石油からタイヤができたりと、多段的プロセスによって成果物ができ上がります。料理も食材の組み合わせによる成果物なので、考え方は同じです。これを工業製品に応用すれば、AIが生産工程を理解して改善の提案をしたり、人がマニュアルと違う行動をしたときに間違いを指摘したりすることができるようになります」

オムロンは世界中のモノづくり現場で生産自動化の支援も行っている。その顧客の工場の生産改善にビジョン＆ランゲージを生かそうというわけだ。そのために取得する情報は、画像にとどまらない。音やセンサーから得られるさまざまなデータも活用し、生産プロセスの改善へとつなげていく。

「例えばタイヤを生産する際、ゴムをどれくらいの温度で加熱したら粘りが出るとか摩擦が起きるといったデータがあれば最適な条件がわかるはずで、『こういうタイヤの性能を出したければこういう生産条件にしたほうがいい』とサジェストすることができます。要件をサプライチェーンにまで広げて、多段のプロセスを理解して改善することも可能です」

さらに改善の対象は、原料開発の段階までさかのぼる。牛久は、材料科学の研究にも携わっている。材料開発は、熟練の技術者が時間をかけて膨大な組み合わせのなかから経験と勘を頼りに最適と思われる解を出す。その作業を機械学習に代替させ、最適な材料の組み合わせを短時間で導き出そうというのだ。

「材料の合成には、どの元素の物質を使い、どのような条件で混ぜるかといったさまざまな要件がありますが、それらのデータを統合して理解できるようなAIを開発していきたいと考えています。ビジョン&ランゲージだけでなく、センシングによって得たさまざまな情報を入力することで最適解を導き出す『マルチモーダルAI』の研究に取り組み、プロセスを改善していきます」

これにオムロンがもつ技術を掛け合わせれば、原料開発の効率はさらに向上する。

「オムロンはロボティクス事業も展開しているので、ロボットを活用し、AIが導き出した仮説に基づいた合成実験を自動で行うことが可能です。AIが自律的に考え、自動で生産までできるようなれば、単なる改善ではなく、パラダイムを変えることになるはずです」

目指すは“研究者の楽園”

牛久がこだわるのは“変革”だ。牛久はオムロンサイニックエックスに籍をおきながら、19年からAIベンチャーのRidge-i社にも参画し、AIを活用した事業“変革”にも挑戦している。DXの必要性が叫ばれて久しいが、牛久は「単なるデジタル化で終わっているケースが多い」と警鐘を鳴らす。牛久によれば、基幹システムによるデータの一元管理は前提条件に過ぎず、次の段階に改善、そして最後にトランスフォーメーション、すなわち変革があるのだ。ただし変革は、人間がデザインするべきだと言う。

「小売業では、店舗で売っていた商品をウェブ上で販売することで、実店舗の存在が必須ではなくなってきましたが、このウェブで販売するEC（electronic commerce）が誕生したのは人間がいたからです。機械学習は極端な話、過去に起きたデータの入出力をより賢くするだけなので、そもそもウェブ販売のデータがないというところからECを発明することはできません。新たな価値を生み出すような業務プロセスを導き出すことは、人間にしかできないのです」

日本ではなかなかそのレベルに到達しない現状に、牛久は焦りを覚える。その原因のひとつには、企業から新しい発想をもった人材が出てきづらいことにあると牛久は指摘する。

「新しい企業がどんどん生まれて、それらの企業が成功する仕組みづくりが必要だと思います。大学でも人材は育ってはいますが、そういった人たちをうまく活用する仕組みはまだまだ足りません。もちろんDX人材やAI人材も大切ですが、本質的に重要なのは、解かなければならない課題を探り当て、本当に必要なソリューションを導き出す思考プロセスです。そうした能力を身につけるための教育に力を入れ、若い人たちが起業しやすい環境づくりや支援が必要ですし、企業がスタートアップの製品やサービスをどんどん活用する文化も必要です」

牛久が理想とするのは、研究と社会実装が両立できる組織だ。

「研究者が思うままに研究した成果を事業化し、そこから出てきた資金と課題が研究者のリソースとなる。私はそんな情報理工学の研究を中心とした研究者の楽園をつくり、研究に没頭できる環境を整えたいのです。若い人たちの研究成果をどんどん社会実装して循環させる。それが人生の野望です」

若い研究者たちが切磋琢磨するオムロンサイニックエックスは、その“研究者の楽園”になる可能性を秘めている。超具体的な“近未来デザイン”を描き、革新技術の創出をタスクとする牛久。その視線には一点の曇りもないようだ。

うしく・よしたか◎東京大学で博士号（情報理工学）取得後、NTTコミュニケーション科学基礎研究所研究員、東京大学講師を経て、2018年、オムロンサイニックエックスに入社。19年、Ridge-iに参画し、取締役Chief Research Ofﬁcerを兼任。

Promoted by PwC Japan / text by Fumihiko Ohashi / photographs by Kiyoshi Hirasawa / edit by Yasumasa Akashi

タグ：

マルチモーダルAI

Forbes JAPANの最新のニュースをお届けします

画像とテキストを融合し理解する「ビジョン＆ランゲージ」で、製造業DXを目指す オムロン サイニックエックス 〜AI ジャイアンツ Vol.3

ディープラーニングの登場で精度が飛躍的に向上

生産プロセスに「変革」をもたらす

目指すは“研究者の楽園”

画像とテキストを融合し理解する「ビジョン＆ランゲージ」で、製造業DXを目指すオムロンサイニックエックス〜AI ジャイアンツ Vol.3