サイエンス

2025.05.02 13:00

AIの「目」はなぜ見ることができる? 生物の視覚から学んだその歴史をたどる

Shutterstock.com

AIのタイムライン

続いてラメッシュは、1980年代の画像処理技術であるエッジ検出のような進歩について取り上げ、それが生物学上の基礎原理とどのように対応しているかを解説した。たとえば、目の錐体(すいたい)は明度を処理し、杆体(かんたい)は動きを処理するなど、それぞれの働きに応じたフィルターが存在すると説明。また、20世紀中頃に訪れた「AIの冬」と呼ばれる投資不足の時期にもかかわらず、視覚の研究は続いていたことにも言及している。

advertisement

研究の進化

1969年、ミンスキーとパパートのPerceptron(パーセプトロン)の研究が発端となり、人々は古典的手法と新しい技術を使って、顔認識(画像に人間の顔があるかどうかを検出するもので、個人特定ではない)などを行うようになった。

「もし顔を検出する必要があるなら、上のほうが空白で、その下に少し暗い部分(目のあたり)があって、真ん中に縦線があり、さらにもう1本線があるかどうかを探せばいいんです」と彼は言った。「ほとんど漫画のようですが、こうした構造が特定の形で現れるかどうかが鍵なのです」。

こうした手法では、ピクセルをどのように評価し、分析して結果を導くか、さらにはグルーピングやマッチング、CNNの層を作る方法などが用いられた。ラメッシュは、1970年代後半に福島邦彦が提唱したネオコグニトロンの貢献にも触れ、それが強力なコンピュータービジョンの時代を切り開いたと述べた。

advertisement

新しい視覚と学習モデル

さらに最近では、初期のコンピュータービジョンや学習のアイデアを踏まえて、ジェフ・ヒントンやヤン・ルカンといった人物が、より精緻なネットワークの成果を追求していると紹介した。

技術面では、トランスフォーマーのような「アテンションメカニズム」が近年注目されている。これは「実際に見えている情報をもとに推定を行う」という視覚本来の働きに立ち返るデザインともいえる。

「歴史を知っておいてほしいのは、今後どのように展開していくかを見極める上で重要だからです」と彼は教室で語った。

私が興味深いと感じたのは、現代社会におけるAIシステムを評価する際、こうした進化の過程がAIの使い方を方向づけているという点だ。このプロセスを理解することは欠かせない。学生たちがこの道のりを学び、コンピュータービジョンの背景をさらに知っていく様子を見るのはうれしかった。もしより新しいAIの概念を応用しようと考えているなら、この進化のプロセスと歴史的文脈に目を向ける時間をとってほしい。

forbes.com 原文

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事