サイエンス

2025.05.02 13:00

AIの「目」はなぜ見ることができる? 生物の視覚から学んだその歴史をたどる

Shutterstock.com

Shutterstock.com

新しい人工知能(AI)技術を評価する上で最も有用な方法のひとつは、それらが生物学的なデザインをどれくらい模倣できているかを確認することだ。ニューラルネットワークについてよく言及されるように、個々の人工ニューロンやそのレイヤーが、人間の脳にある生物学的ニューロンのように信号をやり取りするという基本的な前提は、初歩的なレベルで理解されている。

advertisement

しかし、それだけではない。人間が行うほぼすべての活動の根幹をなす「視覚」という現象を考えてみよう。視覚の進化と人工知能システムの創造を俯瞰すると、コンピュータービジョンがパズル全体の中でも最大級の要素であろうことが分かる。また、視覚のメカニズムが脳のデザイン(AIの場合はニューラルネットワークのデザイン)とどのように連動するかも理解できるだろう。

AIの視覚の歴史をたどる

長年にわたり、科学者たちは生物学的視覚の歴史を追跡してきた。小さく単純な生物から高度に進化した種へ、そして最終的には生物学的思考の傑作である人間の脳にまで至る道筋を研究している。だが、AIの視覚の進化は主に20世紀後半に進んだものであり、光学文字認識(OCR、Optical Character Recognition)や畳み込みニューラルネットワーク(CNN、Convolutional Neural Network)のような技術が、視野を分析する高度なアプローチをもたらしてきた。

ここでは、筆者の同僚ラメッシュ・ラスカーが、MITのVenturesクラスで講義を行った際のプレゼンテーションを紹介しつつお話ししたい。彼は生物界における視覚の多様性を示しつつ、人工視覚へのアプローチと、その利用の文脈を学生たちに伝えていた。

advertisement

生物学的視覚

ラメッシュによれば、哺乳類の目にはレンズがあるが、ある種の海洋生物にはレンズがなく、代わりに一種の「鏡」に近い構造を持つものがいるという。こうした相違を見ていくと、視覚が機械的にどのように機能するのかが明らかになり、それがコンピュータービジョンにどのように応用されているかも理解できる。

また、私たちが目で見ているものの多くは実際には認知的な過程で補完されており、実際に捉えている情報の空白部分を自分たちが埋めている点も指摘された。「私たちはただ作り上げているだけなのです」と彼は述べ、私たちの視野の組み立て方を、OpenAIのSoraやDALL-Eといった生成モデルに例えた。

要するに、実際の視野は自分が思うよりも狭く、周辺視野は脇に追いやられ、ごく小さな焦点領域があるにすぎない。さらに、視神経の盲点部分も脳が勝手に埋めているわけだ。

次ページ > AIのタイムラインと研究の進化

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事