昨年も参加84チーム中、中国勢が上位を独占している。グーグルは2014年に優勝して以降、ImageNetに参加していない。過去2年の成績を見る限り、中国がAI分野で世界のリーダーに君臨する日はそう遠くないかもしれない。
今年のImageNetでは、WMWというチームが「squeeze and excitation」という新技術を開発し、画像識別タスクで前年記録のエラー率2.99%をわずかに上回る2.25%を達成した。WMWのメンバーには、北京に本拠を置く自動運転スタートアップ「Momenta」の研究者であるJie HuとGang Sunのほか、オックスフォード大学のLi Shenが含まれる。
物体検出タスク(コンピュータが物体を認識し、画像から識別するタスク)では、DBATというチームが、前年記録の正解率66.3%を大きく上回る73.1%を達成して優勝した。DBATは、南京大学の研究者8名とインペリアル・カレッジ・ロンドンの研究者2名で構成される。
ImageNet(別名Large Scale Visual Recognition Challenge)は2010年にスタートして以降、AI分野で最も影響力の強いイベントになった。特に2012年大会はAIやディープラーニングにとって大きな転換期を迎えた年で、トロント大学博士課程に在籍するAlex Krizhevsky率いるチームが画像識別でエラー率15%を達成し、前年記録の25%から飛躍的な向上を実現した。
ディープラーニングの最先端を競う
彼らが開発した「AlexNet」というモデルによって、ディープラーニングの能力の高さが証明された。ディープラーニングは1950年代から存在していたが、それまでは真剣に扱われてこなかった。(Krizhevskyと、彼のアドバイザーでAIのパイオニアであるGeoffrey Hintonは、現在グーグルのAIラボに勤務している)
「2012年は、AIにとって大きなブレークスルーとなったと同時に、何十年も前から存在したディープラーニングモデルの概念実証がなされた年だった。これらのAIシステムが大規模な画像認識タスクにおいて機能することが初めて証明された」とプリンストン大学教授でImageNetの主催者であるOlga Russakovskyは話す。