キスシーン識別AIが登場、「行動検知」は動画業界にどう役立つ?

「Sex and the City: The Movie」のワンシーン(Photo by Marcel Thomas/FilmMagic)

ネットフリックスのデータサイエンティスト、Amir Ziai氏が、映画に登場するキスシーンを学習する人工知能(AI)を開発中だという。Ziai氏はスタンフォード大学のAI専攻課程で学位を取得するため同研究(ネットフリックス側は研究に対して経済的支援をしてない)を進めており、その成果を論文共有サイト「ArXiv.org」に掲載している。

Ziai氏が、キスシーンを識別するAIを開発する理由は何か。これまで、人間の顔を判断したり、物体を認識する人工知能の研究は世界各地で盛んに行われてきた。しかしながら、今回の研究のように人間同士の関係性・親密度、特定のアクションを認識するAIの研究はあまり進んでこなかった。

Ziai氏は、いわゆる動画内の俳優の行動、もしくはイベントを解析する技術を確立しようとしているというわけだ。

仮にディープラーニングを使ってキスシーンを自動で判断できるようになれば、動画の編集、評価、動画配信サービスにおけるユーザーへのレコメンドなど、あらゆるシーンで利用できるはずである。もちろん、同研究に一定の成果がでれば、戦争や暴力のシーンや、友情を表すシーン、絶叫シーンなど、他の特定のシーンの識別も可能になっていくだろう。動画配信サービス側からすれば、より正確なビデオの分類やサービス提供にも繋がる。

Ziai氏は、100編のハリウッド映画に登場するスターたちのキスシーンおよび関連オーディオをラベリングする作業を進め、そのデータを使ってディープラーニングアルゴリズムを学習させた。ラベリングの処理は「キスシーン」と「非キスシーン」のふたつ。また、AIが特定の性愛シーンと扇情的なキスシーンの混同することを防止するために、過度な性的シーンはデータから除外している。

なお、今回の研究時には、キスをする際の音や効果音まで研究対象に含むことで、認識システムの精度を高めることができたという。また、研究に際しては画像解析のためのディープランニングモデル「レスネット(ResNet)-18」、音声分析ディープラーニングアルゴリズム「VGGish」が活用されている。結果、非常に高い精度でキスシーンを判別できるようになったという。

動画内の行動を解析する技術は、SNSなどでも活用していけるはずだ。近年、SNSを通じてテロ予告や殺人など犯罪の生中継を行う犯罪者が後を絶たないが、彼らの歪んだ“主張”が伝播するのを防ぐことに一役買うことができるだろう。Ziai氏が発表した研究成果は、人間の行動やアクションを理解・判断するAIの開発にさらに拍車をかけていきそうだ。

連載:AI通信「こんなとこにも人工知能」
過去記事はこちら>>

文=河鐘基

ForbesBrandVoice

人気記事