AI

2025.08.06 08:15

Sakana AIとパズル系YouTuberの協業が示すAI開発のかたち

左からCracking The Crypticのマーク・グッドリフ、Sakana AI共同創業者兼CTO(最高技術責任者)のライオン・ジョーンズ、Cracking The Crypticのサイモン・アントニー

左からCracking The Crypticのマーク・グッドリフ、Sakana AI共同創業者兼CTO(最高技術責任者)のライオン・ジョーンズ、Cracking The Crypticのサイモン・アントニー

近年、大規模言語モデル(LLM)の進化は、大量のデータ学習による能力向上から、論理的な思考プロセスを追う「リーズニング(推論)」能力の高さへと焦点が移りつつある。しかし、まだ本当の意味で人間のように考えられる生成AI(人工知能)は現れていない。さらに高い推論能力を効果的に測りつつ、それを人間の洞察力や創造性に近づけるにはどうすればよいか。

推論能力を正確に評価するベンチマークテストの重要性が高まるなか、日本発のAIスタートアップ「Sakana AI(サカナAI)」は、世界的な数字パズルゲームに成長した日本発の「数独(商標:ニコリ)」に着目。ニコリ社の協力のもと、難易度の異なる数独パズルのベンチマークを作成した。

さらにSakana AIは、登録者数が65万人を超えるパズル解説YouTubeチャンネル「Cracking The Cryptic」を主宰するSimon Anthony(サイモン・アントニー;写真右端)、Mark Goodliffe(マーク・グッドリフ;写真左端)に協力を依頼。金融業界出身で、英国代表として世界数独選手権や世界パズル選手権に出場した経験をもつ両氏は、難解なパズルをステップごとに論理的に解説する動画を何千本も投稿してきた。その動画データの提供を受けたのだ。

そして2025年3月、Sakana AIは、AIの多段階かつ創造的な推論能力を測定するため、数独パズルとその派生版を用いたベンチマーク「Sudoku-Bench」を発表(5月には、Sudoku-Benchにおける各AIモデルの性能を評価したリーダーボードを公開している)。今回、サイモンとマーク、そしてプロジェクトを主導したSakana AI共同創業者兼CTO(最高技術責任者)のライオン・ジョーンズが協業した経緯についてForbes JAPANに語った。

このインタビューから、生成AIで進む推論能力の開発のプロセスと、その過程でわかってきた人間の創造性や洞察力、アイデアが生まれる流れに加え、企業と個人が協業する新時代のコラボレーションのかたちが見えてくるのではないだろうか。


次ページ > 「パズルを解くのに必要なすべての推論が一本の動画に含まれている」

文 = 井関庸介 写真 = 能仁広之

advertisement

ForbesBrandVoice

人気記事