民間のデータサイエンティストが見た「驚きの内幕」、厚労省のコロナ分析

アルベルトのデータソリューション本部プロジェクト推進部副部長、中村一翔


7人が携わる重要なタスクのひとつが、緊急事態宣言下の「接触の減少」の効果検証だ。クラスター班には、疫学数理モデルの西浦教授や空間統計学の中谷友樹東北大学教授といった専門家がおり、協調して接触の定義を決めている。

「西浦先生や中谷先生に疫学的な観点で検証妥当性などアドバイスをもらいながら、混成チームで分析をしています。我々はデータサイエンティストとして、分析計画を立て、実装や可視化・レポーティングを主に担っています」

中村にとって一番印象に残っているのが5月1日の専門家会議で出された補足資料づくりだ。直前に西浦教授と相談して出すことを決めた。

「専門家会議で出す資料は通常、要約されたものです。しかし、みんなが強い関心を持っているテーマですし、分析結果のプロセスや詳細を開示した方がいいと考えました。クラスター班として現時点でどういうところが見えていて、逆に何が見えていないのか、今後何を改善していきたいのか。みんなに正しく理解してもらうためにも公開に踏み切りました」

短期間で作成した資料は56ページに及ぶ。世界中の技術者が集うギットハブで公開され、誰でも読むことができるが、中村は「ごく一部の熱心な人見るかもしれないな、という気持ちで書いた」。しかし、反響は予想以上だった。

SNS上では、開示を感謝する言葉が寄せられたほか、多くの議論が交わされた。「様々な視点から有意義な指摘もあって、それが我々としては嬉しかったですね。開示して良かったと思いました」

例えば、キヤノングローバル戦略研究所からの指摘。クラスター班とは別の定義で接触度を評価し、レポートを公開している。専門的な内容だが、両者の違いを中村の話からかいつまんで説明したい。

5月1日の資料では、接触の削減効果をおもにNTTドコモの「モバイル空間統計」を使って評価した。1時間単位で500m×500mの範囲(500mメッシュ)で年代別の人口を推計したデータで、緊急事態宣言前と現在で人口の減少を比較し、接触の頻度の増減を分析している。

ここでは500mメッシュの人口に比例する形で接触が起きるという定義になっている。専門用語では頻度依存と呼ばれる、「一人当たりの接触人数は密度に依存せず一定である」という仮定だ。例えば、ある人が渋谷に行って接触する人数は、「渋谷に行った際の接触は連れていく友達2人と、一緒にお店に入った1人の従業員と会話をして、合計3人と接触した」と考えるようなケースである。

しかし、接触の定義次第で、例えばスクランブル交差点でただ通り過ぎただけの人も接触とみなすのであれば、人口密度に比例することになる。人口が半分になれば、さらに各人が接触する人数も半分になり、トータルの接触は滞留人口減少率の二乗に比例して減ることになる。
次ページ > クラスターの早期発見にも活用

文=成相通子 写真=帆足宗洋

ForbesBrandVoice

人気記事