2018.07.11

「知らないことすら知らない」誤差の範囲内

シバタアキラ | Official Columnist DataRobot Japanチーフデータサイエンティスト/物理学博士

著者フォロー

記事を保存

shutterstock.com

山好きが高じて、最近週末や休日には岩や氷などの垂直な壁に取り付いています。

「うそー、それって危なくない？」とよく言われますが、実際、とても危険なアクティビティーです。登る技術や持久力と合わせて、危険を回避するリスク管理が、アルパインクライミングそのものであると言っても過言ではありません。

そんなアルパインクライマーに広く読まれている著書に、ビット・シューベルトの「生と死の分岐点」があります。ここ百年余りのスポーツクライミングの歴史において起こった様々な事故を検証し、なぜ起こったのか、どうやってそのような事故を防ぐよう対処出来るのか、実例と考察に富んだ内容です。

安全だと信じられていた技術や道具に欠陥が見つかったり、「まさかそんなミスを犯してしまうのか！」と思うような例が多いことに驚きます。その中で印象的だった一説：

“ NASAでの研究の結果、理論的に起こりうる間違いはいつかは必ず起きることが証明されている。間違いはどこか遠いところで起きるものではなく、人間ならば誰でも犯す可能性を持っている ”

高く険しい山を登るには、登る技術そのものを極めることと、生きて帰ってくるためのリスク管理を切り離して考えず、常に正常の外側を想定して十分な安全マージンを残した行動をすることが求められます。一方で、危険は多くの場合想像の外側にあるため、間違いが起こりうる可能性を網羅し、“自分が知らないことすら知らないような領域”を狭めなければ、常に有限の確率で存在し続けます。

私が素粒子物理学の分野で科学者として働いていた頃から10年余りが経ちます。この分野はその半世紀余りの歴史の中で、加速器からのデータの分析によって実験的に理論の検証を行う手法を確立してきていました。現在「データサイエンス」と言われる技術にもその多くが包含されています。

加速器による衝突実験は大量のデータを生み出すだけでなく、検証対象となる量子場現象の特性上、かつてから統計的なデータモデリング手法が必要とされてきました。「統計的なデータモデリング」とは、一回一回の事象から生成されるデータでは是非を問えないような問題に対し、複数回の実験の結果で推定することです。

例えば、明日私が八ヶ岳に登るかを予測することは難しかったとしても、ゴールデンウィークに高速道路が混雑する度合いはある程度正確に予測することが出来ることには誰もが馴染みがあるでしょう。そのような予測を行うために、最近では機械学習などの先端手法も含め、様々な方法で精度向上が試みられています。

前述のクライミングにたとえて言うと、登る技術＝モデルの精度を少しでも高める辛くも華々しい努力、リスク管理＝モデルの信頼性の理解からどこまでそのモデルに頼ってよいのかの解釈、という対比が成立します。

次ページ＞未来は予測しきれない

文＝シバタアキラ

タグ：

Forbes JAPANの最新のニュースをお届けします

「知らないことすら知らない」誤差の範囲内

関連記事