2016.10.13

遺伝子解析 x AIの威力で「病気になる前に病気を治す」

著者フォロー

記事を保存

宮野悟（Photo by Irwin Wong）

「15年だけでもがんに関する論文は、約20万報が発表されています」と語るのは、東京大学医科学研究所ヒトゲノム解析センター長の宮野悟教授。不治の病と立ち向かうために、多くの研究者たちが、先を競うように治療法や創薬研究に取り組んでいるのだ。

30億文字に上ぼるヒトのゲノム情報を読み解くと？
　
がんはゲノムの変異によって引き起こされる病気だ。ということは、患者のがん細胞を調べれば、ゲノムにどんな変異が起こっているかがわかる。どのような変異が起こっているかを特定できれば、その変異に関する研究を探すことで治療法も見つかる可能性があるー理屈はその通りだ。ところが、これを実際にやろうとすると、かなり面倒な作業となる。

まずゲノム変異を明らかにするために、患者から同意を得てがん細胞のゲノム配列をシークエンサーで読み取る。A、T、C、Gの4文字で綴られたゲノム情報を、スーパーコンピュータで解析できるデータとして取り出すのだ。同時に、正常細胞のゲノムと比較するために、正常なゲノムのデータを取り出す。がん細胞のデータと、正常細胞のデータの差分がゲノム異常の情報となる。これが「がんのゲノムシークエンス」と呼ばれる作業である。ヒトのゲノム情報は、30億文字分にもなる。患者一人のゲノムをすべて決めるためには、膨大な時間とコストが必要だ。

膨大な論文をワトソンが“学習”　個々に合った治療法を提案

シークエンスの結果をスパコンで解析すれば、ゲノムのどこにどんな変異が起こっているかを特定できる。世界には、ゲノムの変異とがんの関係、特定のがんに対して効果的な治療薬に関する膨大なデータがある。研究論文や過去の事例報告は2,000万報を超え、治療薬に関する特許情報も約1,500万件以上ある。

つまり、ゲノム変異を特定し、その異常に関する論文を調べれば、最適な治療法や治療薬が見つかる可能性は高いということだ。実際、これまでは複数の医師がチームを組み、ゲノム情報データと論文データを人海戦術で突き合わせて、病名診断に取り組んできた。けれども、がん研究の論文は既に膨大な数に上り、さらに毎年20万報のペースで積み上がっている。これだけの論文を手作業で読み込み、正しい結論を導き出すのは、もはや不可能と言っていい。

「そこでワトソンの活用を考えたのです。ワトソンは自然言語を理解します。しかも、単に自然言語を扱えるだけでなく、導いた回答の妥当性を自ら検証し、学習します。この自ら学習できる点が極めて重要です。なぜなら、論文に誤りが見つかることも、決して少なくありませんから」（宮野氏）

次ページ＞ワトソンを活用した事例