1枚の写真、ある家族に起きた悲劇

ジョン・カハーンは、マイクロソフトの顧客インテリジェンス部門のジェネラルマネジャー。彼のオフィスを訪ねると、1枚の写真が目につく。カハーンと妻、そして3人の娘が、新しい家族の誕生を祝っている写真だ。赤ん坊の毛糸の帽子から、母親と同じ赤毛がのぞいている。
その写真を撮った数時間後、カハーンの元に1本の電話がかかってきた。生まれたばかりの息子アーロンが、呼吸をしなくなったというのだ。数日後、アーロンは死んだ。理由はわからない。乳幼児突然死症候群(SIDS)だ。
カハーンは昨年、生きていれば13歳でバルミツバ(ユダヤ教の男の子の成人式)を祝うはずだったアーロンのために、キリマンジャロ山に登って、SIDS研究と認知度を高めるための資金集めをした。
帰国して会社に行くと、部下たちがサプライズを用意していた。カハーンに秘密で米国の乳幼児の死亡データを集め、アルゴリズムにかけて分析し、SIDSを減らす方法を研究していたのだ。
彼らがそのために費やした時間は計500時間(仕事中ではなく各自の自由時間を使った)。クラウドとソフトウエアツールは、マイクロソフトの慈善部門マイクロソフト・フィランソロピーズの支援で、無料で使うことができた。

かつては不可能だった大規模分析

データ分析と視覚化ツールを使ってトレンドを調べた結果、研究チームはSIDS防止につながりうる有望な情報を得た。
このテクノロジーは、通常ならサティア・ナデラCEO(最高経営責任者)のパフォーマンス指標ダッシュボードを作成したり、ウィンドウズ開発チームが顧客満足度の高いサービスを考案したりするときに使われるものだ。
SIDS研究では、さまざまな要因の相関関係(たとえば妊娠初期に妊婦健診を受けることとSIDSの発症率が低いことなど)を明らかにした。既知のリスク要因(妊娠中の喫煙など)についても、もっと詳細な情報が得られるようになった。
「アーロンが死んだのは13年前だが、SIDSを取り巻く状況は今もさほど変わっていない」と、カハーンは語る。彼は、連邦政府のSIDS研究予算を維持するとともに、研究目的でのデータ開示が認められるようロビー活動も行っている。
「これまでに約5万2000人の乳幼児がSIDSで死んだ。そしてそれと同じ数だけ『理由はわからない』と途方に暮れている親がいる」
マイクロソフトはシアトル小児病院の研究チームと提携している。最終的には研究結果を医学誌やデータサイエンスの学術誌に発表して、臨床プラクティスに影響を与えることを目指している。
「クラウドの処理能力と可視化能力、それにアルゴリズムを大規模にかけることで、たちまち相関関係を発見する能力──。15年前はまったく不可能だったことだ。可能だったとしても、研究室の大部分はIBMの大型コンピューターに場所をとられただろうし、結果が出るまで相当待たなければならなかった」と、カハーンは言う。

データサイエンスは医療分野でも

元IBM幹部のカハーンは、やはり元IBM幹部の妻ヘザーがアーロンを出産したとき、マイクロソフトにきて半年しかたっていなかった。
一家はシアトルにほとんど知り合いがいなかったから、当時のCEOスティーブ・バルマーとジョン・コナーズCFO(最高財務責任者)のチームが、葬儀の手配や医療費の調整をして、最大限に一家の面倒を見てくれた。
妊娠中、ヘザーにもアーロンにも何の問題も見当たらなかったし、死後の病理解剖でも、これといった理由はみつからなかった。だが今、カハーンは病理解剖のファイルを開いて、データ分析に引っかかるヒントがないか調べている。
主任データサイエンティストのホアン・ミゲール・ラビスタは、2013年に上司であるカハーンのオフィス行ったとき、デスクの写真に気がついた。
1週間前に娘が生まれたばかりだったラビスタは、てっきりカハーンの娘が生まれた時の写真だと思って気軽に質問。悲しい答えを聞いて、ラビスタは罪悪感に駆られたという。
いま、ラビスタはSIDSプロジェクトのリーダーを務めている。チームメートのウルスラ・チャジュースカは機械学習の専門家で、かつてインテルで半導体製造工程の不調を見つける担当だった。
通常、機械学習ツールは営業活動の最適化や事業活動の追跡に使われるが、医療分野でも重要な発見を可能にする。「マイクロソフトの事業は、SIDS研究とは大きく異なる。でも、データサイエンスから見ると、なんら違いはない」と、ラビスタは言う。

突然死に共通するリスク要因に注目

アメリカでは毎年、1歳の誕生日を迎える前に死ぬ子が1000人に6人の割合でいる。この6人のうち1人は原因不明の突然死だ。1990年代に、うつぶせ寝をやめさせる「バック・トゥ・スリープ」運動が広がり、乳児死亡数は大幅に減ったが、それ以降は横ばい状態が続いている。
SIDSは病気ではなく、乳児の重要な成長期に複数の要因が重なった状態だと、シアトル小児病院の研究チームを率いる神経科学者のニーノ・ラミレスは言う。最も多いのは生後2カ月のときで、1歳を過ぎるとめったにない。
たとえばSIDSが発症した赤ん坊は、なんらかの要因によって十分な酸素が得られなくなる。そうなると普通の赤ん坊は目を覚ますが、SIDSの赤ん坊は目を覚まさない。こうした複数の要因が重なって、命が失われてしまう。
こうしたケースに共通する要因を見つけるか、こうした要因が発生しやすい赤ん坊を見つけられれば、医者や親はリスク要因を下げる工夫をしたり、特定の赤ん坊にはモニタリングを強化したりできる。
従来のSIDS研究は数百例を調べてきたが、マイクロソフトのチームは米疾病対策センター(CDC)が集めたもっと大量のデータに基づき、相関関係を探すことができる。すでにがんなどの疾病では、こうした機械学習と人工知能(AI)を応用した治療研究が進んでいる。

新生児2900万人のデータを分析

CDCのデータベースには、2004〜2010年にアメリカで生まれたすべての子ども(約2900万人)について、母親妊婦健診を受けた回数、人種、学歴、所得など90項目のデータが蓄積されている。SIDSで死んでしまった子は、その情報も書き込まれている。
マイクロソフトのデータサイエンティストたちは、赤ん坊と親に関する全変数とSIDSとの相関関係を示すインタラクティブなウェブをつくった。
その結果わかったことのひとつは、妊娠第1期に妊婦健診受けた女性から生まれた子はSIDSになるリスクが平均以下だということだ。妊婦健診を受け始める時期がそれよりも遅いと、SIDSのリスクは30〜40%上昇する。
とはいえ、妊婦健診そのものがSIDSのリスク低下に直接つながっているとは限らないと、チャジュースカは言う。
妊娠初期に医者にかかる女性は、妊娠を意識して生活している可能性が高い。医者のアドバイスを受けて、早くから喫煙をやめたり、ビタミン摂取を心がけたりすることがプラスに働く可能性もある。

タバコ1本ごとのリスクまで計算

ただ、このデータに基づき、妊婦健診の無償化など具体的な政策提言が可能になる。
「政治家にデータに基づく対策を求められる」と、ラミレスは言う。「子どもを失ったトラウマは、親が80歳になっても消えないものだ。SIDSで亡くなった子は数百人いるのだから、遺された親へのインパクトも無視できない」
データ分析では、妊婦健診を受ける回数とSIDSの発症率が最も低い乳児の相関関係も発見された。
妊娠中の喫煙がSIDSの発症率を高くすることはかなり前からわかっているが、マイクロソフトのデータ分析では、1日に吸うタバコの本数が1本増えるごとにリスクがどれだけ高まるかまで発見した。完全な禁煙は難しくても、このデータは喫煙量を少なくともどこまで減らすべきか理解する助けになる。
究極的にはオンライン・ワークシートをつくって、医師がデータを入力すれば、その妊婦から生まれる子のSIDS発症リスクを把握できるようにしたいと、ラミレスは考えている。
「SIDSの(研究)領域はさほど大きくない。遺伝学やがん研究は、データサイエンスが大きく変えた。私たちが始めたことも、SIDSの研究を少しずつ変えつつある」
原文はこちら(英語)。
(執筆:Dina Bass記者、翻訳:藤原朝子、写真:cassinga/iStock)
©2017 Bloomberg News
This article was produced in conjuction with IBM.