2023/12/26

【線虫がん検査】反論の「綻び」と奇妙な「追跡調査」

NewsPicks 編集委員 / 科学ジャーナリスト
2023年9月、線虫を使ったがん検査「N-NOSE(エヌノーズ)」に関する深刻な疑惑を、全6回の特集「虚飾のユニコーン」で同僚と共に報じ、たくさんの反響を頂いた。
10月には関連学会のグループによる全国調査も始まり、NewsPicksはもちろん、他の複数のメディアが記事にした。つい先日には、英科学誌『Nature』もこの問題を取り上げた(私も記事の共著者になっている)。
一方、この検査サービスを販売するユニコーン企業「HIROTSUバイオサイエンス」(本社・東京都千代田区)は、疑惑を全面的に否定している。
SNSを駆使し新たな販促キャンペーンを次々と展開し、新テレビCMや第三者割当増資も発表するなど、今も精力的にビジネスを拡大し続けている。2024年には米国でも販売を開始する計画だという。
HIROTSU社のエリック・デ・ルクシオCTO(最高技術責任者)はNature誌の取材に対し、精度に対する懸念を「100%でたらめ(bullshit)だ」と一蹴した。
しかし、同社の反論には大きな綻びがある。さらに、同社が最近発表した高リスク判定者の「追跡調査」は、科学的とは言い難いものだった。
この記事では、反論の中身や「追跡調査」のおかしさを検証した上で、同社が疑惑を払拭するための方法を提案したい。
INDEX
  • 調査報道特集「虚飾のユニコーン」
  • 「感度86%」の根拠論文は?
  • がん患者10人「見逃し」への釈明
  • 奇妙な高リスク者「追跡調査」
  • セラノス事件を彷彿とさせる対応
  • 疑惑を払拭する最良の方法

調査報道特集「虚飾のユニコーン」

本論に入る前に、簡単に特集のおさらいをさせてほしい。
線虫という小さな生き物が、がん患者の尿に近寄り、健康な人の尿からは逃げる性質がある──。N-NOSEは、その前提の下に開発された検査だ。この特性を発見したとした、HIROTSU社の広津崇亮(たかあき)社長らによる2015年の学術論文が出発点になっている(論文発表当時、広津氏は九州大学大学院助教だった)。
少量の尿を提出すると、胃がん、乳がんなど15種類のがんのリスクが一度に判定される。定価は1万4800円。高リスクの判定が出ても、どの部位かや進行度はわからないが、HIROTSU社は「ステージ0、1の段階でも高い感度で検知」できるとうたっている。同社によれば、利用者はすでに50万人を超えたという。
高リスクになった人の多くは「がんかもしれない」と思ってPET検査などの精密検査ができる医療機関に駆け込む。6月の日本がん検診・診断学会では、PET検診/診断を行う3つの医療機関が、N-NOSEをきっかけにPET検査を受けた人の検査結果を発表した。
宮崎鶴田記念クリニック(宮崎市)と西の京病院(奈良市)では、高リスク判定を受けて受診したそれぞれ14人、28人の中で、実際にがんが見つかった人は一人もいなかった。福岡和白PET画像診断クリニック(福岡市、以下「和白クリニック」)では333人中8人(2.4%)、しかも8人中2人は、N-NOSEの判定対象の15種類のがんには含まれない甲状腺がんだった。
さらに衝撃的だったのは宮崎鶴田記念クリニックが発表したもう一つのデータだ。10人のがん患者の尿でN-NOSEを受けたところ、10人全員が低リスクの判定を受けたというのだ。
HIROTSU社は、N-NOSEの感度86.3%、特異度90.8%と高い精度をうたっているが、こうした数字とは明らかに見合わないデータだった。特に10人のがん患者の「見逃し」が示された時には、驚いた人が多かったのか、会場内でざわめきが起きたのを覚えている。
感度:がん患者を正しく高リスクと判定できる割合
特異度:健常者を正しく低リスクと判定できる割合
(いずれもN-NOSEの場合)
特集ではまた、論文の発表直後から開発途中、商業化後までのさまざまな段階で、論文の再現性が取れず、検査の実現性すらも揺るがすデータが出ていたことを、論文の共著者や多くの元社員、関係者らの証言とそれらを裏付ける内部資料に基づき報じた。
詳細については、特集の第1話から第3話までをお読みいただきたい。
前置きが長くなったが、ここからはHIROTSU社の主張や先日発表された「追跡調査」について、次の3つのポイントに絞って解説していこう。

「感度86%」の根拠論文は?

まず指摘したいのは、N-NOSEの「感度86%」の根拠論文が実は存在しない、ということだ。
そもそも、86.3%という数字は2019年に3つの学会発表で医療機関が発表したデータを再集計して得られたものであることは、ホームページ上で明記され、広津社長も私たちのインタビューで認めている。
だがここで、見落とされがちな重要な事実がある。
私たち記者も取材の過程で徐々に気づいたことなのだが、過去の臨床研究で用いられた線虫がん検査と、商業化後の現在のN-NOSEは、「同じ検査」とは言えないのだ。
まず、臨床研究では、シャーレ上に尿検体や線虫を垂らす過程は検査員が手作業で行う。しかし、N-NOSEでは自動検査装置を用い、この作業を機械で行っている。
さらに、判定の仕方も異なる。
臨床研究ではシャーレの左右どちら側に線虫がより多く寄っているかを示す「走性インデックス」の値がゼロを上回るか/下回るかによって陽性か陰性かを判定している。
一方、N-NOSEでは、社内でも数名しか知らないという独自のアルゴリズムに基づいて走性インデックスを解析し、別途、「リスクスケール」と呼ばれる数値を算出、その数値に基づきA〜Eの5段階でがんの罹患リスクを判定する。
リスクが高いか低いかを判定する基準値を「カットオフ」と呼ぶが、臨床研究でのカットオフはゼロに設定されているのに対し、リスクスケールでのカットオフの値は公表されていない。リスクスケールの出し方も、その数値が0〜100のどの値を取るとD・E判定(高リスク)になるのかも、ブラックボックスの中だ。
比較的最近の2021年に発表された論文でも、検査を「N-NOSE」と呼びながら、やはりリスクスケールは使われておらず、走性インデックスのみで陽性か陰性かの判定をしている。
この論文では、カットオフは「暫定的に」0に設定されており、さらに「カットオフを正確に計算するには、将来の大規模な臨床研究が必要だ」とも記されている。
9月19日付でリリースした反論文書で、HIROTSU社はこう主張した。
実用化後、N-NOSEの感度は臨床研究時(86.3%)と変わらない(HIROTSUバイオサイエンス「一部メディアでの報道について」より)
だが、そう言い切る科学的根拠は示されていない。それもそのはずで、自動検査装置とリスクスケールを用いた現在の「N-NOSE」の感度を示す論文は存在しないのである。
N-NOSEの結果報告書にある「リスク比」や「受検者割合」も、根拠となる研究や論文は見当たらない。
なお、私たちは、自動検査装置とリスクスケールを使った実用化後のデータを示す内部資料を取材の過程で入手している。装置の稼働開始から数カ月後の2021年2月下旬にまとめられたもので、がん患者と健常者それぞれの尿を多数回、検査・解析した試験の結果のグラフが含まれている。
驚いたことにこのグラフによれば、がん患者と健常者の結果はほぼ重なっている上に、同じ検体でも検査するごとに高リスクになったり低リスクになったりしている。
ちなみに、特集第1話の後半で紹介したこのグラフについて、HIROTSU社は反論文書の中で「計算方法に誤りのあった資料から抜粋し作成」されたと主張した。しかし、その計算ミスは資料中の全く異なるグラフにあり、記事中の図は修正前後で変更はなかった。

がん患者10人「見逃し」への釈明

6月の学会発表の中でも、特にインパクトのあったがん患者10人の「見逃し」。感度(がん患者を正しく高リスクと判定できる割合)が86%あるなら8〜9人を高リスクと判定できるはずで、0人になる確率は相当低い。
これについて、HIROTSU社は反論文書で次のように釈明している。
実社会ではありえない割合のがん患者の検体を一度に、意図的かつ大量に提出されたことで標準化変換が働き、正確な判断に支障が出た(HIROTSUバイオサイエンス「一部メディアでの報道について」より)
それに続く「解説」によると、N-NOSEでは、同時期に受注した一定数の検査(ターム)ごとに「標準化変換」と呼ばれる独自の補正がかけられている。がん患者の検体が通常より多く含まれていると、その補正が「異常に働くこと」になり、検査結果全体が低リスクに偏るのだという。
また、その補正は「日本のがん罹患率0.86%を前提」に、最も精度良くなるよう行っているという。
これを読む限り、どうやらHIROTSU社では、一つのターム内で高リスク判定者が多く出過ぎないように、カットオフの値をタームごとに調整しているか、あるいは逆に、各検体のリスクスケールの値を調整しているとみられる。
当たり前のように書かれているが、通常の検査ではそんなことはしない。第一、カットオフを変えれば感度や特異度もその都度、変わってしまう。
さらに、検査結果全体が低リスクに偏ったからといって、10人ものがん患者が見逃されたことの理由にはならない。がん患者のリスクスケールは、健常者よりも相対的に高い値になるはずだからだ。
興味深いことに、実は宮崎鶴田記念クリニックは、健常者のボランティア10人の尿も同時期に送っている。同じタームで検査された可能性が高いが、その結果は9人が「低リスク(A、B)」、1人が「中リスク(C)」だった。つまり、がん患者と健常者の結果がほぼ同じだった(むしろ厳密には健常者の方がややリスクが高くなっている)。
HIROTSU社の反論では、そうなった理由も説明がつかない。

奇妙な高リスク者「追跡調査」

HIROTSU社は12月18日、高リスク判定を受けた利用者を独自に「追跡調査」した結果を公開した。高リスク判定をきっかけに病院を受診した228人中、47人ががんの確定診断を受けたという。
だが、このリポートには奇妙な点が幾つもある。
まず、2023年1〜8月に検査結果を通知された人のうち、高リスク判定を受けた利用者が調査対象だというが、検査の運営会社として当然把握しているはずの該当者の人数が示されていない。228人が、高リスク判定を受けた人の何割に当たるのか、そもそも該当者全員に調査依頼をしたのかさえも書かれていないのだ。
次に、47人で診断されたというがんの計15の部位の中には、N-NOSEの検査対象ではない部位が4つも含まれている。調査方法は「インターネット調査、電話調査、面談調査」とあるが、医師の診断書を確認したのかどうかも不明だ。
調査対象時期にN-NOSEで高リスク判定を受けたある利用者は、HIROTSU社から10月初旬にこんなメールを受け取ったという。
(画像:N-NOSE利用者提供)
見ての通り、がんが発見されたと申告すると3万円分のギフト券を贈るという内容だ。申請フォームでは診断書の提出は求められていなかったという。ギフト券欲しさにがんと偽って申請する人がいてもおかしくはない。
もしも「応援金制度」の申請者の情報が「追跡調査」のために使われたとしたら、とても公正な調査とは言えない。
私は前述の疑問に加え、「調査にあたり、利用者との間で金銭や賞品、景品などのやりとりは発生していないか」を尋ねる質問をHIROTSU社の広報にメールで送ったが、返信はなかった。
その代わりに、HIROTSU社の代理人弁護士からNewsPicksを運営するユーザベース社の代理人弁護士に「取材のご依頼には応じかねる」とする文書が送られてきた。「引き続き係争状態にある」ことが理由だという。

セラノス事件を彷彿とさせる対応

それが新たなリリースへの問い合わせに回答しない理由になるのかは別として、係争中であることは事実だ。
簡単に経緯を記すと、HIROTSU社は9月下旬、名誉毀損を理由に特集第1話の記事削除を求める仮処分命令の申し立てを行った。非公開の審議が進んでいたのだが、同社は裁判所の結論が出る前に申請を取り下げた。
そして12月19日、ユーザベース社と記者に対し、謝罪広告と損害賠償を求め、東京地裁に提訴したという(訴状はまだ手元に届いていない)。
HIROTSU社は、取材に協力した元社員に対しても法的手段を取るとしている。
特集第2話で紹介したように、取材の過程で、米国で起きたセラノス事件との類似性を指摘する声をたびたび耳にした。HIROTSU社はこれについても反論文書で強く否定したが、批判的な報道への対応はまさにセラノス社を彷彿とさせる。
セラノス事件:「数滴の血液でさまざまな疾患を調べられる画期的な装置を開発した」とうたった米医療ベンチャー「セラノス」による詐欺事件。技術の実体はなかったが、政財界の大物が投資し、時価総額は90億ドルを超えた。創業者のエリザベス・ホームズは2022年、投資家に対する詐欺罪などで禁錮11年3カ月の判決を言い渡された。
セラノス創業者のエリザベス・ホームズ。「次のスティーブ・ジョブズ」ともてはやされたが、社内では徹底した不正隠蔽工作を行なっていたという。2015年撮影(写真:AP/アフロ)
セラノス社も、疑惑を最初に報じたウォール・ストリート・ジャーナル紙の第一報が出た後、記事の取り下げを要求した。また、内部告発した元社員に対しても訴訟を起こした。

疑惑を払拭する最良の方法

しかし、疑惑を払拭する最良の手段は、科学的とは認められないような「追跡調査」をすることでも、メディアや元社員を相手に訴訟を起こすことでもない。
最も簡単なのは、まず公開の場で、外部の研究機関に依頼し、あるいは第三者立ち会いの下で「ブラインド検査」を行うことだろう。尿検体ががん患者のものか、健常者のものかわからない状態で線虫がん検査を実施するのだ。
複数の元社員の証言によれば、広津社長はブラインド検査をかたくなに嫌がっていたようだが、インタビューで語ったような技術への絶対的な自信があるならば難しいことではないはずだ。
ただし、最初の論文の再現性が公開実験で確かめられたとしても、Point1で指摘したように、自動検査装置とリスクスケールを用いた現在のN-NOSEの実用性を証明したことにはならない。実際のN-NOSEを使った新たな臨床研究を計画するべきだ。
最後に、私たち取材班がこの問題を追いかけてきた理由を改めて記しておきたい。
N-NOSEで高リスク判定になった場合、精密検査は全額自己負担になる。がんではないのに高リスクになった人は、本来は必要のない大きな経済的・心理的負担を負う。侵襲性の高い精密検査の場合は、そこに肉体的な負担も加わる。
より深刻なのはがんが見逃された場合だ。治療の遅れにつながり、予後に悪影響を与える可能性がある。
任意で受ける民間サービスとはいえ、利用者の生活や命に大きな影響を与えうる検査なのだ。法的リスクを恐れながらも、多くの元社員らが取材に協力してくれた理由もそこにある。
もう一つの重要な観点は、N-NOSEは、広津社長らの最初の論文や、多くの医療機関と組んだ臨床研究の学会・論文発表などの「科学的根拠」をアピールしながら発展してきたということだ。
果たして日本のディープテックの育成環境は健全なのか。N-NOSE問題は、そんな問いを投げかけているように思えてならない。
取材はもちろん、これからも続けていくつもりだ。