個人が自身のデータを所有し、それをテック企業に貸し出すという「データ所有権」の発想でプライバシーを守ることは難しい。いまこそ基本的な権利としての「データ権」を確立する必要がある。
就職を妨げた「酒類購入履歴」
ときは2023年の夏。レイチェルはお金に困っていた。ある夜、バーでお酒を飲みながら、携帯電話で職探しをしていると、メールが届いた。肝機能を研究している研究者が、バーのポイント会員の中から彼女の名前を見つけたのだ。
レイチェルはナチョスのハッピー・アワー割引キャンペーンに応募していた。研究者は、レイチェルの携帯電話の健康データにアクセスさせてくれれば、週50ドルの報酬を支払い、向こう3カ月にわたってバーの飲み代を負担してくれるという。
最初、レイチェルはプライバシーの侵害に腹を立てた。だが、お金が必要だ。
だから携帯電話に向かってうなずいた。うなずきは、微妙ではあるが明確な同意のジェスチャーであり、署名と同じ法的拘束力を持っている。そして、彼女はナチョスをつまみながら職探しを再開した。
だが、夏も終わりに近づくと、レイチェルは、友人が1人、また1人と仕事にありついているのに、自分は次から次へと採用の扉を閉ざされていることにいやでも気付かされた。
細かい字で書かれた条項の細目を読まなかったせいで、知らないうちに調査研究の一部のデータが彼女の酒類購入履歴とともに、大手人材紹介会社の手に渡ってしまったのだ。
いまや、人材紹介会社に送られた応募書類を選考するすべての雇用側企業は、彼女のプロファイルが「うつ病で信頼できない」となっていることを知っている。彼女の就職が決まらないのも不思議ではない。
だが、たとえこのようなプロファイルを彼女が知ったところで、どこに助けを求めればよいのだろうか。
「データ所有権」には欠陥がある
この記事を読んでいる人も、オンラインで文章を読んだり、ショッピングしたり、自分の運動記録をつけたり、あるいは、ポケットに携帯電話を入れてどこかに行ったりしただけのことで、レイチェルのように、今日1日分のデータを大量に生成した可能性がある。
そのデータの一部は自分自身が意図的に作成したものだが、大半は、同意を得ていないのはもちろんのこと、自分が知らないうちに自分自身の行動によって生成されたものだ。
ここ数十年でデータが急増したことから、一部の改革論者は「自分のデータは自分のもの!」というスローガンを唱えるようになった。
とりわけシカゴ大学のエリック・ポズナー教授、マイクロソフト・リサーチのエリック・グレイン・ワイル博士、「実質現実(VR)の父」と呼ばれるジャロン・ラニアーは、データを所有物として扱うべきだと主張している。
フェイスブックの創業者のマーク・ザッカーバーグ最高経営責任者(CEO)も同じことを言っている。フェイスブックの利用者は「フェイスブックに投稿したすべての連絡先や情報」を所有しており、「それを共有する方法を管理できる」とフェイスブックは最近になって述べている。
フィナンシャル・タイムズ(FT)紙は「フェイスブックが述べていることの重要な部分は、消費者自身の個人データの所有権を自分自身が持てることにある」と論じている。アップルのティム・クックCEOも、最近の講演で同様に「企業はデータがユーザーの所有物であることを認めるべきだ」と話している。
この記事では、「データ所有権」がデータについて欠陥のある、非生産的な考え方であることを主張する。データ所有権という考え方は既存の問題を解決しないばかりか、新しい問題を生み出す。
私たちはデータ所有権の代わりに、自らデータ所有権を取得しなくても自分のデータが利用される方法を規定できる権利を持てる枠組みを必要としている。
ハワイ州選出のブライアン・シャッツ上院議員(民主党)によって2018年12月12日に提出された議案である「データ・ケア法(Data Care Act)」は、細目の制定次第では、データ利用方法を規定できる権利に向けた望ましい第一歩になる。
議案の共同提出者の1人であるアラバマ州選出のダグ・ジョーンズ上院議員(民主党)は次のように語る。「オンライン・プライバシーとセキュリティの権利は基本的な権利であるべきです」
「所有権」という概念は、データに対する権限と支配力を人々が持つことを示唆しており、魅力的だ。だが、データを所有し、「貸し出す」というのは悪いアナロジーだ。特定の一部のデータがどのように使われるかを管理することは、多くの問題の1つにすぎない。本当の問題は、データがどのように社会と個人を形作るかだ。
レイチェルの物語は、なぜデータ権が重要なのか、そして、どのようにすれば個人としてのレイチェルだけでなく、社会全体も保護するようにデータ権を機能させるかを教えてくれる。
「デジタルの影」は所有できない
データ所有権が欠陥のある概念である理由を理解するために、まず、いま読んでいるこの記事について考えてみよう。
電子デバイス上でこの記事のページを開く行為そのものがデータを生成する。生成されるデータは、ブラウザーの閲覧履歴の項目、Webサイトが読者のブラウザーに送信したクッキー、読者のIPアドレスからの訪問を記録するWebサイトのサーバー・ログなどだ。
「デジタルの影」を残さずにオンラインで何かをすることは事実上不可能だ。オンラインで記事を読むことしかり、オンライン・ショッピングしかり、インターネットに接続された携帯電話をポケットに入れてどこかに移動することしかりだ。
晴れた日に人につきまとう、つかの間の影を所有できないのと同じで、たとえば、自転車を所有するように、こうした影を所有できない。
個人のデータは単体ではマーケティング担当者や保険会社にとってそれほど役に立たない。だが、何千人もの人々の同様のデータと併せて分析することで、個人データがアルゴリズムを生み出し、ある人を(「飲酒習慣のあるヘビースモーカー」や「必ず時間を守る健康なランナー」などとして)分類する。
たとえば、偏ったデータセットでアルゴリズムが訓練されたために、あるいは単に特定の個人データが異常値だったために、アルゴリズムがその人を誤って「健康リスクあり」と分類するなどアルゴリズムが不当なものだったら、自分のデータを「所有」していてもアルゴリズムは正しくならない。
アルゴリズムの影響を受けることを避ける唯一の方法は、絶対に誰にも自分のデータにアクセスさせないことだ。
だが、たとえある人が自分に関するデータを隠匿しようとしても、他の人々に関する膨大な量のデータにアクセスできる企業や政府は、そのデータを利用して(特定の)個人について推論を下せる。
データは真実の公平な印象ではない。データの生成と消費は、権限が社会でどのように配分されているかを反映している。
データを非公開にする選択は有効か
もちろん、人は自分のデータが自分に不利益をもたらさないようにするために、すべての自分のデータを非公開にする方法を選択できる。だが、この戦略をとると自分のデータを利用させることで得られる利益を失う恐れがあるかもしれない。
たとえば、スマートフォンのカーナビ・アプリを利用して運転しているとき、リアルタイムで匿名化された情報を共有するが、その情報は正確な交通状況として生まれ変わる(今日午前8時16分に家を出れば26分で職場に着くなど)。
そのデータ1つ1つはプライベートなデータであり、ある人がどこにいるかは赤の他人に分からないが、多数のデータが累積的することで集合的な価値が生まれる。
この例は、集約された全体としてのデータが、データを構成する個別のビットやバイトとは性質が根本的に異なることを示している。データ所有権に関する善意の主張でさえ、個人が自分のデータをきちんと規制すれば、良い社会的成果が得られることを前提としている。
しかし、その前提は間違っている。誰がデータにアクセスするかを制御しても、データの不当な利用に関する問題の多くは解決できないのだ。
たとえば、米国の特定の管轄区域の裁判官は、アルゴリズムによって生成された「リスク・スコア(risk score)」を利用して保釈や量刑を決定している。この種のソフトウェア・プログラムは、ある人物が将来犯罪を犯す可能性を予測する。
人口統計学的に自分と似通った人が犯罪者や保釈中失踪者である場合が多いことを理由に、アルゴリズムが99%の確率で別の犯罪を犯すか、将来保釈中に裁判所に出頭しないと予測したと想像してみよう。
その判断は不当かもしれないが、自分の人口統計学的プロファイルまたは犯罪歴を「所有」し(ていたとしても)、法曹関係者がそれを見ることを拒否できない。「あなたの」データの利用の同意を「あなたが」拒否しても、組織は他の人々に関するデータを使って「あなたに」影響を及ぼす統計的推定ができる。
この例は、データが権限の問題であることを浮き彫りにしている。罪に問われた人や有罪判決を受けた人は、一般に保釈や量刑に関する決定を下す人より権限が少ない。
同様に、データの不当な利用に対する既存の解決策は、誰がデータにアクセスできるかではなく、どのようにデータが使われるかに関する規制を伴うことが多い。
たとえば、米国の「医療保険制度改革法(ACA)」に基づいて、健康保険会社は加入者に既往歴があるという理由だけで補償を拒否したり保険料を高くしたりできない。
政府は保険会社が患者に関するデータを保有することは禁止していないが、患者のデータを無視するように保険会社に命じている。ある人は糖尿病であるという事実を「所有」してはいないが、糖尿病を理由に差別されない権利を保有できる。
基本的な権利としての「データ権」
「同意」はデータの利用に関して尊重すべき基本原則だと言われることがよくある。だが、健康保険会社が既往歴に関するデータ利用を阻止する政府の規制がなければ、個々の消費者は同意を拒否する能力を持っていない。
個々の消費者がその能力を持っていない理由は、保険会社の方が消費者より大きな権限を握っているからだ。はっきり言えば、同意は機能しないのだ。
データ権はプライバシーを保護するものであり、プライバシーが社会から個人を守る受動的な権利ではないという事実を説明する必要がある。プライバシーとは、商売とも政府の規制とも無縁なところで自己を構築する自由に関する問題だ。だが、データ権は、プライバシーだけの問題ではない。
たとえば言論の自由に対する権利といった権利と同様に、データ権は基本的に、現代社会に参加しながら個人の自由と営みのための場を確保することに関する問題だ。米国の既存の権利章典と同様に、その細目は基本原則に従って決定する必要がある。
そのような原則を言明する試みは、すぐ時代遅れになるかもしれない「オプトイン(事前選択型)の同意モデル」などの雑草のようなものに絡め取られて往々にして行き詰まる。
各国の法制度に適合するような方法で、明確かつ広範な原則を制定することが世界中で必要とされている。米国についていえば、法の下の平等な保護や「不当な押収及び捜査」の禁止のような既存の憲法の条項では不十分だ。
たとえば、公の場で、ある人の移動を継続的で執拗に追跡することを「捜査」だと主張することは難しい。それでも、そのような監視は必要以上の干渉を引き起こす「不当な捜査」に匹敵する。18世紀の法文を21世紀のテクノロジーに適用する好都合な解釈を、裁判所が思い付くことを期待するだけでは不十分だ。
データ権法案には次のような権利を含める必要がある。
・不当な監視から身を守る人々の権利は侵害されない。
・何人も、自分の行動を密かに操られることがない。
・何人も、データに基づいて不当に差別されることがない。
これらは決して、永続的かつ効果的な法案が必要とするすべての条項ではない。これらは端緒とするためのものであり、データ権に関する文書が必要とする、ある種の明瞭性と普遍性の例でもある。
レイチェルのような人々の状況を改善するために、データ権法案は法案が定める権利を守るための新しい機関と法的措置を必要とするだろう。連邦政府はそれらの権利を保護し、権利の範囲を定める必要がある。2018年のEU一般データ保護規則(GDPR)はそれを始めている。
新しいデータ権のインフラ(基盤)はさらにその先を行き、委員会、データ共同組合(利用者に代わって集団行動を起こしたり意見を主張したりできる)、倫理的データ証明スキーム、データ権専門の訴訟弁護士および監査人、一般社会からの受託者として行動しデータが生活に及ぼす可能性がある複雑な影響を解析できるデータ代理人を含める必要がある。
データ権が保護された未来の話
データ権の保護がない未来はどのようなものになるだろうか。ここでレイチェルのむなしい職探しに話を戻そう。
「うつ病で信頼できない」という彼女の性格付は正しいかもしれないし、正しくないかもしれない。アルゴリズムがミスを犯しただけかもしれない。レイチェルは健康そのもので、仕事に就く能力がある。
だが、アルゴリズムが改良され、もっと大量のデータセットを利用するようになるにつれて、アルゴリズムが間違いを犯す可能性はどんどん低くなる。だからと言って、アルゴリズムはより公正になるだろうか。
レイチェルが少々うつ病傾向にあるからといってどうなのだろうか。好条件の仕事に就くことがうつ病を克服する助けになったかもしれない。
だがそれどころか、彼女のプロファイルはたちまち自己実現的な予言になる。仕事に就けないため、彼女は本当にうつ病になり、信頼できない人間になってしまうということだ。
データ権の保護がもっと強力になった世界で、レイチェルの抱えるジレンマがどうなるかを考えてみよう。
彼女は肝機能の研究への参加に同意するが、彼女が契約条項を読んでいる間に、アルゴリズムのデータ代理人が問題にフラグを付ける。これはアルゴリズムの管理者がコンピューター・ウイルスやスパムからコンピューターを守る仕組みにどこか似ている。
問題にフラグが付けられた後、監査人チームはその問題の照会を受けて、(仮想未来の)地域のデータ権委員会に問題を報告する。監査人チームは研究に使われているアルゴリズムを調査し、雇用プロファイリングとのリンクを発見する。
委員会はレイチェルがプロファイリングされたと断定する。雇用平等法の新たに確立された解釈と(2022年に可決した)データ権法のおかげで、そのようなプロファイリングはいまや明らかに違法である。
レイチェルが自ら措置を講じる必要はない。委員会は不正なデータ業務を理由として研究者に制裁措置を科す。
新たなパラダイムを構築するために
微量の二酸化炭素がほとんど検出不能であり、取り立てて言うほどの環境被害を及ぼさないのと同様に、徐々に起こるプライバシーの侵害は気付きにくく、誰かに害を及ぼすこともほとんどない。
すでに述べたように「データ所有権」は有害な結果を招く範疇錯誤である。自分のデータの大半は所有できない。たとえ所有できたとしても、たいていの場合、データを所有することで不当行為から自分を守る効果はない。
では、なぜデータ所有権という概念がこれほど人気の高い解決策になっているのか。その答えは、政策専門家やテクノロジストが往々にして「データ資本主義」という概念を暗黙のうちに受け入れていることにある。
彼らはデータを資本の源(たとえば、フェイスブックはユーザー関するデータをターゲティング広告に利用している)または労働の成果(たとえば、自分に関して生成されたデータに対してその人は支払いを受けるべきということ)のどちらかと見なしている。
データはそのどちらでもない。自転車、石油、お金について考えるのと同じようにデータについて考えていたのでは、データ時代に市民、国家、民間部門の間の関係がどれほど根深いところで変化したかをとらえることはできない。
私たちが公正な21世紀の政治形態を作り出したいのであれば、データとは何か、そしてデータにはどのような権利が相応しいのかを理解するための新しいパラダイムが喫緊に必要とされる。
このパラダイムでは、環境問題のアナロジーを有益な形で利用できるかもしれない。つまり、1つ1つは害のない少量の汚染が破滅的な集合的結果を招く、温室効果ガスやその他の外部要因に類似したものとしてデータを考えるのだ。
大半の人がきれいな空気を吸えることを大事にするのと同様に、自分自身のプライバシーを大事にする。微量の二酸化炭素がほとんど検出不能であり、取り立てていうほどの環境被害を及ぼさないのと同様に、徐々に起こるプライバシーの侵害は気付きにくく、誰かに害を及ぼすこともほとんどない。
だが全体として、大量の温室効果ガスが環境に根本的な被害を及ぼすように、プライバシーの性質の大規模な変容は社会構造に根本的な被害を及ぼす。
この被害を理解するには、新しいパラダイムが必要だ。このパラダイムでは、家族として、友人として、同僚として、消費者として、市民としての私たち個人同士の関係を、私たちの周りを取り巻くデータがどのように変えるかをとらえる必要がある。
そうするには、人々がデータ権を持っており、政府はその権利を守る必要があるという基本的理解にこのパラダイムが根差していなければならない。
目指す道には課題が多い。データ権を巡る技術基盤も法的基盤も一筋縄ではない。どのような権利が存在するかに関する意見の一致を見ることは困難だろう。それより難しいのは、それらの権利を守るための新しい法律や規制を制定することだろう。
米議会での現在の議論で見られるように、利益団体と業界のロビイストが重要な細目を巡って言い争うだろう。どこでバランスを取るかは、国によって異なるだろう。だが、強力で活気あるデータ権の基盤なしに、開かれた民主的な社会は生き残れない。
筆者のマーティン・ティスネは、オミダイア・グループ(Omidyar Group)傘下の世界的な慈善団体ルミネイト(Luminate)の常務理事。@martintisneというアカウントでツイートしている。オミダイア・グループはイーベイ(eBay)を創設したピエール・オミディアとその妻パメラが主宰している慈善投資団体である。
原文はこちら(英語)。
(執筆:マーティン・ティスネ/米国版、写真:matejmo/iStock)
This article is provided by MIT TECHNOLOGY REVIEW Japan. Copyright © 2019, MIT TECHNOLOGY REVIEW Japan. All rights reserved.
この記事は、株式会社KADOKAWAが、米Technology Review社との許諾契約に基づき、再許諾しました。一部の見出し、写真等は株式会社ニューズピックス等の著作物である場合があります。