データ・アセンブラージ:理論、実践と批判的展望
1. 理論的枠組み – アセンブラージ理論とデータへの応用
データ・アセンブラージ(data assemblage)とは、データの生成・流通・利用を取り巻く一連の異種要素が集まり構成された社会-技術的集合体を指す概念である。Critical Data Studies(クリティカル・データ研究)の文脈では、この概念が中核的な役割を果たしており、Iliadis & Russo (2016) はデータ・アセンブラージを「データの生成、流通、展開を構成し枠付ける技術的・政治的・社会的・経済的装置と要素」と定義している。言い換えれば、データそのものとそれを取り巻くシステム・環境は相互に構成し合っており、特定の文脈における物質的・言説的な実践と関係性によってともに形作られる。このようにデータ・アセンブラージの視点は、データを純粋な客観的事実ではなく、様々な要因が絡み合って生み出されるものと捉える点に特徴がある。
データ・アセンブラージの理論的背景には、ドゥルーズ=ガタリ(Deleuze & Guattari)のアセンブラージ理論(assemblage theory)がある。ドゥルーズ=ガタリによれば、アセンブラージとは多様な要素が外在的関係によって集合したものであり、各要素は全体に従属せず独立性を保ちながらも、その相互作用によって全体の性質が生まれる。この考え方は、社会を固定的な全体ではなく流動的で再編可能な寄せ集めとして分析することを可能にする。ロブ・キッチン (Rob Kitchin) はこのアセンブラージ理論の知見を踏まえ、データを扱う諸システムを分析する概念としてデータ・アセンブラージを提唱した。キッチンの定義によれば、データ・アセンブラージとは「データの生成・管理・分析・共有に関わる多くの装置・アクター・実践から成る複雑な社会技術的アレンジメント」である。ここで言う「装置・アクター・実践」には、データを記録・加工・保存・配信・解析・提示するための技術的スタック(ネットワーク、ハードウェア、OS、データベース、ソフトウェア、インタフェースなど)と、データシステムを取り巻き構築する文脈的スタック(思考体系、知識の形態、資金、政府的手法、個人やコミュニティ、市場環境など)が含まれる。言い換えれば、技術的要素と制度的・文化的要素の徹底した相互編成こそがデータ・アセンブラージの骨格である。
キッチンとLauriaultは、この概念の背景にフーコーの装置(dispositif)概念があると指摘する。フーコーの装置とは、ある社会における権力行使を支える異種混交の要素(談話、制度、建築形態、法規、行政措置、科学的命題、哲学・倫理・慈善的主張など)からなる布置を指す。同様に、データ・アセンブラージも知=権力 (power/knowledge) を生み出し支える役割を果たし、どのようなデータがいかなる目的で収集・分析・利用されうるかという枠組みを規定する。この視点に立てば、データシステムは単なる中立的ツールではなく、社会における権力関係の産物であり、同時にそれを再生産する働きを持つことになる。実際、批判的データ研究の研究者たちは特定のデータ・アセンブラージを構成する要素や仕組みを詳細に記述し、それらがいかに結びついて社会における力の作用を維持・強化しているかを解明しようとしている。キッチン自身、データ・アセンブラージの概念をフーコーの装置と明確に比較し、具体的なデータ・アセンブラージがどのような知を生産し、それが支える戦略的目標が何であるかを問うことが重要だと述べている。
データ・アセンブラージは、固定的で境界の明確なシステムではなく流動的で状況依存的な存在である。KitchinとLauriaultによれば、データ・アセンブラージは常に完全に首尾一貫するものではなく、常に作り直されている。新たな技術の発明、組織の変化、ビジネスモデルの創出、政治経済の変動、法律の制定・廃止、技能の発達、社会的論争、市場の拡大・縮小などに応じて、データ・アセンブラージは進化し続ける。したがって、同じ目的のために設計されたデータシステムであっても、その構成要素や条件、関与するアクターは組織や文脈によって異なりうる。要するに、データ・アセンブラージに内在する力(data power)の発現もまたコンテクストに依存し、偶発的かつ非決定論的に形作られる。
以上の理論的枠組みをまとめると、データ・アセンブラージとはデータを取り巻く多層的な要因を包括的に捉える概念であり、その分析には社会と技術のハイブリッドに目を向ける視点が必要となる。データの生成・流通・利用を可能にする要因として、キッチンらは例えば以下のようなカテゴリーを挙げている。
• 物質的基盤・インフラ(materialities and infrastructures):ネットワーク設備、サーバ、センサー、データセンター等の物的環境
• 実践(practices):データの収集方法、加工手順、分析手法、利用の慣行
• 組織・制度(organizations and institutions):企業、官公庁、研究機関などデータを扱う組織体制や制度的枠組み
• 主体性・コミュニティ(subjectivities and communities):データを生み出し利用する人々の主体性、ユーザや開発者コミュニティ
• 場所(空間)(places):データ生成・保存・活用が行われる地理的・物理的場所や環境
• 市場(marketplaces):データが商品化・流通する市場や経済圏
• 思考の体系(systems of thought):データに価値を見出す科学的・思想的パラダイム(例:データ主義、ポジティビズム)
• 知の形態(forms of knowledge):統計学や計量分析など、データを理解するための知識体系
• 資金(finance):データ事業への投資、研究資金、資本の流れ
• 政治経済(political economy):データをめぐる経済構造や権力関係(独占企業の存在、データの商品化、プラットフォーム資本主義)
• ガバナンスと法制度(governmentalities and legalities):プライバシー法やデータ規制、監視の制度設計といった統治技術
このように幅広い要素からなるアセンブラージとしてデータを見ることで、データのもつ社会的意味や力学を立体的に捉えることが可能になる。
2. 関連研究 – 社会学・地理学・STS・プラットフォーム研究での議論
データ・アセンブラージの視点は、社会学、地理学、科学技術社会論(STS)、プラットフォーム研究など複数の分野にまたがって議論されている。こうした領域横断的な広がりは、データが現代社会のあらゆる局面に浸透していることを反映している。
社会学の分野では、ビッグデータ時代の社会を捉える概念としてデータ・アセンブラージが注目されている。データの大量生成と解析が人間の行動や社会構造に影響を与える中、データ・アセンブラージの考え方は社会制度や人々の行為がデータ技術と相互構成的な関係にあることを示唆する。たとえばデジタル社会学やコミュニケーション研究においては、ソーシャルメディアやプラットフォームによるデータ化(datafication)が個人のアイデンティティ形成や社会関係に与える影響が論じられており、その際データ・アセンブラージ概念がデータと社会の複雑な関係性を分析する枠組みとして用いられる。また、ビッグデータに対する批判的視座から、データが新たな監視や差別を生む可能性に警鐘を鳴らす社会学者もおり、そうした議論でもデータ・アセンブラージの全体像(技術インフラから社会的文脈までの網絡)を解明することの重要性が強調される。
地理学の分野では、ロブ・キッチンをはじめとする地理情報科学(GIS)や都市地理の研究者がデータ・アセンブラージに関する理論的展開を行っている。地理学者はかねてより空間データや地理情報システムの社会的影響に関心を寄せており、ビッグデータ時代には都市や環境の把握に大量のデータが用いられることから、空間データのアセンブラージという観点が導入されている。例えば、キッチンらは都市計画におけるデータシステムを事例に、国家のデータ業務の様相をデータ・アセンブラージおよびその集合体であるデータ・エコシステムとして分析している。アイルランドのプランニング・システムに関する研究では、複数の官公庁システムが連携して都市開発を管理するプロセス自体を「アセンブラージの集成(assemblage of data assemblages)」と捉え、その生成・運用・相互接続の様態を解明している。さらに、地理学ではグローバル化とローカルな実践の関係を分析するためにアセンブラージ概念が援用されることがあり、例えばグローバルなデータ体制が各地でどのように具体化するか(ローカルな歴史的・制度的文脈との相互作用)も検討対象となっている。
科学技術社会論 (STS)の領域でも、データ・アセンブラージ的視点が数多く見られる。STS研究者はもともと科学技術と社会の関係をネットワークや集合体として分析することが多く、Bruno Latourのアクターネットワーク理論(ANT)などはアセンブラージ理論と通底する発想を持つ。データの長期的持続やインフラ維持を研究するSTSの事例として、RibesとJackson (2013)は長期観測プロジェクトにおけるデータ維持の労働と実践を分析し、データ生産を支える様々な要素(人員、技術、資金、慣習など)が一体となってデータという成果を持続的に生み出していることを示した。このような分析はデータ・アセンブラージの存在を裏付けるものであり、データを生み出す社会-物質的ネットワークに注目するSTS的アプローチと合致している。また、STSに影響を受けたビッグデータ研究では、巨視的にデータ体制全体を捉えることと、微視的に具体的現場の実践に着目することとのバランスが議論になる。例えばCarter (2018)は「ビッグデータ・アセンブラージを再考する(Reimagining the Big Data assemblage)」中で、データ解析における抽象的傾向と具体的経験の捉え方について議論しており、STS的ビッグデータ分析に潜む緊張関係(全体を見ることで動的特性を見失うリスク)を指摘しているとされる。総じてSTSの文脈では、特定のデータ・アセンブラージを丹念に追跡・記述し、その中で人間と非人間(アルゴリズムやデバイス)がどのように協働しあって知識や社会的効果を生産しているかを解明することに重きが置かれる。
プラットフォーム研究においても、データ・アセンブラージの概念は近年用いられている。デジタル・プラットフォーム(例:UberやTwitter、YouTubeなど)は、それ自体が多様な要素(ソフトウェア基盤、アルゴリズム、利用者コミュニティ、ビジネスモデル、法規制等)の集成体であり、一種のプラットフォーム・アセンブラージと見なせる。例えば近年のギグエコノミー研究では、フードデリバリーやライドシェアの労働環境を分析するのに「プラットフォーム・アセンブラージ」の概念が導入され、グローバルかつローカルに特有の時空間的構成の中で労働者・アルゴリズム・顧客・都市環境が絡み合う様相が論じられている。Mauryら(2024)の研究は、プラットフォーム労働における労働者の経験を形作る要因として、プラットフォームの技術的設定だけでなく、地域ごとの規制や都市構造、労働者の移動や時間感覚などが組み合わさったアセンブラージ状の配置を指摘している。また、ソーシャルメディアなどのプラットフォーム研究でも、ユーザーのエンゲージメントやコンテンツ拡散が、アルゴリズムの設計・商業的戦略・ユーザー行動・文化的文脈といった多層の要因によって左右されることが示されており、これらを統合的に理解するためにアセンブラージ視点が役立つ。さらに、プラットフォーム資本主義に関する批判的研究では、プラットフォーム企業が自社のエコシステム(開発者、広告主、周辺サービス等)を囲い込む戦略自体が一種のアセンブラージ形成と捉えられ、技術と市場と利用者コミュニティが複雑に組み合わさって進化する動態が分析対象となっている。
以上のように、データ・アセンブラージ概念は多様な学術領域で横断的に援用されており、それぞれの分野で固有の問題関心(社会的影響、空間的配置、知識生産の過程、労働と資本など)に照らして発展的に議論されている。
3. 主要な研究者・文献 – データ・アセンブラージを用いる代表的研究
データ・アセンブラージの概念を提唱・発展させてきた主要な研究者として、まずロブ・キッチン (Rob Kitchin)が挙げられる。キッチンは地理学・都市研究の観点からビッグデータやオープンデータの社会的意味を探究しており、著書『The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences』(2014年)や論文「Towards Critical Data Studies: Charting and Unpacking Data Assemblages and Their Work」(2014年、Lauriaultとの共著)でデータ・アセンブラージの概念を提示した。特に後者の研究では、批判的データ研究の一環としてあらゆる技術的・政治的・社会的・経済的要素を含むデータ・アセンブラージを記述・分析することの有用性を論じ、データ監視(dataveillance)やプライバシー侵害、プロファイリングによる社会的選別、予測的ガバナンス(anticipatory governance)などの問題をデータ・アセンブラージの働きとして解明している。キッチンとTracey Lauriaultの仕事は、Critical Data Studies の基礎を築いたものとして知られ、この領域における基本文献となっている。
トレイシー・ローリアルト (Tracey Lauriault)はキッチンと共にデータ・アセンブラージ概念を発展させた研究者であり、地理情報やオープンデータ政策の分野で活動している。Lauriaultはカールトン大学でジャーナリズム・コミュニケーション学を専門とし、地理空間データのインフラや政府統計のデジタル化に関する研究でデータ・アセンブラージの視点を応用している。キッチンとLauriaultの共著論文や、地理学におけるビッグデータ研究の論文集『Thinking Big Data in Geography: New Regimes, New Research』(2018年)に収録された章などで、データ・アセンブラージの概念整理や事例分析が行われている。
Critical Data Studies分野では他にもアンドリュー・イリアディス (Andrew Iliadis)とフェデリカ・ルッソ (Federica Russo)による概論的論文「Critical Data Studies: An Introduction」(2016年)が重要である。彼らはデータ社会を批判的に分析する際の基礎概念としてデータ・アセンブラージを位置付け、キッチンらの定義を引用しつつこの考え方の意義を整理している。また、彼らの議論はデータ倫理やアルゴリズムの説明責任といったテーマへと接続し、Critical Data Studiesの射程を広げるものとなっている。
初期にクリティカル・データ研究の問題提起を行った研究者としては、クレイグ・ダルトン (Craig Dalton)とジム・サッチャー (Jim Thatcher)がいる。彼らは2014年に「What Does a Critical Data Studies Look Like?」と題したエッセイ(Society & Space誌のオンライン記事)を執筆し、ビッグデータブームに対抗する批判的研究の方向性を示す中で「データ・アセンブラージ」の概念に言及した。Dalton & Thatcherはデータを巡る権力構造や知識生産を分析する必要性を訴え、キッチンらの概念提案に先立ってクリティカル・データ研究の地平を切り開いた。この流れの中でキッチンの2014年論文が登場し、理論的骨格を提供した形になる。
社会学・メディア研究の分野からは、ヘレン・ケネディ (Helen Kennedy)の研究も関連する。Kennedyは2016年の著書『Post, Mine, Repeat: Social Media Data Mining Becomes Ordinary』などで、一般ユーザによるデータマイニング受容やデータの可視化に関する社会学的研究を行い、データが日常生活の文脈にどう組み込まれているかを分析している(彼女自身は明示的に「データ・アセンブラージ」という用語を用いてはいないが、そのアプローチは日常生活の実践・制度・技術が混然一体となったデータ環境を描き出しており、概念的には通じるところがある)。またイブリン・ラプター (Evelyn Ruppert)は社会学者としてビッグデータの統治やデータ主体の問題に取り組み、IsinやBigoと共に編集した論集『Data Politics: Worlds, Subjects, Rights』(2019年)ではデータガバナンスや市民性の問題を扱っている。Ruppertらは国家統計や市民によるデータ生成の事例を検討し、データ・アセンブラージ的な視点からデータ政治(data politics)を論じている。
他にもジョー・ベイツ (Jo Bates)はオープンデータ政策や気候データ市場に関する研究でデータ・アセンブラージの分析を行っている。彼女の論文「Data Cultures, Power and the City」(2017年)や「This is what modern deregulation looks like: Co-optation and contestation in the shaping of the UK’s Open Government Data Initiative」(2012年)では、オープンガバメントデータの取り組みが実際には政治的・経済的文脈に組み込まれたものであることを明らかにし、データ公開をめぐる様々なアクターや制度の絡み合いを描写している。ベイツはまた、都市の気候リスクデータ市場について、データ・アセンブラージの視点から民間企業・政府・科学者・保険業界などがデータを介して交錯する構図を分析しており、データが新たな価値創出の場となるプロセスを示している。
さらに、ニック・コールドリー (Nick Couldry)とウリセス・メヒーアス (Ulises Mejias)は『The Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism』(2019年)で「データ植民地主義 (data colonialism)」という概念を提示している。彼らは膨大なデータの収集・搾取の構造を歴史的な植民地支配になぞらえ、データ・アセンブラージをグローバル資本主義の新たなフェーズとして理論化した。データ植民地主義は、情報テクノロジー企業が人々の日常生活から絶えずデータを吸い上げ、それを経済価値に転化する体制を指し、その中では個人の行動や関係性までもが収奪の対象となっている。この議論はデータ・アセンブラージ研究に批判的社会理論の視座を導入したものと言え、後述の倫理・権力の論点にも通じている。
以上のような研究者・文献は、データ・アセンブラージという概念を用いてデータと社会の関係を解明する多角的な試みである。それぞれのアプローチは焦点とする領域は異なるものの、データ・アセンブラージの捉え方(異種要素の集合体としてのデータシステム)によって新たな知見を提供している点で共通している。
4. メディアアート実践 – データ・アセンブラージ視点からのアート作品
データ・アセンブラージ的な視点は、学術研究のみならずメディアアートの分野にも現れている。特に2010年代以降、ビッグデータや監視、アルゴリズムを主題としたメディアアート作品が数多く制作されており、これらはデータ・アセンブラージの概念を直観的かつ批評的に体現していると言える。以下に、その代表的な例をいくつか挙げる。
• 「欲望のコード (Desire of Codes)」清水靖子[三上晴子](2010年): 日本のメディアアーティスト三上晴子による大規模インスタレーション作品。90台ものセンサー内蔵デバイスが壁面に格子状に配置され、天井から吊るされた6本のロボットアーム型カメラが観客の動きを追尾し、さらに「複眼スクリーン」と呼ばれる半球状のディスプレイに情報が投影される。本作は監視テクノロジーとネットワーク社会によって媒介される人間の身体性と欲望の在り方を探究するものであり、センサー・映像・音響が相互連動する複雑なシステムによって観客と機械のインタラクションが生み出される。まさに人間、機械装置、データ(観客の位置情報や音声など)、アルゴリズムが一体となったアセンブラージ的作品であり、監視社会における人間の振る舞いとデータ収集との関係性を体験的に示している。
• 「Face to Facebook」パオロ・チリオ & アレッサンドロ・ルドヴィコ(2011年): イタリア出身のアーティスト、パオロ・チリオらによるプロジェクトで、100万件のFacebookプロフィールを無断取得してその写真・データを分析し、顔認識ソフトで表情ごとに分類した上で架空の出会い系サイト「Lovely-Faces.com」に25万件を再公開した作品。この大胆なハッキング行為は、Facebookという巨大プラットフォームが個人データを独占・商品化している現状への批判として行われた。作者らは「個人データをFacebookの独占物から解放する」ことを意図したと述べており、数ヶ月かけて収集した膨大な公開プロフィール情報を用いてプライバシーと監視の問題を浮き彫りにした。結果としてFacebook社から法的措置を警告されサイトは閉鎖に追い込まれたが、この作品はソーシャルメディア時代のデータ・アセンブラージ(ユーザの行動データ+プラットフォームのアルゴリズム+企業の利益構造)の在り様を問い直すものであった。
• 「Citizen Ex」ジェームズ・ブライドル(2015年): イギリスのアーティスト兼作家ジェームズ・ブライドルによる作品で、「アルゴリズム市民権 (Algorithmic Citizenship)」の概念を提示している。これはウェブブラウザのプラグインとして提供され、ユーザがインターネット上で訪れた各ウェブサイトの物理的所在地(ドメイン登録国)を追跡し、その履歴に基づいてユーザの「国籍構成」を算出・表示するもの。現代では我々は国境を意識せずウェブを行き来するが、その背後ではアクセス先の国の法制度によってプライバシーや言論の権利が影響を受ける。さらに諜報機関は個人の閲覧データから自動的に国籍や脅威レベルを推定し監視対象を決めているとも言われる。Citizen Exは、オンライン上で我々の市民権的地位(=どの国の法のもとで扱われるか)が動的に変化しうることを可視化し、インターネットにおける国家・アルゴリズム・個人の関係を批評する作品である。ブライドルのこの試みは、データ・アセンブラージが個人の権利やアイデンティティに影響を与える様相を創造的に示したものと言える。
この他にも、データ・アセンブラージ的な問題意識を扱うメディアアート作品は多数存在する。例えば、ロンドンのTactical Tech集団による教育的展示「The Glass Room」(2017年)は、企業や政府による個人データ収集を視覚化したインスタレーション群でプライバシーの問題を提起した。また、現代美術家のヒト・スタイエル(Hito Steyerl)は映像作品「How Not to Be Seen: A Fucking Didactic Educational .MOV File」(2013年)等で監視カメラ時代における「見られない」方法を風刺的に探り、アルゴリズムと監視の網目から逃れる術を問うている。さらに、パオロ・チリオの他の作品「Sociality」(2018年)では機械学習が生成した個人情報データセットを用い、監視社会の不気味さを表現した。加えて、アメリカのアーティスト、アダム・ハーヴェイ (Adam Harvey) は「CV Dazzle」(2010年)で顔認識を欺くメイクアップ手法を提示し、「Hyperface」(2016年)では誤認識を誘発するパターン柄をデザインすることで、監視アルゴリズムへの戦略的介入を試みた。これらの作品群は、技術システムと社会現象の接点を芸術的手法で示すことで、データ・アセンブラージに内包された問題を一般観客にも直感的に体験させるという意義を持っている。
5. 批判的視点 – 倫理・監視・アルゴリズム権力・労働への問い
データ・アセンブラージの議論には常に批判的視点が伴っている。膨大なデータ収集と解析が可能になった現代社会では、倫理やプライバシー、監視、アルゴリズムによる権力行使、労働搾取など多岐にわたる問題が指摘されており、データ・アセンブラージの分析はそれらへの批判的介入を可能にする。
まず倫理・プライバシーの観点では、個人データの大量収集(しばしばユーザの同意や理解が不十分なまま行われる)が問題視される。データ・アセンブラージを構成する技術・制度は、人々の行動履歴や生体情報を細大漏らさず記録・共有しうる監視装置となり得るため、データベイランス(dataveillance)によるプライバシー侵害が懸念される。例えばスマートフォンのアプリやウェブのCookieを通じた追跡、生体認証システムの普及、監視カメラ映像のリアルタイム解析など、日常生活のあらゆる場面がデータ化され監視の目にさらされている。批判的データ研究者はこれをフーコー的な装置=権力として捉え、誰がデータを収集し支配しているのか、その結果生み出される知識がどのような権力戦略に資するのかを問う。その一環で、欧州における一般データ保護規則(GDPR, 2018年施行)のようなプライバシー規制や、プライバシーバイデザインの理念が注目され、個人のデータ自己決定権を強化しようとする動きも現れている。しかし技術の発展は規制をしばしば追い越すため、透明性と説明責任(accountability)を確保するための新たな仕組み(アルゴリズムの説明可能性や監査制度)を求める声も高まっている。
次に監視と社会的影響の観点では、データ・アセンブラージを介した新しい監視形態が社会秩序や権利に与える影響が問題となる。シェアリングエコノミーやソーシャルメディアでは、プラットフォームによる利用者評価システムや投稿監視が社会的評価経済を形成し、個人の行動が恒常的に点数化・ランク付けされている。中国の社会信用システムのように国家が市民データを統合し信用スコアを与える極端な例もある。こうしたプロファイリングとソーシャル・ソーティング(社会的選別)によって差別や格差が再生産されるリスクが指摘される。例えば採用過程でAIが応募者を選別する際に過去データに基づくバイアスがかかれば(女性やマイノリティが不利になる等)、アルゴリズムによる差別が不可視のまま進行しうる。Safiya Nobleの『Algorithms of Oppression』(2018年)やCathy O’Neilの『Weapons of Math Destruction』(2016年)は、検索エンジンやスコアリングモデルに潜む偏見が社会的弱者に不利益を与える事例を数多く報告しており、これはデータ・アセンブラージ内部のアルゴリズム要素への批判と言える。また、国家安全保障の名目での大量監視(エドワード・スノーデンの暴露したNSAによる通信傍受プログラムなど)は、市民の自由と監視のバランスをめぐる深刻な倫理問題を提起した。批判的視点からは、こうした「常時監視される社会」に対抗するための手法(例えば前述のCV Dazzleのような監視回避テクニックや、プライバシー保護技術の開発、監視テクノロジーの規制)が議論されている。
アルゴリズム的権力についても重要な論点である。データ・アセンブラージ内のアルゴリズム(AIモデルや推薦システムなど)が自律的に意思決定プロセスを担う場面が増えており、その不可視性・ブラックボックス性が問題視される。誰がどのような基準で作成したか不明なアルゴリズムが、ニュースフィードの内容や銀行の融資判断、司法の量刑判断補助、医療診断などに影響を与える場合、伝統的な説明責任の枠組みが通用しなくなる。これは技術的な課題であると同時に民主主義の課題でもある。したがって、「アルゴリズムによる決定を人間が説明・検証できる形にするべき」というAI倫理の原則が提唱され、欧州連合ではAI規制法案の中で高リスクAIシステムに対する透明性と人間の関与が求められようとしている。さらに近年の生成系AI(大規模言語モデルなど)の台頭に際しても、訓練データの不透明さや出力の信頼性、偏見の拡散、フェイク情報の自動生成といった課題が浮上し、アルゴリズムとデータの両面から統制・ガバナンスを考える必要性が生じている。
労働と経済の側面も見逃せないポイントである。データ・アセンブラージを構築・維持する裏側には大量の人的労働が存在し、しばしば低賃金で搾取的な形態をとっている。ビッグデータやAIの文脈では、「見えない労働者たち」の問題が2010年代後半から顕在化した。例えばAmazonのMechanical Turkやクリックワーカーと呼ばれる人々は、AI訓練用のデータラベリング(画像にタグ付けする、人力でキャプチャを解く等)を世界各地で担っているが、その労働は不安定で低報酬である場合が多い。最近ではOpenAI社のChatGPTを安全なものにするため、有害な文章のフィルタリングをケニアのアウトソーシング労働者に時給2ドル以下で行わせていたことが報道され、議論を呼んだ。この調査報道によれば、ケニア人労働者たちは大量の有害コンテンツ(虐待や暴力描写など)を読まされ深刻な精神的負担を受けながら、極めて低い賃金で作業していた。つまり、AIの驚異的性能の陰にはグローバルな南の低賃金労働が横たわっている。こうしたデータ労働の搾取はしばしば「データのサプライチェーン」の問題として語られ、データ・アセンブラージ研究でも重要なテーマとなっている。加えて、プラットフォーム経済におけるギグワーカー(Uberの運転手やデリバリー配達員など)の働きも、アルゴリズム管理の下で細分化・標準化されたデータ主導の労働形態として分析されている。彼らはアプリによって行動を追跡され、評価スコアで管理され、需要予測アルゴリズムに従って労働を配分される。これはデータ・アセンブラージが労働者を新たな従属的主体として組み込む一側面であり、労働研究や産業社会学から強い批判の対象となっている。
以上の批判的論点は互いに関連し合っている。監視やプライバシーの問題はアルゴリズム権力や労働搾取と結びつき、背景にはデータを資源として利益を上げる資本主義の新たな局面(プラットフォーム資本主義、監視資本主義)が横たわる。ショシャナ・ズボフは『監視資本主義の時代』(2019年)で、GoogleやFacebookに代表される企業モデルを「監視資本主義」と名付け、ユーザの行動データを収集・分析・予測することで利益化する仕組みを批判した。これはデータ・アセンブラージ全体に対する一種の体系的批判といえる。さらに、そのような状況に対抗するため、データ正義 (data justice) やデータ市民権といった概念も提唱されている。データ正義は、データの収集・利用によって被る不利益が社会的弱者に過度に集中しないよう是正し、公平で包摂的なデータ活用を目指す思想である。具体的には、差別的なアルゴリズムの排除、公的統計での住民参加、コミュニティが主体的にデータを管理する仕組み(例:データトラスト)などが模索されている。またデータ市民権とは、市民が自らのデータにアクセス・管理できる権利を拡充し、データガバナンスに参加する権利を指す。これらは、行き過ぎたデータ偏重社会への規範的応答として提起されており、批判的データ研究と社会運動・政策提言の接点となっている。
6. 近年の動向 – スマートシティ、AI、環境データとの関連
最後に、データ・アセンブラージを巡る近年の動向として、スマートシティ、AI、環境データとの関連について述べる。いずれも現代における重要トピックであり、データ・アセンブラージの視点が新たな応用や課題を生み出している領域である。
スマートシティと都市のデータ・アセンブラージ
2010年代以降、「スマートシティ」と称して都市空間にICTを組み込み、センサーやIoT機器から得られるビッグデータを活用して都市サービスを最適化しようという動きが世界各地で進められてきた。例として、バルセロナやシンガポール、ソウル、ニューヨークなどでは交通流量のリアルタイム解析、防犯カメラネットワーク、環境モニタリング、公衆Wi-Fiや市民参加アプリなど様々なデータ駆動型施策が導入されている。スマートシティはまさに都市規模のデータ・アセンブラージとみなすことができ、センサーインフラ(物的装置)から通信ネットワーク、データプラットフォーム、都市行政の制度、民間テック企業、さらには市民の行動やコミュニティまで、多岐にわたる要素の集合によって成り立っている。キッチンはこれを「都市のデータエコシステム」と呼び、複数のデータ・アセンブラージ(交通、エネルギー、水管理、医療、行政サービス等)が互いに連接して都市という統合体を形成していると指摘する。最近の研究では、こうした都市データシステムの相互接続性や相乗効果だけでなく、データ標準の不統一や組織間の政治的軋轢がシステム統合を妨げる様子、あるいはデータ欠測やエラー、サイバー攻撃への脆弱性といった問題も明らかにされている。また、スマートシティ計画には市民のプライバシーや監視への懸念が常につきまとい、トロントでのGoogleの子会社Sidewalk Labsによるスマートシティ開発計画が市民の反発で中止に追い込まれた例(2020年)など、ガバナンスと公共参加の課題も浮上している。こうした現状から、単に技術を導入するだけではなく市民社会を巻き込んだデータ・アセンブラージの民主的統制が必要だとの議論が高まっている。さらに近年では、スマートシティを脱中央集権的に実現するためのアプローチ(コミュニティWi-Fi、住民運営センサー網、オープンソースのシティOSなど)も模索されており、都市データのコモンズ化や地域主導のデータ協定といった新たな潮流も見られる。
人工知能(AI)とデータ・アセンブラージ
AI技術の飛躍的進歩も、データ・アセンブラージ論に新たな焦点をもたらしている。AIの性能向上は大量のトレーニングデータ、計算資源、洗練されたアルゴリズムの三位一体によって支えられており、この複合体は典型的なデータ・アセンブラージとみなせる。特にディープラーニングの隆盛以降、AIモデルはブラックボックス化が進み、人間とAIの協働が様々な場面で実現するにつれて、新たな分析枠組みが必要とされている。研究者の中には「人間-AIアセンブラージ」という概念を用い、AIシステムと人間が一体となって意思決定や作業を行う状況を捉え直そうとする者もいる。たとえば病院におけるAI診断支援ツールの導入場面では、医師(人間)とAIアルゴリズム、患者データベース、病院の制度(診療プロトコルや責任体制)が一つの集合体として機能し始める。この場合、誤診リスクの分散や説明責任の所在といった問題は、人間-AIアセンブラージ全体の在り方から考察しなければならない。また、近年話題の大規模言語モデル(LLM)を含む生成AIは、インターネット上から収集された莫大なテキストデータを学習している。これらのデータセットには社会のあらゆる言説や偏見が含まれるため、AIはしばしばそれを再生産する。したがってAIの公平性・有用性を確保するには、データ収集プロセス(どのようなデータをどのように集めるか)から、モデル学習時の調整、利用段階での人間の監視・介入に至る一連のプロセスを統合的に設計・管理する必要がある。これはAI開発・運用のすべてを含むデータ・アセンブラージをマネジメントすると言い換えることができる。AIガバナンスに関する近年の議論では、技術者・倫理学者・法学者が協力してこのようなアセンブラージ視点でのルール作り(例えばAIのライフサイクル全般での規制)が検討されている。例えばEUのAI法案では、データガバナンス、モデルの透明性、ヒューマンオーバーサイト(人間による監督)など、多方面から安全性確保を図る包括的な規制を試みている。また、AI開発がもたらす地政学的影響(国家間のAI競争や軍事利用)も無視できない。AIをめぐる覇権争いはデータ資源や人材、計算インフラといった要素をめぐって展開するため、これも一種のグローバルなデータ・アセンブラージ(各国政府・企業・研究機関・国際ルールで構成される)として分析することが可能であろう。
環境データとデータ・アセンブラージ
環境分野においても、データ・アセンブラージの概念は重要な示唆を与えている。気候変動や生物多様性、災害予測など地球環境に関する課題では、従来から観測装置やモデルを組み合わせた大規模なデータシステムが構築されてきた。例えば気候科学では、全世界の気象観測所・人工衛星・海洋ブイなどから収集されるデータを、スーパーコンピュータで動かす気候モデルに投入し将来予測を行う。このプロセスはPaul N. Edwardsが『A Vast Machine』(2010年)で詳細に記述しているように、膨大な装置と人間組織(各国の気象機関、研究コミュニティ、データ標準化団体等)の相互作用によって成り立つものであり、一種の知的インフラストラクチャー=地球規模のデータ・アセンブラージと見做せる。近年、この分野ではさらにリアルタイム性が重視されるようになった。リモートセンシング技術やセンサー・ネットワークの進展で、環境データをリアルタイムにモニターし即座に対応策を講じる取り組み(例:スマート灌漑による水資源管理、衛星画像AI解析による違法伐採検知など)が増えている。これらは「環境×データ×AI」の融合領域であり、新たなエコロジカル・データ・アセンブラージを形成している。また、環境データには政治的争点も多い。気候変動データをめぐっては、科学者コミュニティのコンセンサスと気候懐疑論者の攻防が長年続いており、2009年の「Climategate」事件では研究者のメールが流出しデータ改ざん疑惑が取り沙汰された。これは科学データに対する信頼と社会的文脈の問題であり、データ・アセンブラージの信憑性と公共性を揺るがす出来事であった。環境監視に市民を巻き込むシチズンサイエンス(市民科学)の動きも盛んである。住民自ら大気汚染センサーを設置したり生物観察データを投稿したりすることで、公的機関だけでなく市民が環境データ・アセンブラージの一部となっていく。こうした参加型の枠組みは、データの民主化や地域コミュニティのエンパワーメントにつながる可能性がある一方で、データ品質やプライバシーの課題も伴う。さらに、環境データの活用は企業のマーケティングやESG投資の判断材料にも用いられ始めており、環境情報が経済的価値を持つデータ・アセンブラージに組み込まれていく傾向も見られる。
最後に、環境とデータの関係で忘れてはならないのが、データ活動自体の環境負荷である。膨大なデータを保存・処理するデータセンターは莫大な電力と水資源を消費し、AIモデルの訓練は大量の電力とCO2排出を伴うことが報告されている。このためデータ産業の持続可能性が問われ始め、グリーンなデータセンター(再生可能エネルギー利用や冷却効率化)や、環境負荷を考慮したAI開発(省エネアルゴリズムの研究、モデルの小型化など)の重要性が叫ばれている。Mél Hoganらの研究はデータセンターを「環境メディア」の視点で分析し、クラウドの物理的実態やそれが地域環境に与える影響を明らかにしている。この視点は従来見過ごされがちだったデータインフラの環境側面を照らし出し、データ・アセンブラージ論に新たな倫理的問いを導入したといえる。
以上、スマートシティ、AI、環境データという近年特に注目される領域において、データ・アセンブラージの概念は分析フレームとしても批判の切り口としても有用であることを概観した。これらの領域ではデータの規模・複雑性が飛躍的に増大すると同時に、人々の生活や地球環境へのインパクトも大きくなっている。そのため、より包括的で統合的な視野からデータを捉えるデータ・アセンブラージのアプローチが今後ますます重要になると考えられる。
おわりに
データ・アセンブラージという概念は、データをめぐる現代社会の構造と動態を理解するための強力な枠組みを提供する。ドゥルーズ=ガタリの哲学的発想に源流を持ちながら、Rob Kitchinらによって具体的な社会技術システムの分析概念へと発展させられたこの考え方は、様々な分野で横断的に応用されてきた。本稿では、理論的背景から関連研究、主要な文献と研究者、メディアアートでの具現例、倫理的・批判的論点、そしてスマートシティやAIといった近年のトピックまで、データ・アセンブラージに関する知見を包括的に整理した。
データ・アセンブラージの視点からは、データは単なる客観的情報ではなく、技術装置・制度・人間の行為・経済・権力と不可分に結びついた生きた集合体であることが見えてくる。したがってデータを理解し評価するには、その裏側に存在する技術インフラ、社会的プロセス、歴史的文脈、権力構造を合わせて捉えねばならない。これは一見すると分析の範囲を際限なく拡大するようにも思えるが、むしろ個々のデータ現象をそのネットワークの中で位置付けることで初めて、本質的な特徴や影響を正確に把握できるという発想である。同時に、データ・アセンブラージのアプローチは批判的実践と結びつきやすい。すなわち、どの要素を変えることで望ましいデータ社会へ近づけるか(例えば技術設計の改善か、法制度の整備か、市民のリテラシー向上か、といったアクションにつなげる思考)を促すのである。
21世紀も四半世紀が過ぎ、私たちの生活はかつてなくデータに依存し組み込まれている。その意味で、データ・アセンブラージを解き明かすことは現代社会を解剖することと同義である。本稿で示したような視点と知見が、更なる研究の深化や実践的介入(政策立案やアートによる問いかけ)につながり、データ主導社会のより良い形を模索する一助となることを期待したい。