データエコシステム

データエコシステムとは、データの収集、転送、利用に貢献する相互依存的なネットワークとアクターの複雑な環境です。[ 1 ]医療や金融など、複数のセクターにまたがり、互いの実践に情報を提供します。[ 2 ] データエコシステムは、多くの場合、多数のデータ集合で構成されます。[ 3 ]データエコシステムに関する研究は、ウェブを通じた情報の急速な増加と利用可能性に対応して発展し、データの商品化につながっています。[ 1 ]

データ

データの種類

データとは、効率的な伝送のために圧縮されたデジタル化された情報を指します。[ 4 ]データは 1 または 0 で表されるバイナリ値で構成されており、複雑な考え、画像、動画などを抽象化することができます。[ 4 ]データの生産と交換のレベルはここ数十年で爆発的に増加しており、政府や公的機関は、特に環境、文化、科学、統計の分野で膨大な量のデータを自由に公開しています。[ 1 ]また、これは、データを収集、分類、配布し、新たに定義されたデータエコシステム内で事業を行う企業にとって、非常に収益性の高い産業にもつながっています。[ 1 ]

データエコシステム

エコシステムの本質は、要素間の共生関係を意味します。したがって、データ環境をエコシステムとして記述する場合、それは共構成的な関係を表します。その主な目的は、プラットフォームや分野をまたがるデータの共有を創出、管理、維持することです。[ 1 ]この取り組みの鍵となるのは、データへのアクセスを容易にするデータ仲介者であり、データトラスト、データ取引所データプラットフォームなど7つのタイプに分類されます。[ 2 ] [ 5 ]データエコシステムは、データプロバイダーとデータコンシューマーで構成され、その名称の通り、仲介者を通じてデータを提供、消費します。[ 3 ]

データエコシステムの一般的な例として、ウェブブラウザが挙げられます。ウェブサイト上のサードパーティ製トラッキングアプリ(Cookieと呼ばれる)は、データの収集と整理を行う仲介者として機能します。ウェブブラウザは、ユーザーが複数のウェブサイトを閲覧する際にユーザーの情報を共有するため、データプロバイダーとなります。ウェブサイト自体は、トラッキング情報を利用してユーザーの行動に基づいてコンテンツをカスタマイズするため、消費者となります。[ 6 ]

前述のように、データエコシステムは複数のセクターにまたがることがあります。例えば、顧客の医療データは保険会社と共有され、保険料の計算に使用されます。エコシステムのポイントは、共有環境内のすべてのアクターが共通のリソースまたは知識ベースに貢献することです。[ 1 ]

マッピング

データエコシステムには、ネットワーク、プラットフォーム、そして共進化という3つの主要な特徴があります。[ 1 ]ネットワークとは、データおよびテクノロジーの開発者、プロバイダー、そして再販業者のグループを大まかに指します。[ 1 ]プラットフォームとは、ネットワークを構成するアクターによって共同利用されるサービス、ツール、またはプラットフォームです。[ 1 ]プラットフォームは、アクターが共有の製品やサービスを生み出すためのインターフェースを提供します。[ 1 ]最後の特徴は、異なるアクターとプラットフォームが互いに進化し、改善していく方法を指します。[ 1 ]「エコシステム」という用語の比喩的な用法は、本質的に、関係するすべての関係者がそれぞれの関与によって相互に利益を得ることを要求します。それは、彼ら自身の機能の向上または進化であり、より大きなエコシステム全体にプラスの結果をもたらします。ここでも、ウェブブラウザの例を挙げると、サードパーティのトラッキングアプリは、ウェブサイトのコンテンツ戦略を進化させるためにデータを収集し、そのコンテンツ戦略は、サードパーティのトラッカーに、より正確なユーザーデータを提供することで、無限のフィードバックループを生み出します。[ 6 ]

データ集合

データ集合の要素を示す図[ 7 ]

データエコシステムの広大な領域には、数多くのデータ集合体が存在します。集合体とは、共通の目的のために互いに連携して機能する、相互に関連した社会技術システムと説明されます。[ 3 ]これらのシステムには、データの収集、転送、分散を支える技術、政治、財務、ベストプラクティスが含まれます。[ 8 ]以下の表は、データ化を促進し、統制するデータ集合体の共通要素を示しています。

データエコシステムには多数のデータ集合が含まれ、システム内の各アクターはそれぞれ独自の有形・無形の要素を運用に持っている。データプロバイダーとしてのウェブブラウザは、独自のハードウェア、ソフトウェア、サーバー、財務、インフラ、業務などから成る集合を持っている。データを消費する各ウェブサイトとそれらが代表するより広範な企業も同様にシステムの集合体を提示している。そして、データを収集して販売する中間トラッキングサイトは、独自の集合体の中で運営されている。異なる集合体がより広範なエコシステム内の要素を共有したり、対立するハードウェアやプラットフォームなどの個別の要素を持っている可能性もある。[ 9 ]例えば、ウェブブラウザには、ユーザーのデータを収集しようとするサードパーティのトラッカーと競合する広告ブロッカーが含まれている場合がある。

ビッグデータ

データエコシステムの台頭は、ビッグデータの発展と不可分です。ビッグデータは、人間の活動のほぼすべてを追跡し、定義する、科学技術における新たなトレンドです。[ 10 ]ビッグデータは、以下の5つの特性によって定義されます。

音量

ビッグデータはテラバイトペタバイトにも及ぶ膨大な量の情報から構成されています。[ 8 ]

速度

ビッグデータは急速に生成され、リアルタイムで交換される。[ 8 ]

バラエティ

ビッグデータは非常に多様であり、数多くの研究分野を構成し、幅広い実用化が進んでいます。[ 8 ]

価値

ビッグデータは、そのデータの潜在的な応用とそれが機能する政治経済のために固有の価値を持っています。[ 11 ]

真実性

ビッグデータは正確かつ高品質であると見なされなければなりません。情報が不完全であったり、誤っていたりする可能性があるため、これは難しい場合もありますが、データの収集は真実を伝える意図を持って行われたという一定の信頼がなければなりません。[ 11 ]

懸念事項

データエコシステムに対する主な懸念や批判は、プライバシーに関するものです。誰がデータにアクセスできるのか(暗黙的か明示的かを問わず)?そのデータはどのように保護されているのか?どのように利用され、場合によっては収益化されているのか?非営利団体のCloud Secure Alliance(CSA)は、ビッグデータエコシステムのセキュリティ上の課題を、インフラストラクチャセキュリティ、データプライバシー、データ管理、そして整合性と相対的なセキュリティの4つのグループに分類しています。

ウェブブラウザ、ウェブサイト、サードパーティの追跡機能の場合、データの収集理由とその使用方法には明確な金銭的インセンティブがあります。しかし、このシナリオでは、おそらく気付かれないレベルの監視も行われています。ロブ・キッチン氏はこれを「データベイランス」と呼んでいます。これは、日常生活のデータ化によって、私たちの位置情報や活動を非常に正確かつ継続的に追跡できるようになった結果です。[ 3 ] これらの追跡者やウェブサイト以外に、収集されたデータにアクセスできるのは誰でしょうか?そして、そのデータはより悪質な目的に使用されているのでしょうか?米国の州では中絶へのアクセスが禁止されており、これらのデータエコシステムが州外でサービスを利用する市民にペナルティを課すために利用される可能性があるという懸念があります。[ 12 ]

参考文献

  1. ^ a b c d e f g h i j k Oliveira, Marcelo Iury S.; Lóscio, Bernadette Farias (2018-05-30). 「データエコシステムとは何か?」第19回デジタルガバメント研究国際会議議事録:データ時代のガバナンス. ニューヨーク州ニューヨーク:Association for Computing Machinery. pp.  1– 9. doi : 10.1145/3209281.3209335 . ISBN 978-1-4503-6526-0. S2CID  195348898 .
  2. ^ a b Abdulla, Ahmed (2021年3月8日). 「データエコシステムをシンプルに」 . McKinsey Digital .
  3. ^ a b c dキッチン、ロブ (2022).データ革命:ビッグデータ、オープンデータ、データインフラストラクチャの批判的分析(第2版). ロサンゼルス、カリフォルニア州: Sage Publications Ltd. ISBN 978-1-5297-3375-4. OCLC  1285687714 .
  4. ^ a b Vaughan, Jack (2019年7月). 「データ」 . TechTarget .
  5. ^ Massey, Joe (2022年8月18日). 「データ機関」 . Open Data Institute . 2022年11月20日閲覧
  6. ^ a b Freedman, Max (2022年11月21日). 「企業はデータを収集している。どのように活用しているのか?」 Business News Daily . 2022年11月29日閲覧
  7. ^キッチン、ロブ (2022). 『データ革命:ビッグデータ、オープンデータ、データインフラストラクチャの批判的分析』(第2版)ロサンゼルス、カリフォルニア州. ISBN 978-1-5297-3375-4. OCLC  1285687714 .{{cite book}}: CS1 maint: location missing publisher (link)
  8. ^ a b c d P., Kitchin, Rob Lauriault, Tracey (2014-07-27).批判的データ研究に向けて:データ集合とその働きを図表化し、紐解く. プログラマブル・シティ・ワーキングペーパー2.プログラマブル・シティ. OCLC 1291151213 . {{cite book}}: CS1 maint: multiple names: authors list (link)
  9. ^ Cui, Yesheng; Kara, Sami; Chan, Ka C. (2020年4月). 「製造業におけるビッグデータエコシステム:体系的な文献レビュー」(PDF) .ロボティクスとコンピュータ統合製造. 62 101861. doi : 10.1016/j.rcim.2019.101861 . ISSN 0736-5845 . S2CID 208832261 .  
  10. ^ Demchenko, Yuri; de Laat, Cees; Membrey, Peter (2014年5月). 「ビッグデータ・エコシステムのアーキテクチャ・コンポーネントの定義」. 2014 International Conference on Collaboration Technologies and Systems (CTS) . ミネアポリス, MN, USA: IEEE. pp.  104– 112. doi : 10.1109/CTS.2014.6867550 . ISBN 978-1-4799-5158-1. S2CID  2920274 .
  11. ^ a b Gillis, Alexander (2021年3月). 「ビッグデータの5V」 . TechTarget .
  12. ^ン、アルフレッド (2022 年 7 月 18 日)。「『他に類を見ないほど危険なツール』:Google のデータは各州の中絶追跡にどのように役立つのか」。Politico