分散データストア

分散データストアとは、情報が複数のノードに、多くの場合は複製された形で保存されるコンピュータネットワークです[1]通常、ユーザーが多数のノードに情報を保存する分散データベース、またはユーザーが多数のピアネットワークノードに情報を保存するコンピュータネットワークを指すために使用されます。[要出典]

分散データベース

分散データベースは通常、多数のノードにまたがるデータへの迅速なアクセスを可能にする非リレーショナルデータベースです。分散データベースの中には、豊富なクエリ機能を提供するものもあれば、キーバリューストアのセマンティクスに限定されているものもあります。限定的な分散データベースの例としては、分散ファイルシステムピアツーピアネットワークをはるかに超えるGoogleBigtable [2]AmazonDynamo [3]Microsoft Azure Storage [4]などが挙げられます。

任意のクエリ実行能力は可用性ほど重要ではないため、分散データストアの設計者は、一貫性を犠牲にして可用性を高めてきました。しかし、 CAP定理によれば、分割されたネットワークでは一貫性と可用性の両方を保証することは不可能であるため、高速な読み書きアクセスは一貫性を低下させます

ピアネットワークノードデータストア

ピアネットワークデータストアでは、ユーザーは通常、他のユーザーが自分のコンピュータをストレージノードとして使用できるようにすることができます。ネットワークの設計によっては、他のユーザーが情報にアクセスできる場合とできない場合があります。

ほとんどのピアツーピアネットワークは分散データストアを備えておらず、ユーザーのデータはノードがネットワーク上にある場合にのみ利用可能です。しかし、BitTorrentのようなシステムではこの区別がやや曖昧です。BitTorrentでは、発信ノードがオフラインになってもコンテンツは配信され続ける可能性があります。ただし、これは再配信者が要求した個々のファイルについてのみ当てはまります。一方、HyphanetWinnySharePerfect Darkなどのネットワークでは、どのノードでもネットワーク上のファイルの一部を保存できる可能性があります。

分散データストアでは通常、エラー検出および訂正技術が使用されます。一部の分散データストア( NNTP経由のParchiveなど)では、ファイルの一部が破損または利用不能になった場合に、前方誤り訂正技術を使用して元のファイルを復元します。他の分散データストアでは、別のミラーからそのファイルのダウンロードを再試行します。

分散型非リレーショナルデータベース

製品ライセンス高可用性注記
アパッチ・アキュムロAL2
エアロスパイクAGPL
アパッチ カサンドラAL2はい以前はFacebookで使用されていました
アパッチイグナイトAL2
ビッグテーブル独自のGoogleが使用
カウチベースAL2LinkedInPayPaleBayで使用
クレートDBAL2はい
アパッチドルイドAL2NetflixYahooで使用されている
ダイナモ独自のAmazonで使用
などAL2はい
ヘーゼルキャストAL2、独自
HベースAL2はい以前はFacebookで使用されていました
ハイパーテーブルGPL2百度
モンゴDBSSPL
MySQL NDB クラスタGPL2はいSQL および NoSQL API
リアクAL2はい
レディスBSDライセンスはい
スキュラDBAGPL
ヴォルデモートAL2LinkedInで使用

ピアネットワークノードデータストア

参照

参考文献

  1. ^ Yaniv Pessach,分散ストレージ(分散ストレージ: 概念、アルゴリズム、実装編)、OL  25423189M
  2. ^ 「Bigtable: Googleの分散データストア」。Paper Trail。2017年7月16日アーカイブ2011年4月5日閲覧。GFSはGoogleに信頼性と拡張性に優れた分散ファイルストレージを提供していますが、階層的なディレクトリ構造と意味のあるファイル名以外に、ファイルに含まれるデータを構造化する機能は提供していません。大規模なデータセットには、より表現力の高いソリューションが必要であることは周知の事実です。Googleがウェブクローラーをはじめとする様々なソースから取得するテラバイト単位のデータは、クライアントアプリケーションがファイルレベルよりも細かい粒度で迅速に検索や更新を実行できるように整理する必要があります。[...] Bigtableについてまず知っておくべきことは、それがリレーショナルデータベースではないということです。これは当然のことです。大規模分散データストアに関するこれらの論文に共通するテーマの一つは、RDBMSを良好なパフォーマンスで動作させることが難しいということです。 Bigtable には固定されたスキーマはなく、テーブル間の参照整合性もありません (したがって外部キーはありません)。そのため、最適化された結合はほとんどサポートされません。
  3. ^ Sarah Pidcock (2011年1月31日). 「Dynamo: Amazonの高可用性キーバリューストア」(PDF) . ウォータールー・シェリトン・スクール・オブ・コンピュータサイエンス. p. 2/22 . 2011年4月5日閲覧. Dynamo: 高可用性とスケーラビリティを備えた分散データストア
  4. ^ "Windows Azure Storage". Microsoft . 2011年9月16日. 2011年11月9日時点のオリジナルよりアーカイブ。 2011年11月6日閲覧
Retrieved from "https://en.wikipedia.org/w/index.php?title=Distributed_data_store&oldid=1312403767"