優位性に基づくラフ集合アプローチ

優位性に基づくラフ集合アプローチDRSA)は、グレコ、マタラッツォ、スウォウィンスキによって導入された、ラフ集合理論を多基準決定分析(MCDA)に拡張したものです。 [ 1 ] [ 2 ] [ 3 ]古典的なラフ集合と比較した主な違いは、識別不能関係を優位性関係に置き換えた点です。これにより、基準優先順位付けされた決定クラスを考慮する際に典型的な矛盾に対処できます。

多基準分類(ソート)

マルチ基準分類ソート)は、 MCDA内で検討される問題の 1 つで、次のように記述できます。一連の基準(優先順位ドメインを持つ属性)によって評価されるオブジェクトのセットが与えられた場合、各オブジェクトが 1 つのクラスにのみ割り当てられるように、これらのオブジェクトをいくつかの事前定義済みで優先順位付けされた決定クラスに割り当てます。優先順位付けのため、基準でのオブジェクトの評価が向上しても、クラスの割り当てが悪化することはありません。ソート問題は分類の問題と非常に似ています、後者では、オブジェクトは通常の属性によって評価され、決定クラスは必ずしも優先順位付けされていません。マルチ基準分類の問題は、単調性制約付きの順序分類問題とも呼ばれ、順序単調性が問題に関する ドメイン知識から従う場合、実際のアプリケーションでよく発生します

例として、高校における評価の問題を考えてみましょう。校長は生徒(オブジェクト)を3つのクラス「bad」「medium」「good」に分類したいと考えています(「good 」クラスは「medium 」クラスよりも優先され、「medium」クラスは「bad 」クラスよりも優先されることに注意してください)。各生徒は、物理、数学、文学のレベルという3つの基準で表され、それぞれ「bad」「medium」「good」のいずれかの値を取ります。基準は優先順位付けされており、いずれかの科目のレベルが向上しても、全体の評価(クラス)が悪化することはありません。

より深刻な例として、銀行顧客を倒産リスクの観点から安全クラスとリスククラスに分類することを考えてみましょう。これには、「自己資本利益率(ROE)」、「投資利益率(ROI)」、「売上高利益率(ROS)」といった特性が含まれる可能性があります。これらの属性の領域は単純に順序付けられているのではなく、優先順位が存在します。なぜなら、銀行経営者の観点から見ると、倒産リスク分析の対象となる顧客にとって、ROE、ROI、またはROSの値が高いほど良いからです。したがって、これらの属性は基準となります。知識発見においてこの情報を無視すると、誤った結論につながる可能性があります。

データ表現

決定表

DRSAでは、データは多くの場合、特定の形式の決定表を用いて提示されます。正式には、DRSA決定表は4要素の組で構成されます。ここで、はオブジェクトの有限集合、は基準の有限集合、は基準の定義域、はすべての に対してとなる情報関数です。集合は条件基準(集合)と決定基準クラス)に分かれています。 は基準 に基づくオブジェクトの評価であり、はオブジェクトのクラス割り当て(決定値)であることに注意してください。決定表の例を以下の表1に示します。

上位関係

基準の定義域が、アウトランキング関係によって完全に順序付けられていると仮定します。つまり、 は、基準 に関して、が と少なくとも同等(アウトランキング)であることを意味します。一般性を失うことなく、 の定義域が実数、のサブセットであり、アウトランキング関係は、次の関係が成り立つような実数間の単純な順序であると仮定します。この関係は、利得型(「多ければ多いほど良い」)基準(例:企業利益)の場合は簡単です。コスト型(「少なければ少ないほど良い」)基準(例:製品価格)の場合は、 の値を反転することでこの関係を満たすことができます。

決定クラスとクラスの結合

とします。決定基準のドメインは要素で構成され(一般性を損なうことなく を仮定)、 をクラスに分割します。ここで、各オブジェクトは1つのクラス にのみ割り当てられます。クラスはクラスインデックスの昇順に従って優先順位付けされます。つまり、 となるすべての について、 のオブジェクトはのオブジェクトよりも厳密に優先されます。このため、クラス の上向きの和集合と下向きの和集合をそれぞれ次のように定義することができます。

主な概念

優位性

が,のあらゆる基準においてより優れている場合、 ( と表記)はに関して優位であると言う。各 に対して、優位関係は反射的かつ推移的である、すなわち部分的前順序である。 および が与えられているとき、

はそれぞれ、に関するP支配集合とP支配集合を表します。

大まかな近似値

ラフ集合論の核となる考え方は、ある知識を別の知識で近似するというものです。DRSAでは、近似される知識は決定クラスの上向き和集合と下向き和集合の集合であり、近似に用いられる「知識の粒」はP優勢集合とP優勢集合です。

に関するのP下近似とP近似は、それぞれ、およびと表記され、次のように定義されます。

同様に、に関するのP下近似とP上近似は、それぞれ、およびと表記され、次のように定義されます。

下近似は、確実に和集合(それぞれ)に属するオブジェクトをグループ化します。この確実性は、オブジェクト が下近似(それぞれ)に属する場合、他のオブジェクトがこの主張に反しない限り、つまり を P 支配するすべてのオブジェクトが和集合(それぞれ )にも属する場合、という点由来します。上近似は、オブジェクト が上近似(それぞれ )に属する場合、和集合(それぞれ )からをP支配する別のオブジェクトが存在する場合、オブジェクトが上近似(それぞれ)に属するため、(それぞれ)に属する可能性があるオブジェクトをグループ化します。

上記のように定義されたP-下限近似とP-上限近似はすべてのおよび任意のに対して次の特性を満たします。

およびのP境界P 疑わしい領域次のように定義されます。

近似と縮約の品質

比率

は、一連の基準を用いてクラスへの分割の近似品質を定義します。この比率は、 P個正しく分類されたすべてのオブジェクトとテーブル内のすべてのオブジェクト との関係を表します。

となるようなすべての極小部分集合はの縮約と呼ばれ、 と表記されます。決定表には複数の縮約が含まれる場合があります。すべての縮約の共通部分はコアと呼ばれます。

決定ルール

優位関係によって得られた近似値に基づいて、決定表に含まれる優先情報の一般化された記述を、決定ルールとして誘導することが可能です。決定ルールは、 if [条件] then [結果]という形式の表現であり、条件基準と決定基準間の依存関係の形式を表します。決定表から決定ルールを生成する手順では、帰納的学習原理が使用されます。ルールは、確実、可能、近似の3種類に分けられます。確実ルールはクラスの和集合の下側近似から生成され、可能ルールはクラスの和集合の上側近似から生成され、近似ルールは境界領域から生成されます。

特定のルールは次の形式になります。

もし、そして、そして

もし、そして、そして

可能なルールには同様の構文がありますが、ルールの結果部分はcould belonging toまたはcould belonging to の形式になります。

最後に、近似ルールの構文は次のようになります。

もし、そして、そして、そして、そして、 そして

確実、可能、および近似のルールは、意思決定テーブルから抽出された確実、可能、および曖昧な知識を表します。

各決定規則は最小であるべきである。決定規則は含意であるため、最小の決定規則とは、少なくとも同じ弱さ(言い換えれば、基本条件のサブセット、またはより弱い基本条件を用いる規則)の前提と、少なくとも同じ強さ(言い換えれば、オブジェクトを同じクラスの和集合または部分和集合に割り当てる規則)の帰結を持つ他の含意が存在しないような含意と理解する。

決定規則の集合が完全であるとは、決定表のすべてのオブジェクトを網羅し、一貫性のあるオブジェクトは元のクラスに再分類され、一貫性のないオブジェクトは、その矛盾を示すクラスのクラスターに分類されることを意味する。完全かつ冗長でない決定規則の集合を最小と呼ぶ。つまり、この集合からいずれかの規則を除外すると、その集合は非完全となる。決定規則の集合を得るには、以下の3つの帰納法のいずれかを採用することができる。[ 4 ]

  • 最小限の記述、つまり最小限のルールセットの生成
  • 網羅的な記述の生成、つまり与えられたデータマトリックスのすべてのルールの生成
  • 特性記述の生成、すなわち、比較的多くのオブジェクトをそれぞれカバーするルールのセット。ただし、決定表のすべてのオブジェクトを必ずしもカバーするわけではない。

優位性に基づくラフ集合アプローチのための最も一般的なルール誘導アルゴリズムはDOMLEMであり、[ 5 ]これは最小限のルールセットを生成します。

高校生の評価に関する次の問題を考えてみます。

表1: 例—高校の評価
オブジェクト(学生)(数学)(物理)(文学)(グローバルスコア)
中くらい中くらい悪い悪い
良い中くらい悪い中くらい
中くらい良い悪い中くらい
悪い中くらい良い悪い
悪い悪い中くらい悪い
悪い中くらい中くらい中くらい
良い良い悪い良い
良い中くらい中くらい中くらい
中くらい中くらい良い良い
良い中くらい良い良い

各オブジェクト(生徒)は、数学、物理学、文学のレベルにそれぞれ関連する3つの基準 によって記述されます。決定属性に従って、生徒は優先順位に従って3つのクラス 、 、に分類されます。したがって、以下のクラスの和集合が近似されます。

  • つまり、(せいぜい)成績の悪い生徒のクラス、
  • つまり、中程度の生徒数以下のクラス、
  • つまり、少なくとも中程度の生徒数を持つクラス、
  • つまり、(少なくとも)優秀な生徒のクラスです。

オブジェクトとの評価は一貫していないことに注意してください。これは、は 3 つの基準すべてにおいて よりも評価が高いですが、全体的なスコアは よりも低いためです。

したがって、クラス和集合の下位近似は次のオブジェクトで構成されます。

したがって、クラスとのみは正確に近似できません。それらの上限近似値は次のとおりです。

境界領域は次のとおりです。

もちろん、と は正確に近似されているので、となり、

決定表から、次の 10 個のルールの最小セットを導き出すことができます。

  1. もしそうなら
  2. もし、そしてそして
  3. もしそうなら
  4. もしそして
  5. もしそして
  6. もしそして
  7. もしそして
  8. もしそうなら
  9. もしそうなら
  10. もしそして

最後のルールは近似値ですが、残りは確実です。

拡張機能

多基準選択と順位付けの問題

多基準意思決定分析で扱われる他の2つの問題、すなわち多基準選択問題と順位付け問題も、優位性に基づくラフ集合アプローチを用いて解くことができます。これは、意思決定表を一対比較表(PCT)に変換することで行われます。 [ 1 ]

可変一貫性DRSA

粗近似の定義は、優位性原理の厳格な適用に基づいています。しかし、曖昧性のないオブジェクトを定義する場合、特に大規模な決定表においては、負の例をある程度許容することが合理的です。このようなDRSAの拡張版は、変数一貫性DRSAモデル(VC-DRSA)と呼ばれます[ 6 ]。

確率的DRSA

実世界のデータ、特に大規模データセットにおいては、大まかな近似の概念は過度に制限的であることが判明した。そのため、ある程度の不整合を許容する確率モデルに基づくDRSAの拡張(確率DRSA )が導入された。 [ 7 ]単調性制約を伴う順序分類問題のための確率モデルを述べた上で、下方近似の概念を確率的ケースに拡張した。この手法は、等位回帰の問題につながるノンパラメトリック最大尤度法を用いて条件付き確率を推定することに基づいている。

確率的優位性ベースのラフ集合は、一種の変数一貫性モデルと見なすこともできます。

ソフトウェア

4eMka2 (Wayback Machineで2007年9月9日にアーカイブ)は、優位性に基づくラフ集合(DRSA)に基づく多基準分類問題のための意思決定支援システムです。JAMM Wayback Machineで2007年7月19日にアーカイブ)は、4eMka2のより高度な後継システムです。どちらのシステムも、非営利目的でLaboratory of Intelligent Decision Support Systems(IDSS)のウェブサイトから無料で入手できます。

参照

参考文献

  1. ^ a b Greco, S., Matarazzo, B., Słowiński, R.: 多基準意思決定分析のためのラフ集合理論. European Journal of Operational Research, 129 , 1 (2001) 1–47
  2. ^ Greco, S., Matarazzo, B., Słowiński, R.: 優位性に基づくラフ集合アプローチによる多基準分類。W.KloesgenおよびJ.Zytkow編『データマイニングと知識発見ハンドブック』オックスフォード大学出版局、ニューヨーク、2002年
  3. ^ Słowiński, R., Greco, S., Matarazzo, B.: ラフ集合に基づく意思決定支援。第16章 [in]: EK Burke and G. Kendall (eds.), Search Methodologies: Introductory Tutorials in Optimization and Decision Support Techniques, Springer-Verlag, New York (2005) 475–527
  4. ^ Stefanowski, J.: ラフ集合に基づく意思決定ルールの誘導アプローチについて。Skowron, A., Polkowski, L. (編):知識発見におけるラフ集合、Physica Verlag, Heidelberg (1998) 500--529
  5. ^ Greco S., Matarazzo, B., Słowiński, R., Stefanowski, J.: 優勢原理に整合した決定規則の誘導アルゴリズム. W. Ziarko, Y. Yao (編)『ラフ集合とコンピューティングの最新動向』人工知能講義ノート2005 (2001) 304--313. Springer-Verlag
  6. ^ Greco, S., B. Matarazzo, R. Slowinski, J. Stefanowski: 支配性に基づくラフ集合アプローチの可変一貫性モデル.W.Ziarko, Y.Yao (編):ラフ集合とコンピューティングの最新動向.人工知能講義ノート2005 (2001) 170–181.Springer-Verlag
  7. ^ Dembczyński, K., Greco, S., Kotłowski, W., Słowiński, R.: 多基準分類へのラフ集合アプローチのための統計モデル.Kok, JN, Koronacki, J., de Mantaras, RL, Matwin, S., Mladenic, D., Skowron, A. (編):データベースにおける知識発見:PKDD 2007、ワルシャワ、ポーランド.Lecture Notes in Computer Science 4702 (2007) 164–175.
  • Chakhar S., Ishizaka A., Labib A., Saad I. (2016). グループ意思決定のための優位性に基づくラフ集合アプローチ, European Journal of Operational Research, 251(1): 206-224
  • Li S., Li T. Zhang Z., Chen H., Zhang J. (2015). 優勢性に基づくラフ集合アプローチにおける近似値の並列計算, 知識ベースシステム, 87: 102-111
  • Li S., Li T. (2015). 属性値の変化を考慮した優勢性に基づくラフ集合アプローチにおける近似値の増分更新, 情報科学, 294: 348-361
  • Li S., Li T., Liu D. (2013). オブジェクト集合の変化に対する優位性に基づくラフ集合アプローチにおける近似値の動的維持, International Journal of Intelligent Systems, 28(8): 729-751