加速故障時間モデル
生存分析の統計分野において、加速故障時間モデル(AFTモデル)は、一般的に用いられる比例ハザードモデルの代替となるパラメトリックモデルです。比例ハザードモデルは、共変量の影響がハザードをある定数倍にすることを仮定しますが、AFTモデルは、共変量の影響が疾患の経過をある定数分加速または減速することを仮定します。StroustrupらによるC. elegans実験[ 1 ]は、AFTモデルが生物学的生存プロセスの正しいモデルであることを示唆する強力な基礎科学的証拠を示しています。
モデル仕様
一般的に、加速故障時間モデルは次のように定義される[ 2 ]。
ここで、は共変量の結合効果を表し、通常は です。(回帰係数を負の符号で指定すると、共変量の高い値が生存時間を延長することを意味しますが、これは単に符号の規則であり、負の符号がない場合、ハザードが増加します。)
これは、事象の確率密度関数を とすれば満たされる。すると、生存関数は となる。このことから、調整された寿命は となる分布を示し、調整されていない寿命も同じ分布を示すことが容易に分かる。したがって、は次のように表される 。
ここで、最後の項は として分布します。つまり、 とは無関係です。これにより、加速故障時間モデルは回帰分析(通常は線型モデル)に簡約されます。ここで、は固定効果、 はノイズを表します。 の分布が異なると、の分布も異なり、つまり、生存時間のベースライン分布も異なります。通常、生存分析のコンテキストでは、多くの観測値が打ち切られます。つまり、 のみがわかっており、 はわかりません。実際、前者は生存を表し、後者は追跡調査中のイベント/死亡/打ち切りを表します。 の分布が異常な場合、これらの右側打ち切りの観測値によって、モデルを推定する上で技術的な課題が生じる可能性があります。
加速故障時間モデルにおけるの解釈は単純明快です。これは、個体の関連する生涯におけるすべての出来事が2倍の速さで起こることを意味します。例えば、モデルが腫瘍の発生に関するものである場合、それはすべての前段階が曝露を受けていない個体の2倍の速さで進行することを意味し、臨床疾患に至るまでの期待時間はベースライン時間の0.5であることを意味します。しかし、これはハザード関数が常に2倍になることを意味するわけではありません。それは比例ハザードモデルの場合です。
統計上の問題
比例ハザードモデルでは、パラメトリックモデルよりもCoxのセミパラメトリック比例ハザードモデルが広く用いられていますが、AFTモデルは主に完全にパラメトリックであり、つまり確率分布が指定されます。(BuckleyとJames [ 3 ]はセミパラメトリックAFTを提案しましたが、応用研究ではその使用は比較的まれです。1992年の論文でWei [ 4 ]は、Buckley–Jamesモデルには理論的根拠がなく、堅牢性に欠けると指摘し、代替モデルを検討しました。)ベースライン寿命の分布をモデル化するためにある程度の現実的な詳細が求められる場合、これは問題となる可能性があります。したがって、この方向への技術開発が非常に望まれます。
生存モデルに虚弱性項が組み込まれている場合、AFTモデルの回帰パラメータ推定値は、比例ハザードモデルとは異なり、共変量の省略に対して頑健である。また、虚弱性項の確率分布の選択による影響も小さい。[ 5 ] [ 6 ]
AFTモデルの結果は容易に解釈できます。[ 7 ]例えば、死亡率をエンドポイントとする臨床試験の結果は、新しい治療法を対照群と比較した場合の将来の平均余命の一定割合の増加として解釈できます。つまり、患者は新しい治療を受ければ(例えば)15%長く生きられると予測できるということです。ハザード比は、一般の人にも分かりやすく説明するのが難しい場合があります。
AFTモデルで使用される分布
対数ロジスティック分布は、最も一般的に用いられるAFTモデルを提供します。ワイブル分布とは異なり、初期段階で増加し、後期段階で減少する非単調なハザード関数を示すことがあります。形状は対数正規分布に似ていますが、裾が重くなっています。対数ロジスティック累積分布関数は単純な閉形式を持ち、これは打ち切りのあるデータをフィッティングする際に計算上重要になります。打ち切り観測値に対しては、累積分布関数の補集合である生存関数、つまり を評価できる必要があります。
ワイブル分布(特別なケースとして指数分布を含む)は、比例ハザードモデルまたはAFTモデルのいずれかとしてパラメータ化することができ、この特性を持つ唯一の分布族です。したがって、ワイブルモデルの当てはめ結果はどちらの枠組みでも解釈できます。しかし、このモデルの生物学的応用は、ハザード関数が単調である、すなわち減少または増加であるという事実によって制限される可能性があります。
正の実数のような乗法的に閉じた群上の分布は、AFTモデルに適しています。その他の分布としては、対数正規分布、ガンマ分布、ハイパータバスティック分布、ゴンペルツ分布、逆ガウス分布などがありますが、これらの分布は対数ロジスティック分布ほど一般的ではありません。これは、累積分布関数が閉じた形を持たないことが一因です。最後に、一般化ガンマ分布は、ワイブル分布、対数正規分布、ガンマ分布を特別なケースとして含む3パラメータ分布です。
参考文献
- ^ Stroustrup, Nicholas (2016年1月16日). 「Caenorhabditis elegansの老化における時間的スケーリング」 . Nature . 530 (7588): 103–107 . Bibcode : 2016Natur.530..103S . doi : 10.1038/nature16550 . PMC 4828198. PMID 26814965 .
- ^ Kalbfleisch & Prentice (2002). 『故障時間データの統計分析(第2版)』 ホーボーケン、ニュージャージー州: Wiley Series in Probability and Statistics.
- ^ Buckley, Jonathan; James, Ian (1979)、「検閲データによる線形回帰」、Biometrika、66 (3): 429– 436、doi : 10.1093/biomet/66.3.429、JSTOR 2335161
- ^ Wei, LJ (1992). 「加速故障時間モデル:生存分析におけるコックス回帰モデルの有用な代替モデル」. Statistics in Medicine . 11 ( 14–15 ): 1871–1879 . doi : 10.1002/sim.4780111409 . PMID 1480879 .
- ^ランバート、フィリップ; コレット、デイブ; キンバー、アラン; ジョンソン、レイチェル (2004)、「ランダム効果を伴うパラメトリック加速故障時間モデルと腎臓移植生存への応用」、Statistics in Medicine、23 (20): 3177– 3192、doi : 10.1002/sim.1876、hdl : 2268/24489、PMID 15449337
- ^ Keiding, N.; Andersen, PK; Klein, JP (1997). 「省略された共変量による異質性の記述におけるフレイルモデルと加速故障時間モデルの役割」. Statistics in Medicine . 16 ( 1– 3): 215– 224. doi : 10.1002/(SICI)1097-0258(19970130)16:2<215::AID-SIM481>3.0.CO;2-J . PMID 9004393 .
- ^ケイ、リチャード;キナーズリー、ネルソン(2002)「イベント発生までの時間データの処理における比例ハザードモデルの代替としての加速故障時間モデルの使用について:インフルエンザの事例研究」ドラッグ・インフォメーション・ジャーナル、36(3):571-579 、 doi : 10.1177 /009286150203600312
さらに読む
- Bradburn, MJ; Clark, TG; Love, SB; Altman, DG (2003)、「生存分析パートII:多変量データ分析 - 概念と手法の紹介」、British Journal of Cancer、89 (3): 431– 436、doi : 10.1038/sj.bjc.6601119、PMC 2394368、PMID 12888808
- Hougaard, Philip (1999)、「生存データの基礎」、バイオメトリクス、55 (1): 13– 22、doi : 10.1111/j.0006-341X.1999.00013.x、PMID 11318147
- コレット、D.(2003)、医学研究における生存データのモデリング(第2版)、CRCプレス、ISBN 978-1-58488-325-8
- コックス、デビッド・ロックスビー;オークス、D.(1984)「生存データ分析」 CRCプレス、ISBN 978-0-412-24490-2
- マルビニ、エットーレ; ヴァルセッキ、マリア・グラツィア (1995)、『臨床試験と観察研究からの生存データ解析』、Wiley、ISBN 978-0-470-09341-2
- マルティヌッセン、トーベン。 Scheike、Thomas (2006)、生存データの動的回帰モデル、Springer、ISBN 0-387-20274-9
- Bagdonavicius, Vilijandas; Nikulin, Mikhail (2002), Accelerated Life Models. Modeling and Statistical Analysis, Chapman&Hall/CRC, ISBN 1-58488-186-0