AlphaFold

AlphaFold is an artificial intelligence (AI) program developed by DeepMind, a subsidiary of Alphabet, which performs predictions of protein structure.[1] It is designed using deep learning techniques.[2]

AlphaFold 1 (2018) placed first in the overall rankings of the 13th Critical Assessment of Structure Prediction (CASP) in December 2018. It was particularly successful at predicting the most accurate structures for targets rated as most difficult by the competition organizers, where no existing template structures were available from proteins with partially similar sequences.

AlphaFold 2 (2020) は、2020年11月に開催されたCASP14コンペティションでこの順位を繰り返しました。[ 3 ]他のどのエントリーよりもはるかに高い精度を達成しました。[ 2 ] [ 4 ] CASPのグローバル距離テスト(GDT) で、約3分の2のタンパク質に対して90を超えるスコアを獲得しました。このテストは、計算によって予測された構造と実験的に決定された構造の類似性を測定するもので、100が完全一致を表します。[ 2 ] [ 5 ]メタゲノムデータが組み込まれたことで、多重配列アライメントの予測品質が向上しました。トレーニングデータの最大のソースの1つは、カスタムビルドされた65,983,866のタンパク質ファミリーのBig Fantastic Databaseで、多重配列アライメントと隠れマルコフモデルとして表され、参照データベース、メタゲノム、メタトランスクリプトームからの2,204,359,010のタンパク質配列をカバーしています。[ 6 ]

CASP14におけるAlphaFold 2の結果は「驚異的」 [ 7 ]かつ「変革的」[ 8 ]と評された。しかし、一部の研究者は、その予測精度は予測の3分の1に不十分であり、未解決のままであるタンパク質折り畳み問題の基礎となるメカニズムや規則を明らかにしていないと指摘した。[ 9 ] [ 10 ]

それにもかかわらず、この技術的成果は広く認められました。2021年7月15日、AlphaFold 2の論文は、オープンソースソフトウェアと検索可能な種プロテオームデータベースとともに、先行アクセス出版物としてNature誌に掲載されました。[ 6 ] [ 11 ] [ 12 ] 2025年11月時点で、この論文は約43,000回引用されています。[ 13 ]

AlphaFold 3は2024年5月8日に発表されました。タンパク質とDNARNA、様々なリガンドイオンとの複合体の構造を予測することができます。[ 14 ] [ 15 ]この新しい予測方法は、既存の方法と比較して、タンパク質と他の分子との相互作用の精度が最低50%向上しています。[ 16 ]

グーグル・ディープマインドデミス・ハサビス氏ジョン・ジャンパー氏は、2024年のノーベル化学賞の半分を「タンパク質構造予測」で共同受賞し、もう半分は「計算によるタンパク質設計」でデビッド・ベイカー氏に授与された。[ 17 ]ハサビス氏とジャンパー氏は、アルファフォールドプロジェクトのリーダーシップにより、2023年に生命科学ブレークスルー賞アルバート・ラスカー基礎医学研究賞を受賞している。[ 18 ] [ 19 ]

背景

異なる折り畳みレベルの3つの個々のポリペプチド鎖と鎖のクラスター
ポリペプチドとして知られるアミノ酸鎖は折り畳まれてタンパク質を形成する。

タンパク質はアミノ酸の鎖で構成されており、これらの鎖は自発的に折り畳まれて三次元(3D)構造を形成します。この3D構造は、タンパク質の生物学的機能を理解する上で非常に重要です。

タンパク質の構造は、X線結晶構造解析クライオ電子顕微鏡核磁気共鳴(NMR)などの技術を用いて実験的に決定することができるが、これらはすべて高価で時間のかかるものである。[ 20 ]このような実験的手法を用いた努力により、過去60年間で約17万種類のタンパク質の構造が特定されているが、全生命体全体では2億種類以上のタンパク質が知られている。[ 5 ]

長年にわたり、研究者たちはアミノ酸配列からタンパク質の3D構造を予測するために数多くの計算手法を適用してきました。最良のシナリオでは、分子進化に基づく相同性モデリングを使用することで、そのような手法の精度は実験技術(NMR)に近づきます。科学界に最高のタンパク質構造予測を出すよう挑戦するために1994年に開始されたCASPは、2016年までに最も難しいタンパク質に対して100点満点中40点程度のGDTスコアしか達成できないことを発見しました。 [ 5 ] AlphaFoldは、人工知能(AI)ディープラーニング技術を使用して2018年のCASPへの参加を開始しました。 [ 20 ]

アルゴリズム

DeepMindは、タンパク質の配列と構造を公開しているProtein Data Bankから17万種類以上のタンパク質を抽出し、このプログラムを学習させたことが知られています。このプログラムは、AIが大きな問題の一部を識別し、それらをつなぎ合わせて全体的な解を得ることを重視した深層学習技術であるアテンションネットワークの一種を使用しています。 [ 2 ]全体的な学習は、100~200 GPUの処理能力で実施されました。[ 2 ]

アルファフォールド 1 (2018)

AlphaFold 1 (2018) は、2010年代に様々なチームによって開発された研究に基づいて構築されました。この研究では、現在多くの異なる生物(ほとんどが既知の3D構造を持たない)から入手可能な関連DNA配列の大規模なデータバンクを調べ、主鎖では残基が連続していなくても、相関しているように見える異なる残基(ペプチド)の変化を見つけようとしました。このような相関関係は、残基が配列では近くなくても、物理的に互いに近い可能性があることを示唆しており、接触マップを推定することができます。2018年以前の最近の研究に基づいて、AlphaFold 1はこれを拡張し、残基間の距離の確率分布を推定し、接触マップを距離マップに効果的に変換しました。また、推論を開発するために、以前よりも高度な学習方法を使用しました。[ 21 ] [ 22 ]

アルファフォールド2(2020年)

AlphaFold 2の性能、実験、アーキテクチャ[ 23 ]
AlphaFold 2のアーキテクチャの詳細[ 23 ]

DeepMindのチームによると、 2020年版のプログラム(AlphaFold 2、2020年)は、2018年にCASP 13で優勝したオリジナル版とは大きく異なるとのことだ。[ 24 ] [ 25 ]

AlphaFold 1は、個別に学習させた複数のモジュールを用いてガイドポテンシャルを生成し、これを物理ベースのエネルギーポテンシャルと組み合わせました。AlphaFold 2では、これを相互接続されたサブネットワークのシステムに置き換え、パターン認識に基づく単一の微分可能なエンドツーエンドモデルを形成しました。このモデルは統合的に学習されました。[ 25 ] [ 26 ]ニューラルネットワークの予測が収束した後、最終的な改良ステップとして、AMBER力場に基づくエネルギー最小化を用いて局所的な物理的制約を適用します。このステップでは、予測された構造がわずかに調整されるだけです。[ 27 ]

2020システムの主要部分は、トランスフォーマー設計に基づいていると考えられる2つのモジュールです。これらのモジュールは、タンパク質のアミノ酸残基と別のアミノ酸残基との間の関係(グラフ理論用語では「エッジ」) (これらの関係は緑色で示された配列で表されます)と、入力配列アライメント内の各アミノ酸位置と各異なる配列との間の関係これらの関係は赤色で示された配列で表されます)について、情報ベクトルを段階的に洗練するために使用されます。[ 26 ]内部的には、これらの洗練変換には、学習データから学習されたコンテキスト依存的な方法で、これらの関係に関連するデータをまとめ、無関係なデータをフィルタリングする効果を持つレイヤー(「アテンションメカニズム」)が含まれています。これらの変換は反復され、1つのステップで出力された更新された情報が次のステップの入力となり、強化された残基/残基情報は残基/配列情報の更新に送られ、さらに改善された残基/配列情報は残基/残基情報の更新に送られます。[ 26 ]ある報告によると、反復が進むにつれて、「注意アルゴリズムは…人がジグソーパズルを組み立てる方法を模倣します。つまり、最初にピースを小さな塊(この場合はアミノ酸のクラスター)につなぎ合わせ、次にその塊をより大きな全体に結合する方法を探します。」[ 5 ]

これらの反復処理の出力は最終的な構造予測モジュール[ 26 ]に伝えられ、このモジュールも変換器[ 28 ]を使用し、その後、自身も反復処理されます。DeepMindが提示した例では、構造予測モジュールは最初の反復処理で標的タンパク質の正しいトポロジーを実現し、GDT_TSは78と評価されましたが、立体化学違反(非物理的な結合角や結合長)が多数(90%)発生しました。その後の反復処理では、立体化学違反の数は減少しました。3回目の反復処理では予測のGDT_TSは90に近づき、8回目の反復処理では立体化学違反の数はゼロに近づきました。[ 29 ]

当初、トレーニングデータは単一のペプチド鎖に限定されていました。しかし、2021年10月のアップデート「AlphaFold-Multimer」では、トレーニングデータにタンパク質複合体が含まれるようになりました。DeepMind社によると、このアップデートでは、タンパク質間相互作用の予測精度が約70%に向上しました。[ 30 ]

アルファフォールド3(2024年)

2024年5月8日に発表されたAlphaFold 3は、 Alphabetの子会社であるGoogle DeepMindとIsomorphic Labsによって共同開発されました。AlphaFold 3は単鎖タンパク質に限定されず、 DNARNA翻訳後修飾、特定のリガンドイオンタンパク質が複合体を形成する構造も予測できます。[ 31 ] [ 14 ]

AlphaFold 3では、Transformerに着想を得たディープラーニングアーキテクチャ「Pairformer」が導入されました。これは、AlphaFold 2で使用されていたEvoformerに似ていますが、よりシンプルです。[ 15 ] Pairformerモジュールの初期予測は、拡散モデルによって洗練されます。このモデルは原子雲から始まり、Pairformerの出力に基づいて原子の位置を反復的に調整し、分子構造の3D表現を生成します。[ 14 ]

AlphaFoldサーバーは、非営利研究のためにAlphaFold 3への無料アクセスを提供するために作成されました。[ 32 ] 2025年11月現在、AlphaFold 3の研究論文は9,000回以上直接引用されています。[ 33 ]

競技会

CASP 2018コンペティション(小さな円)とCASP 2020コンペティション(大きな円)で最高の再構築によってタンパク質予測で達成された結果と、前年に達成された結果を比較したもの。深紅色のトレンドラインは、AlphaFold 1を含む少数のモデルが、特に予測が最も難しいと考えられているタンパク質配列に関して、以前に達成された進歩率を超えて、2018年にどのように大幅な変化を達成したかを示しています。(質的な改善は以前の年に行われましたが、変更によって構造が実験位置から8Å以内にもたらされて初めて、CASP GDS-TS指標に影響を与え始めます)。オレンジ色のトレンドラインは、2020年までにオンライン予測サーバーがこのパフォーマンスから学習して一致できるようになった一方で、他の最高のグループ(緑の曲線)は平均してそれよりもいくらか改善できたことを示しています。ただし、黒色のトレンドカーブは、AlphaFold 2が2020年に全体的にこれを再び上回った程度を示しています。データポイントの詳細な広がりは、AlphaFoldによって達成された一貫性またはばらつきの程度を示しています。外れ値は、AlphaFoldがそれほど正確に予測できなかった少数の配列を表しています。

CASP13

2018年12月、DeepMindのAlphaFoldは、第13回タンパク質構造予測技術の批判的評価(CASP)の総合ランキングで1位を獲得しました。[ 34 ] [ 35 ]

このプログラムは、コンテスト主催者によって最も困難と評価されたターゲット、つまり部分的に類似した配列を持つタンパク質から既存のテンプレート構造が利用できないターゲットに対して、特に最も正確な構造を予測することに成功しました。AlphaFoldは、このクラスの43のタンパク質ターゲットのうち25に対して最高の予測を行い、 [ 35 ] [ 36 ] [ 37 ] CASPのグローバル距離テスト(GDT)スコアで平均58.9を達成し、接触距離の推定にディープラーニングも使用していた次点の2チームの52.5と52.4を上回りました。 [ 38 ] [ 39 ] [ 40 ]全体として、すべてのターゲットにおいて、AlphaFold 1は68.5のGDTスコアを達成しました。[ 41 ]

2020年1月、AlphaFold 1の実装と説明コードがGitHubオープンソースとして公開された。[ 42 ] [ 20 ]しかし、そのウェブサイトの「Read Me」ファイルには、「このコードは任意のタンパク質配列の構造予測には使用できません。CASP13データセット(下記リンク)の構造予測にのみ使用できます。特徴量生成コードは、社内インフラストラクチャと外部ツールに密接に結合しているため、オープンソース化することはできません。」と記載されており、つまり、寄託されたコードは一般的な使用には適しておらず、CASP13タンパク質にのみ適している。同社は2021年3月5日現在、コードを一般公開する予定を発表していない。

CASP14

2020年11月、DeepMindの新バージョンであるAlphaFold 2がCASP14を受賞しました。[ 43 ] [ 44 ]全体として、AlphaFold 2は97のターゲットのうち88に対して最高の予測を行いました。[ 7 ]

コンテストで推奨されている精度の指標であるグローバル距離テスト(GDT)では、プログラムは平均92.4(100点満点中)のスコアを達成しました。これは、予測の半数以上が、原子がほぼ正しい位置にあるという点で92.4%以上のスコアを獲得したことを意味します。[ 45 ] [ 46 ]このレベルの精度は、X線結晶構造解析などの実験技術に匹敵すると報告されています。[ 24 ] [ 8 ] [ 41 ] 2018年には、AlphaFold 1はすべての予測のうち2つでのみこのレベルの精度に達していました。[ 7 ] 2020年のコンテストでは、予測の88%でGDT_TSスコアが80を超えていました。最も難しいと分類されたターゲットのグループでは、AlphaFold 2は平均87のスコアを達成しました。

タンパク質骨格鎖のアルファ炭素原子の配置の二乗平均平方根偏差(RMS-D)で測定すると、最も適合度の低い外れ値のパフォーマンスに左右される傾向がありますが、AlphaFold 2 の予測の 88% は、重なり合った C-アルファ原子のセットに対してRMS 偏差が 4 Å未満でした。 [ 7 ]予測の 76% は 3 Å を超える精度を達成し、46% は C-アルファ原子の RMS 精度が 2 Å を超えました。[ 7 ]重なり合った CA 原子のセットに対する予測の RMS 偏差の中央値は 2.1 Å でした。[ 7 ] AlphaFold 2 は、表面側鎖のモデリングにおいても「本当に並外れた」と評される 精度を達成しました。

AlphaFold 2のさらなる検証のため、会議主催者は、特に困難で解明できなかった構造を研究している4つの主要な実験グループにアプローチしました。4つのケース全てにおいて、AlphaFold 2によって生成された3次元モデルは、分子置換法によってこれらのタンパク質の構造を決定できるほどの精度を示しました。これらの中には、実験家が10年間研究してきた小さな膜タンパク質であるT1100(Af1503)も含まれていました。 [ 5 ]

AlphaFold 2が最も予測精度の低かった3つの構造のうち、1つは52個の同一ドメインからなる珍しいマルチドメイン複合体でした。単一ドメインを持つすべてのターゲット(非常に大きなタンパク質1つとNMRによって決定された2つの構造を除く)において、AlphaFold 2は80を​​超えるGDT_TSスコアを達成しました。

CASP15

2022年、DeepMindはCASP15に参加しなかったが、参加企業のほとんどがAlphaFoldまたはAlphaFoldを組み込んだツールを使用していた。[ 47 ]

受付

AlphaFold 2がCASPグローバル距離テスト(GDT)で90点以上を獲得したことは、計算生物学における大きな成果です。[ 5 ] [ 8 ]ノーベル賞受賞者で構造生物学者のヴェンキ・ラマクリシュナン氏は、この結果を「タンパク質折り畳み問題における驚くべき進歩」と呼び、[ 5 ]「この分野の多くの人々が予想するよりも数十年も前に起こったことです。これが生物学研究を根本的に変えるであろう多くの方法を見るのは刺激的です。」[ 43 ]

AlphaFold 2 の成功は広くメディアの注目を集めました。[ 48 ] [ 43 ] [ 49 ] Nature[ 8 ] Science[ 5 ] MIT Technology Review[ 2 ] New Scientist[ 50 ] [ 51 ]などの科学誌にニュース記事が掲載され、全国紙でも取り上げられました。[ 52 ] [ 53 ] [ 54 ] [ 55 ]頻繁に取り上げられたテーマは、構成アミノ酸配列に基づいてタンパク質の構造を予測する能力であり、これは生命科学で利点があると期待されており、新薬の発見を加速し、疾患の理解を深めることができます。[8] [56] タンパク質予測問題に対する完璧な答えであっても、タンパク質の折り畳み問題 (したがってタンパク質のダイナミクス) に関する疑問が残り、自然折り畳みプロセス実際どのよう発生するか(および、どのようにして誤って折り畳まれることがあるか) を詳細に理解する必要があると指摘する人もいます。[ 57 ]

2023年、デミス・ハサビスジョン・ジャンパーは、アルファフォールドプロジェクトのマネジメントにより、生命科学ブレークスルー賞[ 19 ]アルバート・ラスカー基礎医学研究賞を受賞しました。 [ 58 ]ハサビスとジャンパーは、ワシントン大学のデビッド・ベイカーと共同で行った「タンパク質構造予測」の研究により、2024年にノーベル化学賞を受賞しました。 [ 18 ] [ 59 ]

ソースコード

科学界からの要請を受けて、DeepMindは2022年にAlphaFoldのいくつかのバージョン(AlphaFold 3を除く)のソースコードへのオープンアクセスを提供した。[ 60 ] [ 61 ] [ 62 ] AlphaFold 3のソースコードと重みは、 2024年11月に要請に応じて科学界に非営利目的で利用可能となった。2025年2月に一般公開されたが、非営利の制限は依然として維持されている。[ 63 ]

クローンと派生品

AlphaFoldのクローンも数多く公開されていますが、そのほとんどはより緩いライセンス条件となっています。AlphaFold3のクローンとしては、 ByteDanceのProtenix(Apache 2.0ライセンス[ 64 ] 、 AlQuraishi LaboratoryのOpenFold-3(MITライセンス)、Boltz-1/2(MITライセンス)[ 65 ]などがあります。

旧バージョンのクローンも存在しますが、AlphaFold 1および2のソースコードがオープンソース化されたことで、それらの重要性は低下しました。AlphaFoldアーキテクチャに変更を加えたモデルは、オープンソースとクローズドソースの両方で依然として重要です。AlphaFold 2の注目すべき例としては、MetaのESMFoldが挙げられます。これは、多重配列アライメントをタンパク質言語モデルの潜在空間に置き換えています。[ 66 ]

AlphaFoldを補完するオープンソースツールも開発されています。よく引用される例としては、HHblitsを用いて配列検索を高速化し、AlphaFoldパイプラインをGoogle Colab上で高速に実行できるColabFoldがあります。[ 67 ]

AlphaFoldによって生成されたタンパク質モデルのデータベース

AlphaFoldタンパク質構造データベース
コンテンツ
キャプチャされたデータの種類タンパク質構造予測
生物すべてのUniProtプロテオーム
接触
研究センターEMBL-EBI
主な引用[ 6 ]
アクセス
Webサイトhttps://www.alphafold.ebi.ac.uk/
ダウンロードURLはい
ツール
ウェブはい
その他
ライセンスCC-BY 4.0
キュレーションポリシー自動

AlphaFoldとEMBL-EBIの共同プロジェクトであるAlphaFoldタンパク質構造データベース( AFDB)は、 2021年7月22日に開始されました。開始時には、データベースには、ヒトと20のモデル生物のほぼ完全なUniProtプロテオームのAlphaFold 1予測モデルが含まれており、合計365,000以上のタンパク質が含まれています。データベースには、アミノ酸残基が16未満または2700を超えるタンパク質は含まれていませんが、[ 68 ]ヒトの場合は、バッチファイル全体で利用できます。[ 69 ] AlphaFoldの当初の目標(2022年初頭時点)は、1億を超えるタンパク質を含むUniRef90セットの大部分をカバーするようにデータベースを拡張することでした。2022年5月15日時点で、データベースには992,316の予測が含まれていました。[ 70 ]

2021年7月、UniProt-KBとInterPro [ 71 ]が更新され、利用可能な場合はAlphaFoldの予測が表示されるようになりました。[ 72 ]

2022年7月28日、研究チームは100万種、約2億個のタンパク質の構造をデータベースにアップロードしました。これは地球上のほぼすべての既知のタンパク質を網羅しています。[ 73 ] 2024年時点での登録数は2億1400万個で、そのうち2600万個はデータベース内の別のタンパク質の重複(完全配列一致)です。重複タンパク質間では、予測される構造が大きく異なる場合があります。[ 74 ]

2025年現在、AFDBは予測にAlphaFold 2を使用しています。生成される構造はすべて単量体構造のままですが、他のデータベースによって生成された多量体構造は、3D-Beacons APIを通じてページ上にリンクされています。高速かつ正確な構造検索を提供するFoldseekも統合されています。また、AlphaMissense(AlphaFoldを用いてミスセンス変異の結果を予測するツール)の情報も統合されています。[ 75 ]

派生データベース

AlphaFillは、適切な場所にAlphaFoldモデルに補因子を追加します。これは、タンパク質データバンクで類似の構造を検索し、補因子を類似の位置に移植することで実現されます。[ 76 ]また、UniProtにもリンクされています。

TmAlphaFoldは、OPMがPDB構造に対して行うのと同様に、AlphaFoldモデルを生体膜にドッキングします。[ 77 ]

AFTMは、PDBTMがPDB構造に対して行うのと同様に、AlphaFoldモデルを使用してヒトタンパク質の膜貫通領域を識別します。[ 77 ]

ChannelsDB 2.0はPDBまたはAlphaFillモデルを使用して、分子が酵素の活性部位に到達したり、膜貫通孔の反対側に到達したりする経路を計算します。[ 78 ]

AFDBはUniProtの配列変更に対応していません。AlphaSyncは、UniProtエントリの変更とAFDBを同期させ、構造、残基レベルのフィーチャ、およびコンタクト情報を更新します。更新された配列が利用可能な場合はAFDBエントリを使用し、そうでない場合はAlphaFold 2を独立して実行します。AlphaSyncは、2,700アミノ酸を超える大きなタンパク質や、B、Z、U、Xなどの特殊なFASTA文字を持つタンパク質について、AFDBの空白を埋めます。[ 79 ]

ドメイン百科事典(TED)は、 CATHデータベースのドメイン認識方法をAFDBの1億8800万のユニークな構造に適用し、約3億6500万のドメインを識別しました。これは、配列ベースの方法で識別できる数よりも1億多いです。[ 74 ]

無関係なAlphaFoldベースのデータベース

isoform.ioは、ヒトゲノム中のスプライスアイソフォーム候補のAlphaFold2構造データベースです。237,275件のヒト転写産物の情報が含まれています。いくつかの遺伝子のmRNA予測におけるエラーの検出に使用されています。 [ 80 ]

パフォーマンス、検証、制限

目覚ましい成功を収めたにもかかわらず、AlphaFold には一定の限界があることも明らかになりました。

AlphaFold 1、2、および AlphaFold DB

アルファフォールド3

  • いくつかのベンチマークにおいて、AlphaFold3は、小分子-タンパク質結合モードの予測において、従来の検索ベースのドッキングアルゴリズムよりも平均して優れた性能を示しました。[ 85 ]
  • AlphaFold 3バージョンは、選択された補因子と共翻訳および翻訳後修飾の非常に限られたセットを持つタンパク質複合体の構造を予測することができます。[ 86 ]ヒトプロテオームの構造の50%から70%は、共有結合したグリカンなしでは不完全です。[ 87 ] [ 81 ]
  • 研究によると、AlphaFold3はタンパク質とリガンドの共折り畳みを共同でモデル化できるものの、トレーニングデータとの類似性が低いテストケースでは精度が著しく低下することが示されています。これは創薬において特に重要な領域です。[ 88 ]他の研究では、AlphaFoldは結合ポケットの物理化学的特性を変更することによって生成される敵対的なデコイには鈍感であることが判明しており、これは真の化学的認識ではなく、トレーニングセットの記憶に依存している可能性を示唆しています。[ 89 ]

一般的な

  • このアルゴリズムでは、残基はいかなる制約もなく自由に移動されます。そのため、モデリング中に鎖の完全性が維持されません。その結果、AlphaFoldは、任意の数の結び目を持つ構造など、位相的に誤った結果を生成する可能性があります。(本研究ではAlphaFold 2.3.2を使用しています。)[ 90 ]
  • このモデルは、ある程度、類似タンパク質の共進化情報に依存しています。そのため、合成タンパク質や、トレーニングデータベース内のタンパク質との相同性が非常に低いタンパク質では、良好なパフォーマンスが得られない可能性があります。[ 91 ]ベンチマークはこの限界を裏付けています。自然進化したde novoタンパク質に適用した場合、AlphaFold2は信頼性が低く、予測因子依存のモデルを生成することが多く、タンパク質言語モデルベース(アライメントフリー)の構造予測因子は、孤立タンパク質に対してAlphaFold2よりも優れたパフォーマンスを発揮します。[ 92 ] [ 93 ]より広く言えば、比較解析により、構造/無秩序予測因子(AlphaFold2およびESMFoldを含む)は、de novoタンパク質およびランダム配列タンパク質に対しては保存タンパク質とは異なる挙動を示し、これらの配列クラスでは、信頼度指標が予測された無秩序性と異なる関係を示す可能性があることが示されています。[ 94 ] [ 95 ]
  • モデルのタンパク質の複数のネイティブ構造を予測する能力には限界があります。
  • タンパク質は本質的に動的であり、その機能を理解するには、複数のネイティブコンフォメーションを評価することがしばしば重要です。しかし、このモデルは、特に生物学的環境において共存したり相互変換したりする、これらの代替的なコンフォメーション状態を表現する能力が限られています。

アプリケーション

AlphaFoldは、 COVID-19の原因物質であるSARS-CoV-2のタンパク質構造を予測するために使用されています。これらのタンパク質の構造は、2020年初頭の実験的検出を待っていました。[ 96 ] [ 8 ]結果は、より広範な研究コミュニティに公開される前に、英国のフランシス・クリック研究所の科学者によってレビューされました。研究チームはまた、実験的に決定されたSARS-CoV-2スパイクタンパク質に対して正確な予測を確認し、国際的なオープンアクセスデータベースであるProtein Data Bankで共有してから、研究が不十分なタンパク質分子の計算的に決定された構造を公開しました。[ 97 ]研究チームは、これらのタンパク質構造は現在進行中の治療研究の対象ではないかもしれませんが、SARS-CoV-2ウイルスに対するコミュニティの理解に貢献するだろうと認めました。[ 97 ]具体的には、AlphaFold 2が予測したORF3aタンパク質の構造は、カリフォルニア大学バークレー校の研究者がクライオ電子顕微鏡を用いて決定した構造と非常に類似していました。この特定のタンパク質は、ウイルスが複製した後、宿主細胞から脱出するのを助けると考えられています。また、このタンパク質は感染に対する炎症反応を誘発する役割も果たしていると考えられています。[ 98 ]

出版作品

参照

参考文献

  1. ^ “AlphaFold” . Deepmind . 2021年1月19日時点のオリジナルよりアーカイブ2020年11月30日閲覧。
  2. ^ a b c d e f「DeepMindのタンパク質折り畳みAIが、生物学における50年来の大きな課題を解決」 MITテクノロジーレビュー2021年8月28日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  3. ^ Shead, Sam (2020年11月30日). 「DeepMind、タンパク質フォールディングAIで50年来の『壮大な課題』を解決」CNBC . 2021年1月28日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  4. ^ Stoddart, Charlotte (2022年3月1日). 「構造生物学:タンパク質がクローズアップされるようになった経緯」 . Knowable Magazine . doi : 10.1146/knowable-022822-1 . S2CID 247206999. 2022年4月7日時点のオリジナルよりアーカイブ2022年3月25日閲覧 
  5. ^ a b c d e f g hロバート・F・サービス、「ゲームは変わった。」AIがタンパク質構造の解明に勝利 2023年6月24日アーカイブ、Wayback MachineScience、2020年11月30日
  6. ^ a b cジャンパー、ジョン;エヴァンス、リチャード。アレクサンダー・プリッツェル。グリーン、ティム。マイケル・フィグルノフ。ロンネベルガー、オラフ。トゥニャスヴナクール、キャスリン。ベイツ、ラス。ジデク、アウグスティン。ポタペンコ、アンナ。ブリッジランド、アレックス。マイヤー、クレメンス。コール、サイモンAA;アンドリュー・J・バラード;カウィー、アンドリュー。ロメラ・パレデス、ベルナルディーノ。ニコロフ、スタニスラフ。ジャイナ教、リシュブ。アドラー、ジョナス。戻りなさい、トレバー。ピーターセン、スティグ。ライマン、デイビッド。クランシー、エレン。ジエリンスキー、ミハル。シュタイネッガー、マーティン。パチョルスカ、ミハリナ。タマス・バーグハマー;ボーデンシュタイン、セバスチャン。シルバー、デイビッド。ビニャール、オリオール。シニア、アンドリュー・W;カヴククオール、コライ州。 Kohli, Pushmeet; Hassabis, Demis (2021-07-15). 「AlphaFoldを用いた高精度なタンパク質構造予測」 . Nature . 596 (7873): 583– 589. Bibcode : 2021Natur.596..583J . doi : 10.1038/ s41586-021-03819-2 . PMC 8371605. PMID 34265844 .  
  7. ^ a b c d e f Mohammed AlQuraishi、「CASP14 のスコアが出たばかりですが、驚異的です」Wayback Machineに 2022 年 8 月 4 日にアーカイブ、Twitter、2020 年 11 月 30 日。
  8. ^ a b c d e fキャロウェイ、エウェン (2020-11-30). "「『すべてを変える』:DeepMindのAIがタンパク質構造の解明で飛躍的な進歩を遂げる」。Nature . 588 ( 7837): 203– 204. Bibcode : 2020Natur.588..203C . doi : 10.1038/d41586-020-03348-4 . PMID  33257889 . S2CID  227243204 .
  9. ^ステファン・カリー、「いいえ、DeepMindはタンパク質の折り畳みを解明していません」、2022年7月29日アーカイブ Reciprocal Space(ブログ)、2020年12月2日
  10. ^ Ball, Phillip (2020年12月9日). 「Behind the screens of AlphaFold」 . Chemistry World . 2021年8月15日時点のオリジナルよりアーカイブ2020年12月10日閲覧。
  11. ^ “GitHub - deepmind/alphafold: AlphaFoldのオープンソースコード” . GitHub . 2021年7月23日時点のオリジナルよりアーカイブ。 2021年7月24日閲覧
  12. ^ 「AlphaFoldタンパク質構造データベース」 . alphafold.ebi.ac.uk . 2021年7月24日時点のオリジナルよりアーカイブ。 2021年7月24日閲覧
  13. ^ 「Google Scholar」 . scholar.google.com . 2025年5月1日閲覧
  14. ^ a b c「AlphaFold 3は生命のあらゆる分子の構造と相互作用を予測する」 Google 2024年5月8日。2024年5月9日時点のオリジナルよりアーカイブ。 2024年5月9日閲覧
  15. ^ a b Abramson, Josh; Adler, Jonas; Dunger, Jack; Evans, Richard; Green, Tim; Pritzel, Alexander; Ronneberger, Olaf; Willmore, Lindsay; Ballard, Andrew J.; Bambrick, Joshua; Bodenstein, Sebastian W.; Evans, David A.; Hung, Chia-Chun; O'Neill, Michael; Reiman, David (2024-05-08). 「AlphaFold 3を用いた生体分子相互作用の正確な構造予測」 . Nature . 630 (8016): 493– 500. Bibcode : 2024Natur.630..493A . doi : 10.1038/s41586-024-07487-w . ISSN 1476-4687 . PMC 11168924 . PMID 38718835 .   
  16. ^ 「Beyond AlphaFold 3: タンパク質構造予測における将来の課題への対応」 2024年5月10日. 2024年11月29日閲覧
  17. ^ 「プレスリリース:2024年度ノーベル化学賞」スウェーデン王立科学アカデミー。2024年10月9日。 2024年11月29日閲覧スウェーデン王立科学アカデミーは、2024年度ノーベル化学賞を、半分をデイビッド・ベイカー氏に「計算によるタンパク質設計」で、残りの半分をデミス・ハサビス氏とジョン・ジャンパー氏に「タンパク質構造予測」で授与することを決定しました。
  18. ^ a b Hunt, Christian Edwards, Katie (2024年10月9日). 「AIを使ってほぼ全てのタンパク質のコードを解読した科学者がノーベル化学賞を受賞」 . CNN . 2024年10月10日時点のオリジナルよりアーカイブ。 2024年10月9日閲覧{{cite news}}: CS1 maint: 複数の名前: 著者リスト (リンク)
  19. ^ a b Knapp, Alex. 「2023年のブレークスルー賞発表:DeepmindのProtein Foldersが300万ドルを受賞」 Forbes . 2024年5月9日時点のオリジナルよりアーカイブ。 2024年5月9日閲覧
  20. ^ a b c「AlphaFold:科学的発見のためのAIの活用」Deepmind 2020年1月15日。2022年3月7日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  21. ^ Mohammed AlQuraishi (2019年5月), AlphaFold at CASP13 Archived 2021-11-22 at the Wayback Machine , Bioinformatics , 35 (22), 4862–4865 doi : 10.1093/bioinformatics/btz422 . また、Mohammed AlQuraishi (2018年12月9日), AlphaFold @ CASP13: "What just happened?" Archived 2022-07-29 at the Wayback Machine (ブログ投稿) も参照のこと。Mohammed AlQuraishi (2020年1月15日)、タンパク質構造予測の画期的な瞬間、 Wayback Machineで2022年6月23日にアーカイブ Nature 577、627–628 doi : 10.1038/d41586-019-03951-0
  22. ^ AlphaFold: タンパク質構造予測のための機械学習Archived 2022-05-12 at the Wayback Machine , Foldit , 2020年1月31日
  23. ^ a b Jumper, John; et al. (2021年8月). 「AlphaFoldを用いた高精度タンパク質構造予測」 . Nature . 596 ( 7873): 583– 589. Bibcode : 2021Natur.596..583J . doi : 10.1038/s41586-021-03819-2 . ISSN 1476-4687 . PMC 8371605. PMID 34265844 .   
  24. ^ a b「DeepMindは生物学最大の課題の一つに答えている」エコノミスト2020年11月30日ISSN 0013-06132020年12月3日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧 
  25. ^ a bジェレミー・カーン「ディープマインドのタンパク質折り畳みAIにおけるブレークスルーから学ぶこと」Wayback Machineで2022年4月8日にアーカイブフォーチュン、2020年12月1日
  26. ^ a b c dブロック図を参照。また、John Jumper(2020年12月1日)、AlphaFold 2のプレゼンテーション(Wayback Machineで2022年7月3日にアーカイブ) 、スライド10も参照。
  27. ^ John Jumper他、会議要旨(2020年12月)
  28. ^構造モジュールは「3次元等変トランスフォーマーアーキテクチャ」を使用すると述べられている(John Jumper et al. (1 December 2020)、 AlphaFold 2のプレゼンテーションArchived 2022-07-03 at the Wayback Machine、スライド12)。SE (3)変を 持つトランスフォーマーネットワークの1つの設計はFabian Fuchs et al SE(3)-Transformers: 3D Roto-Translation Equivariant Attention Networks Archived 2021-10-07 at the Wayback Machine NeurIPS 2020で提案された。またウェブサイトArchived 2022-07-03 at the Wayback Machine。これがAlphaFoldで使用されていたものとどの程度類似しているかは不明である。これについては、AlQuaraishiによる2020年12月8日Wayback Machineのブログ記事、またはFabian Fuchsよる20227月3日Wayback Machineのより詳細な記事も参照してください。
  29. ^ John Jumper et al. (2020年12月1日)、 AlphaFold 2のプレゼンテーション、Wayback Machineで2022年7月3日にアーカイブ、スライド12~20
  30. ^ Callaway, Ewen (2022年4月13日). 「AlphaFoldとAIタンパク質フォールディング革命の今後」 . Nature . 604 (7905): 234– 238. Bibcode : 2022Natur.604..234C . doi : 10.1038/d41586-022-00997-5 . PMID: 35418629. S2CID : 248156195 .  
  31. ^ Metz, Cade (2024年5月8日). 「Google、ヒト分子の行動を予測するAIを発表」 . The New York Times . ISSN 0362-4331 . 2024年10月10日時点のオリジナルよりアーカイブ。 2024年5月9日閲覧 
  32. ^ 「AlphaFold-3の非商用サーバー」2024年10月10日時点のオリジナルよりアーカイブ2024年5月12日閲覧。
  33. ^ 「Google Scholar」 . scholar.google.com . 2025年5月1日閲覧
  34. ^複合Zスコアに基づくグループパフォーマンスArchived 2022-03-08 at the Wayback Machine、CASP 13、2018年12月。(AlphaFold = Team 043: A7D)
  35. ^ a bイアン・サンプル(2018年12月2日)「GoogleのDeepMindがタンパク質の3D形状を予測」ガーディアン紙2019年7月18日時点のオリジナルよりアーカイブ2020年11月30日閲覧
  36. ^ 「AlphaFold:科学的発見のためのAIの活用」 Deepmind 2020年1月。2024年10月10日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  37. ^ Singh, Arunima (2020). 「ディープラーニング3D構造」 . Nature Methods . 17 (3): 249. doi : 10.1038/s41592-020-0779- y . ISSN 1548-7105 . PMID 32132733. S2CID 212403708 .   
  38. ^ CASP 13のデータテーブルを参照2022年3月14日アーカイブ、Wayback Machine、 043 A7D、322 Zhang、089 MULTICOM)
  39. ^ Wei Zheng et al , CASP13におけるディープラーニングによるコンタクトマップ誘導タンパク質構造予測Archived 2022-01-22 at the Wayback Machine , Proteins: Structure, Function, and Bioinformatics , 87 (12) 1149–1164 doi : 10.1002/prot.25792 ; およびスライドArchived 2022-07-26 at the Wayback Machine
  40. ^ Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (2019-04-25). 「CASP13におけるディープラーニングと接触距離予測によるタンパク質三次構造モデリング」 . Proteins : Structure, Function, and Bioinformatics . 87 (12). Wiley: 1165– 1178. bioRxiv 10.1101/552422 . doi : 10.1002/prot.25697 . ISSN 0887-3585 . PMC 6800999. PMID 30985027 .    
  41. ^ a b「DeepMindの画期的な技術、病気が細胞に侵入する仕組みの解明に貢献」 Bloomberg.com 2020年11月30日。2022年4月5日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  42. ^ “deepmind/deepmind-research” . GitHub . 2022年2月1日時点のオリジナルよりアーカイブ2020年11月30日閲覧。
  43. ^ a b c「AlphaFold:生物学における50年来の大きな課題への解決策」Deepmind、2020年11月30日。2020年11月30日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  44. ^ 「DeepMindのタンパク質折り畳みAIが生物学における50年来の大きな課題を解決」 MITテクノロジーレビュー2021年8月28日時点のオリジナルよりアーカイブ。 2020年11月30日閲覧
  45. ^使用される GDT_TS 測定では、予測内の各原子は、実験位置から 8 Å (0.80 nm) 以内であれば 1/4 ポイント、4 Å 以内であれば 1/2 ポイント、2 Å 以内であれば 3/4 ポイント、1 Å 以内であれば 1 ポイントを獲得します。
  46. ^ GDT_TSスコア92.5を達成するには、数学的に構造の少なくとも70%が1Å以内の精度で、少なくとも85%が2Å以内の精度でなければなりません。
  47. ^ Callaway, Ewen (2022年12月13日). 「AlphaFoldの後:タンパク質フォールディングコンテスト、次なる大きなブレークスルーを模索」 . Nature . 613 ( 7942): 13– 14. doi : 10.1038/d41586-022-04438-1 . PMID 36513827. S2CID 254660427 .  
  48. ^ 50年来の科学的課題に対する人工知能の解決策は、医学研究に「革命」をもたらす可能性がある。Wayback Machineで2022年4月24日にアーカイブ(プレスリリース)、 CASP組織委員会、2020年11月30日
  49. ^ブリジット・ネルリッヒ「タンパク質フォールディングと科学コミュニケーション:誇大宣伝と謙虚さの間」 2022年2月15日アーカイブノッティンガム大学ブログ、2020年12月4日
  50. ^ディープマインドのAI生物学者マイケル・ル・ペイジは生命の仕組みの秘密を解読できる。2022年8月2日アーカイブニューサイエンティスト、2020年11月30日
  51. ^ DeepMindの最新AIの予測は医療に革命を起こす可能性がある 2021年11月7日アーカイブNew Scientist 2020年12月2日
  52. ^ Tom Whipple、「Deepmindがタンパク質問題の答えで生物学の「聖杯」を見つける」 The Times(オンライン版)、2020年11月30日トム・ホイップルはこの件に関してThe Timesに6つの記事を寄稿した。(このスレッドは2021年11月8日にWayback Machineアーカイブされています)。
  53. ^ケイド・メッツロンドンAIラボ、創薬を加速させる画期的な成果を主張、2022年8月4日アーカイブニューヨーク・タイムズ、2020年11月30日
  54. ^ Ian Sample, DeepMind AI cracks 50-year-old problem of protein folding archived 2020-11-30 at the Wayback Machine , The Guardian , 2020年11月30日
  55. ^リジー・ロバーツ、「Google AI研究者が50年来の生物学的課題を解決、一世代に一度の進歩」 2022年8月4日アーカイブ、 Wayback Machineデイリー・テレグラフ、2020年11月30日
  56. ^ティム・ハバード「生命の秘密、第2部:タンパク質折りたたみ問題の解決」。 2022年5月14日アーカイブ、Wayback Machine medium.com、2020年11月30日
  57. ^例えば、グレッグ・ボウマン、「タンパク質の折り畳みと関連する問題は、アルファフォールドの進歩にもかかわらず未解決のままである」、 2022年7月13日にWayback Machineアーカイブ Folding@homeブログ、2020年12月8日
  58. ^ Sample, Ian (2023年9月21日). 「AIプログラムAlphaFoldの背後にあるチームがラスカー科学賞を受賞」 . The Guardian . ISSN 0261-3077 . 2024年10月10日時点のオリジナルよりアーカイブ。 2024年5月9日閲覧 
  59. ^ 「2024年ノーベル化学賞」NobelPrize.org . 2024年10月9時点のオリジナルよりアーカイブ2024年10月10日閲覧。
  60. ^ドミンゲス、ヌーニョ (2020-12-02). 「生物学上の重要な問題に関する人工的な問題」エル・パイス(スペイン語)。2022-07-26 のオリジナルからアーカイブされました2024 年 5 月 12 日に取得
  61. ^ Briggs, David (2020年12月4日). 「GoogleのAlphafold2が本当にタンパク質折り畳みの問題を解決したのであれば、その仕組みを示す必要がある」 . The Skeptic . 2024年5月12日時点のオリジナルよりアーカイブ。 2024年5月12日閲覧
  62. ^デミス・ハサビス「#AlphaFold のエキサイティングな進捗状況に関する最新情報!」 2022年7月22日アーカイブ、Wayback Machine(ツイート)、 Twitter経由、2021年6月18日
  63. ^ google-deepmind/alphafold3、Google DeepMind、2025年2月8日、 2025年2月8日取得
  64. ^ ByteDance AML AI4Science チーム;チェン、シンシー。張玉軒。ルー、チャン。馬文志。グアン、ジアチー。ゴン・チェンユエ。ヤン、ジンツァイ。張、羽生。張柯;ウー、シェンハオ。周、光斉。楊、延平。劉振宇。王、蘭。シ、ボー。シー、シャオチェン。シャオ・ウェンジ(2025-01-11)。 「Protenix - 包括的な AlphaFold3 再現による構造予測の進歩」。bioRxiv 10.1101/2025.01.08.631967 {{cite bioRxiv}}: CS1 maint: 数値名: 著者リスト (リンク)
  65. ^ナダフ、ミリヤム (2025 年 10 月 28 日)。 「オープンソースのタンパク質構造AIはAlphaFoldに匹敵することを目指す」。自然土井10.1038/d41586-025-03546-yPMID 41152525 
  66. ^ Lin, Z; Akin, H; Rao, R; Hie, B; Zhu, Z; Lu, W; Smetanin, N; Verkuil, R; Kabeli, O; Shmueli, Y; Dos Santos Costa, A; Fazel-Zarandi, M; Sercu, T; Candido, S; Rives, A (2023年3月17日). 「言語モデルを用いた原子レベルタンパク質構造の進化スケール予測」 . Science (ニューヨーク, NY) . 379 (6637): 1123– 1130. Bibcode : 2023Sci...379.1123L . doi : 10.1126/science.ade2574 . PMID 36927031 . 
  67. ^ Mirdita, Milot; Schütze, Konstantin; Moriwaki, Yoshitaka; Heo, Lim; Ovchinnikov, Sergey; Steinegger, Martin (2022-05-30). 「ColabFold: タンパク質フォールディングを誰もがアクセスできるようにする」. Nature Methods . 19 (6): 679– 682. doi : 10.1038/s41592-022-01488-1 . PMC 9184281. PMID 35637307 .  
  68. ^ 「AlphaFoldタンパク質構造データベース」 . alphafold.ebi.ac.uk . 2022年7月29日時点のオリジナルよりアーカイブ。 2021年7月29日閲覧
  69. ^ 「AlphaFoldタンパク質構造データベース」 alphafold.ebi.ac.uk . 2022年7月29日時点のオリジナルよりアーカイブ2021年7月27日閲覧。
  70. ^ 「AlphaFoldタンパク質構造データベース」www.alphafold.ebi.ac.uk . 2022年8月2時点のオリジナルよりアーカイブ2021年7月24日閲覧。
  71. ^ InterPro (2021年7月22日). 「InterproでAlphafold構造予測が利用可能」 . proteinswebteam.github.io . 2021年11月5日時点のオリジナルよりアーカイブ。 2021年7月29日閲覧
  72. ^ 「AlphaFoldのパワーを世界の手に」Deepmind、2022年7月22日。2021年7月24日時点のオリジナルよりアーカイブ。 2021年7月24日閲覧
  73. ^キャロウェイ、エウェン (2022年7月28日) .「『タンパク質宇宙全体』:AIがほぼすべての既知のタンパク質の形状を予測。Nature 608 ( 7921 ) : 15– 16。Bibcode : 2022Natur.608 ... 15C。doi : 10.1038 / d41586-022-02083-2。PMID 35902752。S2CID 251159714  
  74. ^ a b Lau, Andy M.; Bordin, Nicola; Kandathil, Shaun M.; Sillitoe, Ian; Waman, Vaishali P.; Wells, Jude; Orengo, Christine A.; Jones, David T. (2024年11月). 「ドメイン百科事典によるタンパク質宇宙の構造多様性の探究」. Science . 386 (6721). doi : 10.1126/science.adq4946 .
  75. ^フレミング、ジェニファー;マガナ、パウリナ。ナイア、スリーナス。ツェンコフ、マキシム。ベルトーニ、ダミアン。ピドルチナ、イヴァンナ。リマ・アフォンソ、マルセロ・クエリーノ。ミドリク、アダム。パランヴァル、ウルミラ。ジデク、アウグスティン。レイドン、アガタ。コバレフスキー、オレグ。パン、ジョシュア。チェン、ジュン;アヴセック、ジガ;クレア・バイクロフト。ウォン、ライホン。最後に、ミーラ。ミルディタ、ミロット。シュタイネッガー、マーティン。コーリ、プッシュミート。ヴァラディ、ミハイ;サミール州ヴェランカー(2025年8月)。「AlphaFold タンパク質構造データベースと 3D ビーコン: 新しいデータと機能」分子生物学ジャーナル437 (15) 168967. doi : 10.1016/j.jmb.2025.168967 . PMID 40133787 . 
  76. ^ヘッケルマン、マーテン L.;デ・フリース、アイダ。ロビー・P・ヨーステン。ペラキス、アナスタシス(2023年2月)。「AlphaFill: リガンドと補因子による AlphaFold モデルの強化」ネイチャーメソッド20 (2): 205–213ビブコード: 2023NatCB..20..205H土井10.1038/s41592-022-01685-yPMC 9911346PMID 36424442  
  77. ^ a bロシニョーリ、セレーナ、パチェッリ、マッダレーナ、マンガニエッロ、アレッサンドロ・パイアルディーニ(2025年2月)。アルファフォールド後の構造生物学展望:ツール、限界、そして展望」。FEBS Open Bio。15 ( 2 ): 202– 222。doi : 10.1002 /2211-5463.13902。PMC 11788754。PMID 39313455  
  78. ^アンナ・シュパチコヴァ;ヴァーヴラ、オンドジェ;ラチェク、トマーシュ。バズギエ、ヴァーツラフ。デビッド・セナル。ダンボルスキー、イジー。スヴォボドヴァ、ラドカ。デビッド・ベドナーシュ;カレル、ベルカ(2024年1月5日)。「ChannelsDB 2.0: AlphaFold 時代のタンパク質トンネルと細孔の包括的なデータベース」核酸研究52 (D1): D413 – D418。土井10.1093/nar/gkad1012PMC 10767935PMID 37956324  
  79. ^ Lang, Benjamin; Babu, M. Madan (2025). 「AlphaSyncはUniProtと同期した拡張AlphaFold構造データベースです」. Nature Structural & Molecular Biology . 32 (12): 2628– 2632. bioRxiv 10.1101/2025.03.12.642845 . doi : 10.1038/s41594-025-01719-x . 
  80. ^ Sommer, Markus J; Cha, Sooyoung; Varabyou, Ales; Rincon, Natalia; Park, Sukhwan; Minkin, Ilia; Pertea, Mihaela; Steinegger, Martin; Salzberg, Steven L (2022年12月15日). 「ヒトトランスクリプトーム構造誘導アイソフォーム同定」 . eLife . 11 e82556. doi : 10.7554/eLife.82556 . PMC 9812405. PMID 36519529 .  
  81. ^ a b「AlphaFoldがサポートしていないユースケースとは?」 AlphaFoldタンパク質構造データベース2022年7月29日時点のオリジナルよりアーカイブ。 2022年5月15日閲覧
  82. ^ AlphaFold は生物学と医学におけるデータ駆動型革命の先駆けとなるArchived 2024-10-10 at the Wayback Machine Janet M. Thornton、Roman A. Laskowski & Neera Borkakoti、 Nature Medicine、第12巻、1666–1669ページ、2021年10月12日
  83. ^ McBride, John M.; Polev, Konstantin; Abdirasulov, Amirbek; Reinharz, Vladimir; Grzybowski, Bartosz A.; Tlusty, Tsvi (2023-11-20). 「AlphaFold2は単一変異の影響を予測できる」 . Physical Review Letters . 131 (21) 218401. arXiv : 2204.06860 . Bibcode : 2023PhRvL.131u8401M . doi : 10.1103/PhysRevLett.131.218401 . ISSN 0031-9007 . PMID 38072605. 2024年6月9日時点オリジナルよりアーカイブ2023年11月26日閲覧  
  84. ^ McBride, John M.; Tlusty, Tsvi (2024-08-26). 「AI予測によるタンパク質変形はエネルギーランドスケープの摂動を符号化する」 . Physical Review Letters . 133 (9) 098401. arXiv : 2311.18222 . Bibcode : 2024PhRvL.133i8401M . doi : 10.1103/PhysRevLett.133.098401 . ISSN 0031-9007 . PMID 39270162 .  
  85. ^ Abramson, Josh; Adler, Jonas; Dunger, Jack; Evans, Richard; Green, Tim; Pritzel, Alexander; Ronneberger, Olaf; Willmore, Lindsay; Ballard, Andrew J.; Bambrick, Joshua; Bodenstein, Sebastian W.; Evans, David A.; Hung, Chia-Chun; O'Neill, Michael; Reiman, David (2024年6月). 「AlphaFold 3を用いた生体分子相互作用の正確な構造予測」 . Nature . 630 (8016): 493– 500. Bibcode : 2024Natur.630..493A . doi : 10.1038/s41586-024-07487-w . ISSN 1476-4687 . PMC 11168924 . PMID 38718835 .   
  86. ^ Bagdonas, Haroldas; Fogarty, Carl A.; Fadda, Elisa; Agirre, Jon (2021-10-29). 「AlphaFoldタンパク質構造データベースにおける予測後の修正の事例」 ( PDF) . Nature Structural & Molecular Biology . 28 (11): 869– 870. doi : 10.1038/s41594-021-00680-9 . ISSN 1545-9985 . PMID 34716446. S2CID 240228913. 2024年1月13日時点のオリジナルよりアーカイブ(PDF) . 2024年1月13日閲覧.   
  87. ^ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (2009-10-01). 「糖タンパク質におけるグリコシル化部位と部位特異的不均一性の決定」 . Current Opinion in Chemical Biology . Analytical Techniques/Mechanisms. 13 (4): 421– 426. doi : 10.1016/j.cbpa.2009.07.022 . ISSN 1367-5931 . PMC 2749913. PMID 19700364 .   
  88. ^シュクリニャル、ピーター;エバーハルト、ジェローム。タウリエロ、ヘラルド。シュヴェーデ、トルステン。ドゥライラージ、ジャナニ (2025-08-04)。 「タンパク質とリガンドの共フォールディング法は暗記の域を超えたのでしょうか?」bioRxiv 10.1101/2025.02.03.636309 
  89. ^ Masters, Matthew R.; Mahmoud, Amr H.; Lill, Markus A. (2025-10-06). 「コフォールディングのためのディープラーニングモデルがタンパク質-リガンド相互作用の物理を学習するかどうかの調査」 . Nature Communications . 16 (1): 8854. Bibcode : 2025NatCo..16.8854M . doi : 10.1038/s41467-025-63947-5 . ISSN 2041-1723 . PMC 12501370. PMID 41053181 .   
  90. ^ Dabrowski-Tumanski, Pawel; Stasiak, Andrzej (2023年11月7日). 「AlphaFoldのトポロジカルバリアに対する盲目性は、タンパク質のトポロジーを正しく予測する能力に影響を与える」 . Molecules . 28 (22) : 7462. doi : 10.3390/molecules28227462 . PMC 10672856. PMID 38005184 .  
  91. ^ 「DeepMindの最新のAIブレークスルーは、創薬を加速させる可能性がある」 Fast Company . ISSN 1085-9241 . 2023年1月24日時点のオリジナルよりアーカイブ。 2023年1月24日閲覧 
  92. ^ Aubel, Margaux; Eicholt, Lars; Bornberg-Bauer, Erich (2023-03-29). 「機械学習時代における新規タンパク質の構造・無秩序性予測ツールの評価」 . F1000Research . 12 : 347. doi : 10.12688/f1000research.130443.1 . PMC 10126731. PMID 37113259 .  
  93. ^ Michaud, Jennifer M.; Madani, Ali; Fraser, James S. (2022年11月). 「言語モデルは孤児遺伝子においてalphafold2に勝る」 . Nature Biotechnology . 40 (11): 1576– 1577. doi : 10.1038/s41587-022-01466-0 . PMC 9669189. PMID 36192635 .  
  94. ^ Middendorf, Lasse; Eicholt, Lars A. (2024年6月). 「ランダムタンパク質、de novoタンパク質、そして保存タンパク質:構造予測因子と無秩序予測因子の性能の違い」 . Proteins . 92 (6): 757– 767. doi : 10.1002/prot.26652 . PMID 38226524 . 
  95. ^ Liu, Jing; Yuan, Rongqing; Shao, Wei; Wang, Jitong; Silman, Israel; Sussman, Joel L. (2023年8月). 「「新しく生まれた」孤児タンパク質は「生まれなかった」タンパク質に似ているか? 3つのディープラーニングアルゴリズムを用いた研究」 . Proteins . 91 (8): 1097– 1115. doi : 10.1002/prot.26496 . PMID 37092778 . 
  96. ^ 「AIは科学者がCOVID-19ワクチンを見つけるのを助けることができる」 Wired。ISSN 1059-1028 2022年4月23時点のオリジナルよりアーカイブ。 2020年12月1日閲覧 
  97. ^ a b「COVID-19に関連するタンパク質構造の計算予測」Deepmind、2020年8月4日。2022年3月25日時点のオリジナルよりアーカイブ。 2020年12月1日閲覧
  98. ^ 「DeepMindの新しいタンパク質折り畳みAIは、コロナウイルスパンデミックとの闘いに既に役立っている」 Fortune2020年11月30日時点のオリジナルよりアーカイブ。 2020年12月1日閲覧

さらに読む