配列アライメントソフトウェアのリスト

この配列アライメントソフトウェアのリストは、ペアワイズ配列アライメントおよび多重配列アライメントに使用されるソフトウェアツールとウェブポータルをまとめたものですタンパク質の 構造アライメントについては、構造アライメントソフトウェアをご覧ください。

データベース検索のみ

名前説明シーケンスタイプ*著者
ブラスト高速k-tupleヒューリスティックによる局所探索(基本的な局所アライメント探索ツール)両方アルトシュル SFギッシュ Wミラー Wマイヤーズ EWリップマン DJ [1]1990
HPC-BLASTNCBI準拠のマルチノードおよびマルチコアBLASTラッパー。最新バージョンのBLASTに同梱されているこのラッパーは、多数のノードと各ノード内に多数のコアを持つ最新のハイブリッドアーキテクチャ上でアルゴリズムの並列化を容易にします。[2]タンパク質Burdyshaw CE、Sawyer S、Horton MD、Brook RG、Rekapalli B2017
CS-ブラスト配列コンテキスト特異的BLASTは、BLAST、FASTA、SSEARCHよりも感度が高い。位置特異的反復版CSI-BLASTはPSI-BLASTよりも感度が高い。タンパク質アンガーミュラー C、ビーガート A、ソーディング J [3]2013
CUDASW++複数の共有ホスト GPU 向けの GPU アクセラレーション Smith Waterman アルゴリズムタンパク質Liu Y、Maskell DL、Schmidt B2009/2010
ダイヤモンド二重インデックスに基づくBLASTXおよびBLASTPアライナータンパク質Buchfink B、Xie C、Huson DH、Reuter K、Drost HG [4] [5]2015/2021
ファスタ高速なk組ヒューリスティックによる局所探索。BLASTよりも遅いが感度が高い。両方
GGSEARCH、GLSEARCH統計によるグローバル:グローバル (GG)、グローバル:ローカル (GL) の整合タンパク質
ゲノムマジシャンNGS データの超高速ローカル DNA 配列モチーフ検索およびペアワイズ アライメント用のソフトウェア (FASTA、FASTQ)。DNAヘッパーレ D (www.sequentix.de)2020
ジェヌーグルGenoogleは、DNAおよびタンパク質配列の検索にインデックス作成と並列処理技術を使用しています。Javaで開発され、オープンソースです。両方アルブレヒト F2015
ハマーPSI-BLASTよりも感度の高いプロファイル隠れマルコフモデルによる局所的および全体的検索両方ダービン Rエディ SRクロー A、ミッチソン G [6]1998
HHスイートプロファイル隠れマルコフモデルのペアワイズ比較;非常に感度が高いタンパク質ゼーディング J [7] [8]2005/2012
イスラエル国防軍逆文書頻度両方
地獄のプロフィールSCFG検索RNAエディS
クラスト高性能汎用配列類似性検索ツール両方2009/2014
ラムダBLAST と互換性がありながら、はるかに高速な高性能ローカル アライナー。SAM/BAM をサポートタンパク質ハンネス・ハウスウェデル、ヨッヘン・シンガー、クヌート・ライナート[9]2014
MMseqs2膨大な配列セットを検索・クラスタリングするためのソフトウェアスイート。BLASTやPSI-BLASTと同等の感度を持ちながら、桁違いに高速です。タンパク質シュタイネッガー M、ミルディータ M、ガリエス C、セーディング J [10]2017
検索超高速配列解析ツール両方Edgar, RC (2010). 「BLASTよりも桁違いに高速な検索とクラスタリング」バイオインフォマティクス26 ( 19): 2460– 2461. doi : 10.1093/bioinformatics/btq461 . PMID  20709691.出版物2010
オズワルドOpenCL Smith-Waterman氏による大規模タンパク質データベース向けAltera FPGAについてタンパク質ルッチ E、ガルシア C、ボテラ G、デ ジュスティ A、ナイウフ M、プリエトマティアス M [11]2016
パラセールSIMD並列化を用いた高速スミス・ウォーターマン探索両方デイリーJ2015
サイブラスト位置特異的反復BLAST、位置特異的スコアリング行列による局所探索、BLASTよりもはるかに感度が高いタンパク質アルトシュール SF、マッデン TL、シェーファー AA、チャン J、チャン Z、ミラー Wリップマン DJ [12]1997
PSI検索Smith-Waterman 検索アルゴリズムとPSI-BLASTプロファイル構築戦略を組み合わせて、遠縁のタンパク質配列を見つけ、相同過剰拡張エラーを防止します。タンパク質リー・W、マクウィリアム・H、グージョン・M、カウリー・A、ロペス・R、ピアソン・WR [13]2012
R&RRetrieve and Relate (R&R) は、DNA、RNA、タンパク質の配列を並行して検索できる、高性能かつ高感度なマルチデータベース検索エンジンです。両方2019
スカラブラスト高度に並列化されたスケーラブルなBLAST両方オエメンら[14]2011
セキラブNCBI-BLASTの結果から得られた配列アライメントデータを主要な配列解析サーバー/サービスにリンクし、プロファイリングするヌクレオチド、ペプチド2010
サムPSI-BLASTよりも感度の高いプロファイル隠れマルコフモデルによる局所的および全体的検索両方カルプラスKクロッグA [15]1999
検索Smith-Waterman検索はFASTAよりも遅いが感度が高い両方
スワフィ語スミス・ウォーターマンタンパク質データベース検索を高速化するために、新興のインテル Xeon Phi を採用した初の並列化アルゴリズムタンパク質Liu YとSchmidt B2014
スワフィ-LSインテル Xeon Phi クラスターを活用した初の並列 Smith-Waterman アルゴリズムにより長い DNA 配列のアラインメントを高速化DNALiu Y、Tran TT、Lauenroth F、Schmidt B2014
水泳Intel マルチコアおよびメニーコア アーキテクチャ向けの Smith-Waterman 実装タンパク質ルッチ E、ガルシア C、ボテラ G、デ ジュスティ A、ナイウフ M、プリエトマティアス M [16]2015
スイム2.0AVX-512ベクトル拡張に基づくIntelのマルチコアおよびメニーコアアーキテクチャ上の強化されたSmith-Watermanタンパク質ルッチ E、ガルシア C、ボテラ G、デ ジュスティ A、ナイウフ M、プリエトマティアス M [17]2018
スワイプSIMD並列化を用いた高速スミス・ウォーターマン探索両方ログネスT2011

*配列の種類:タンパク質またはヌクレオチド

ペアワイズアライメント

名前説明シーケンスタイプ*アライメントタイプ**著者
アカナ高速ヒューリスティックアンカーベースのペアワイズアライメント両方両方ファン、ウンバッハ、リー2005
アラインミー膜タンパク質配列のアライメントタンパク質両方M. スタム、K. カフィゾフ、R. スターリッツビヒラー、LR フォレスト2013
オールアライン32MBまでのDNA、RNA、タンパク質分子について、サイズK以上のすべての配列をアラインメントします。類似のアラインメントはグループ化され、解析に使用されます。繰り返し配列は自動フィルターでフィルタリングされます。両方地元E. ワクテル2017
バイオコンダクターバイオストリングス::ペアワイズアライメント動的計画法両方両方 + 両端無料P.アボユン2008
バイオパールdpAlign動的計画法両方両方 + 両端無料YMチャン2003
ブラスト、ラストシードパターンマッチングヌクレオチド地元シュワルツ[18] [19]2004年、2009年
コドンコードアライナー複数のアルゴリズムを使用した高速なペアワイズおよびマルチシーケンスアライメント。ヌクレオチド両方コドンコード株式会社2003-2025
CUDAlign単一または複数の GPU で無制限のサイズの DNA 配列アライメントヌクレオチドローカル、セミグローバル、グローバルE.サンデス[20] [21] [22]2011-2015
DNAドットWebベースのドットプロットツールヌクレオチドグローバルR. ボーエン1998
ドットレットJavaベースのドットプロットツール両方グローバルM. パグニとT. ジュニエ1998
ごちそう記述的進化モデルを用いた事後的局所拡張ヌクレオチド地元AKフデックとDGブラウン2010
ゲノムコンパイラ ゲノムコンパイラクロマトグラム ファイル (.ab1、.scf) をテンプレート シーケンスに対して整列させ、エラーを見つけて即座に修正します。ヌクレオチド地元ゲノムコンパイラ株式会社2014
G-PASバックトラッキングを備えた GPU ベースの動的プログラミング両方ローカル、セミグローバル、グローバルW. Frohmberg、M. Kierzynka 他2011
ギャップミス1つのギャップを持つペアワイズ配列アライメントは両方セミグローバルK. フルーシオス、T. フルーリ、CS イリオプロス、K. パーク、SP ピシス、G. ティシュラー2012
ゲノムマジシャンNGS データの超高速ローカル DNA 配列モチーフ検索およびペアワイズ アライメント用のソフトウェア (FASTA、FASTQ)。DNAローカル、セミグローバル、グローバルヘッパーレ D (www.sequentix.de)2020
GGSEARCH、GLSEARCH統計によるグローバル:グローバル (GG)、グローバル:ローカル (GL) の整合タンパク質クエリ内のグローバルW. ピアソン2007
Jアライナー Smith-WatermanのJavaオープンソース実装両方地元A. ムスタファ2005
K*シンク二次構造、構造保存、構造由来の配列プロファイル、コンセンサスアライメントスコアを含むタンパク質配列と構造のアライメントタンパク質両方D.チビアンとD.ベイカー[23]2003
ラライン重複しない複数の局所類似性(SIMと同じアルゴリズム)両方局所的に重複しないW. ピアソン1991年(アルゴリズム)
北西方向標準の Needleman-Wunsch 動的プログラミング アルゴリズムタンパク質グローバルY・チャン2012
マッチャーウォーターマン・エッガート局所アラインメント(LALIGNに基づく)両方地元I. ロングデン(W. ピアソンより改変)1999
マカリグ2インデル進化の明示的なモデルDNAグローバルJ. Wang2006
MegAlign Pro(レーザージーン分子生物学)MUSCLE、Mauve、MAFFT、Clustal Omega、Jotun Hein、Wilbur-Lipman、Martinez Needleman-Wunsch、Lipman-Pearson、Dotplot 分析などのペアワイズおよびマルチシーケンスアライメントアルゴリズムを使用して、DNA、RNA、タンパク質、または DNA + タンパク質シーケンスをアライメントするソフトウェア。両方両方DNAスター1993-2016
MUMmerサフィックスツリーベースヌクレオチドグローバルS. Kurtz2004
Needleman-Wunsch動的プログラミング両方セミグローバルA. ブレズビー1999
ンギラ対数およびアフィンギャップコストとインデル進化の明示的モデル両方グローバルR.カートライト2007
北西Needleman-Wunsch動的プログラミング両方グローバルACRマーティン1990-2015
パラセールSSE、AVX2 向け C/C++/Python/Java SIMD 動的プログラミング ライブラリ両方グローバル、エンズフリー、ローカルJ.デイリー2015
パスタンパク質翻訳 グラフにおけるスミス・ウォーターマン(タンパク質レベルでのフレームシフトの検出)タンパク質地元M. Gîrdea[24]2009
パターンハンターシードパターンマッチングヌクレオチド地元B. Ma[25] [26]2002~2004年
ProbA(propAとも呼ばれる)動的計画法による確率的分割関数サンプリング両方グローバルU. ミュックシュタイン2002
ピモル「align」コマンドは配列を整列させて構造に適用しますタンパク質グローバル(選択による)WLデラノ2007
評判サフィックスツリーベースヌクレオチド地元S. Kurtz2001
サーベルトゥース予測された接続プロファイルを使用したアライメントタンパク質グローバルF. タイヒェルト、J. ミニング、U. バストーラ、M. ポルト2009
薩摩並列全ゲノムシンテニーアライメントDNA地元MG Grabherr2010
シークアルンさまざまな動的計画法両方ローカルかグローバルかMSウォーターマンとP.ハーディ1996
SIM、ギャップ、ナップ、ラップギャップ処理を変えた場合の局所類似性両方ローカルかグローバルかX. 黄とW. ミラー1990-6
シム局所的な類似性両方地元X. 黄とW. ミラー1991
SPA: スーパーペアワイズアライメント高速ペアワイズグローバルアライメントヌクレオチドグローバルシェン、ヤン、ヤオ、ファン2002
検索統計による局所(スミス・ウォーターマン)アライメントタンパク質地元W. ピアソン1981年(アルゴリズム)
シーケンススタジオ[27]の様々なアルゴリズムを実演するJavaアプレット一般的な配列ローカルとグローバルA.メスカウスカス1997年(参考図書)
スイフォールド長い DNA 配列のための Intel FPGA と OpenCL による Smith-Waterman アクセラレーションヌクレオチド地元E.ルッチ[28] [29]2017-2018
SWIFTスーツ高速ローカルアライメント検索DNA地元K.ラスムッセン、[30] W.ゲル​​ラッハ2005年、2008年
担架メモリ最適化ニードルマン・ヴンシュ動的計画法両方グローバルI. Longden(G. MyersとW. Millerの論文を改変)1999
トランアラインタンパク質アラインメントに基づいて核酸配列をアラインメントするヌクレオチド該当なしG. ウィリアムズ(B. ピアソンより改変)2002
ウゲネSSE/CUDA 用オープンソース Smith-Waterman、サフィックス配列ベースのリピートファインダーとドットプロット両方両方ユニプロ2010
スミス・ウォーターマン動的計画法両方地元A. ブレズビー1999
単語マッチk組のペアワイズマッチ両方該当なしI. ロングデン1998
ヤスシードパターンマッチングヌクレオチド地元L.ノエとG.クチェロフ[31]2004

*配列の種類:タンパク質またはヌクレオチド **アライメントの種類:ローカルまたはグローバル

多重配列アライメント

名前説明シーケンスタイプ*アライメントタイプ**著者ライセンス
ABAA-Bruijnアライメントタンパク質グローバルB.Raphael2004教育、研究、非営利団体向けのプロプライエタリフリーウェア
エール手動調整、ソフトウェアによる支援ヌクレオチド地元J. ブランディとK. フォーゲル1994年(最新版2007年)無料、GPL 2
オールアライン最大32MBのDNA、RNA、タンパク質分子について、サイズK以上、MSA、または単一分子内のすべての配列をアラインメントします。類似のアラインメントはグループ化され、解析に使用されます。自動繰り返し配列フィルターも搭載されています。両方地元E. ワクテル2017無料
AMAP配列アニーリング両方グローバルA. シュワルツとL. パクター2006
バリフィツリー+マルチアライメント; 確率ベイズ; 結合推定両方 + コドングローバルBD レデリングスと MA スチャード2005年(最新バージョン2018年)無料、GPL
基地ごとに統合解析ツールを備えた Java ベースの多重配列アライメント エディタ両方ローカルかグローバルかR. Brodie2004独自仕様フリーウェア、登録が必要
カオス、ダイアライン反復的なアライメント両方ローカル(推奨)M. ブルドノとB. モルゲンシュテルン2003
クラスタルプログレッシブアライメント両方ローカルかグローバルかトンプソン1994無料、LGPL
コドンコードアライナーマルチアライメント; Muscle、Clustal、PhrapをサポートヌクレオチドローカルかグローバルかP. Richterich2003(最新バージョン2024)
コンパス複数のタンパク質配列アライメントの比較と統計的有意性の評価タンパク質グローバルRI Sadreyev2009
解読漸進的反復アライメント両方グローバルエリック・S・ライト2014無料、GPL
DIALIGN-TX および DIALIGN-Tセグメントベースの方法両方ローカル(推奨)またはグローバルARスブラマニアン2005年(最新バージョン2008年)
DNAアライメント種内アラインメントのためのセグメントベースの方法両方ローカル(推奨)またはグローバルA.ローエル2005年(最新バージョン2008年)
DNAベース配列アセンブラマルチアライメント、完全自動配列アライメント、自動曖昧性修正、内部ベースコーラー、コマンドラインシーケンスアライメントヌクレオチドローカルかグローバルかヘラクル・バイオソフトSRL2006年(最新バージョン2018年)商用(一部のモジュールはフリーウェア)
DNAダイナモMUSCLEClustal、Smith-WatermanよるDNAとタンパク質の多重アラインメント両方ローカルかグローバルかDNAダイナモ2004年(最新バージョン2017年)
エドナDNA結合部位のエネルギーベースの多重配列アライメントヌクレオチドローカルかグローバルかサラマ、RA. 他2013
ファムサ非常に大規模なタンパク質ファミリー(数十万のメンバー)の漸進的アラインメントタンパク質グローバルDeorowiczら2016無料、GPL 3
FSA配列アニーリング両方グローバルRKブラッドリー他2008
天才的なプログレッシブ反復アライメント; ClustalWプラグイン両方ローカルかグローバルかAJ ドラモンド2005年(最新バージョン2017年)
ガイダンス多重配列アライメントの品質管理とフィルタリング両方ローカルかグローバルかO. ペン2010年(最新バージョン2015年)
カリンプログレッシブアライメント両方グローバルT.ラスマン2005
マクセプログレッシブ反復アライメント。フレームシフトと終止コドンを考慮したコーディング配列の多重アライメント。ヌクレオチドグローバルV. Ranwez2011(最新バージョン、v2.07 2023)
マフト漸進的反復アライメント両方ローカルかグローバルか加藤 健一2005フリー、BSD
マーナRNAのマルチアライメントRNA地元S. Siebert2005
マビッドプログレッシブアライメント両方グローバルN. ブレイとL. パクター2004
MegAlign Pro(レーザージーン分子生物学)MUSCLE、Mauve、MAFFT、Clustal Omega、Jotun Hein、Wilbur-Lipman、Martinez Needleman-Wunsch、Lipman-Pearson、Dotplot 分析などのペアワイズおよびマルチシーケンスアライメントアルゴリズムを使用して、DNA、RNA、タンパク質、または DNA + タンパク質シーケンスをアライメントするソフトウェア。両方ローカルかグローバルかDNAスター1993-2023
MSA動的計画法両方ローカルかグローバルかDJ Lipman1989年(1995年改訂)
MSAProbs動的計画法タンパク質グローバルY. リュー、B. シュミット、D. マスケル2010
マルチリン動的計画法-クラスタリング両方ローカルかグローバルかF. コルペット1988
マルチLAGANプログレッシブダイナミックプログラミングアライメント両方グローバルM. Brudno2003
プログレッシブ反復アライメント(v3)、確率的/一貫性(v5)両方ローカルかグローバルかR. エドガー2004パブリックドメイン
オパール漸進的反復アライメント両方ローカルかグローバルかT. ウィーラーとJ. ケセチオグル2007 (最新安定版 2013、最新ベータ版 2016)
ピーカン確率的一貫性DNAグローバルB. Paten2008
フィロ比較ゲノミクスにおける多重アライメントを解決するためのヒューマンコンピューティングフレームワークヌクレオチドローカルかグローバルかマギル大学バイオインフォマティクス2010
PMファストRプログレッシブ構造を考慮したアライメントRNAグローバルD. デブラシオ、J ブラウンド、S チャン2009
プラリネプレプロファイリングと二次構造予測による漸進的反復一貫性相同性拡張アライメントタンパク質グローバルJ. ヘリンガ1999年(最新版2009年)
ピクXAA非漸進的、最大期待精度アライメント両方グローバルSME SahraeianとBJ Yoon2010
委任状半順序/隠れマルコフモデルタンパク質ローカルかグローバルかC. リー2002
プロバライン確率論的/パーティション関数の確率との一貫性タンパク質グローバルロシャンとリヴセイ2006無料、パブリックドメイン
問題点確率論/一貫性タンパク質ローカルかグローバルかC. Do2005無料、パブリックドメイン
プロマル3Dプログレッシブアライメント/隠れマルコフモデル/二次構造/3D構造タンパク質グローバルJ. Pei2008
PRRN/PRRP反復的な調整(特に改良)タンパク質ローカルかグローバルかY. Totoki (O. Gotoh に基づく)1991年以降
PSアラインアライメント保存非ヒューリスティック両方ローカルかグローバルかSH Sze、Y. Lu、Q. Yang。2006
レブトランスタンパク質のアライメントを DNA に逆翻訳することで、DNA とタンパク質のアライメントを組み合わせます。DNA/タンパク質(特殊)ローカルかグローバルかヴェルナーソンとペダーセン2003(最新バージョン2005)
サガ遺伝的アルゴリズムによる配列アライメントタンパク質ローカルかグローバルかC. ノートルダム1996年(新版1998年)
サム隠れマルコフモデルタンパク質ローカルかグローバルかA. Krogh1994年(最新版は2002年)
シール手動調整両方地元A. ランボー2002
スタットアラインベイズ法によるアラインメントと系統発生の共推定(MCMC)両方グローバルA. Novak2008
ステムロック多重アライメントと二次構造予測RNAローカルかグローバルかI. ホームズ2005無料、GPL 3(DART の一部)
Tコーヒーより敏感なプログレッシブアライメント両方ローカルかグローバルかC. ノートルダム2000年(最新バージョンは2008年)無料、GPL 2
ウゲネMUSCLE、KAlign、ClustalMAFFTプラグインによる多重アライメントをサポート両方ローカルかグローバルかUGENEチーム2010年(最新バージョン2020年)無料、GPL 2
ベクターフレンズVectorFriends Aligner、MUSCLEプラグイン、Clustal Wプラグイン両方ローカルかグローバルかバイオフレンズチーム2013学術目的でのみ利用 可能な独自のフリーウェア
GLProbs適応型ペア隠れマルコフモデルに基づくアプローチタンパク質グローバルY. Ye2013

*配列の種類:タンパク質またはヌクレオチド。**アライメントの種類:ローカルまたはグローバル

ゲノミクス解析

名前説明シーケンスタイプ*
イーグル[32]ゲノムデータ中の相対的に欠落している単語を見つける超高速ツールヌクレオチド
ACT(アルテミス比較ツール)シンテニーと比較ゲノミクスヌクレオチド
熱心な全ゲノムを用いたペアワイズグローバルアライメントヌクレオチド
ブラットcDNA 配列をゲノムにアラインメントします。ヌクレオチド
解読6フレーム翻訳を用いた再配置ゲノムのアライメントヌクレオチド
対空砲ファジー全ゲノムアライメントと解析ヌクレオチド
GMAPcDNA配列をゲノムにアライメントします。スプライス部位の接合部を高精度で特定します。ヌクレオチド
スプラインcDNA配列をゲノムにアライメントします。スプライス部位の接合部を高精度に特定します。遺伝子重複を認識し、分離することができます。ヌクレオチド
モーブ再編成されたゲノムの多重アライメントヌクレオチド
MGA多重ゲノムアライナーヌクレオチド
ムーランゲノム長配列の局所多重アライメントヌクレオチド
マルチズゲノムの多重アライメントヌクレオチド
PLAST-ncRNAパーティション関数のローカルアラインメントによるゲノム中のncRNAの検索ヌクレオチド
セケローム主要なサーバー/サービスによる配列アライメントデータのプロファイリングヌクレオチド、ペプチド
セキラブNCBI-BLASTの結果から主要なサーバーサービスを使用して配列アライメントデータをプロファイリングするヌクレオチド、ペプチド
シャッフル-LAGAN完成したゲノム領域のペアワイズグローバルアライメントヌクレオチド
SIBsim4、シム4イントロンを考慮して、発現したDNA配列をゲノム配列と整合させるように設計されたプログラムヌクレオチド
スラム遺伝子の発見、アライメント、注釈(ヒトとマウスの相同性の同定)ヌクレオチド
SRPRISM明示的な保証のあるアセンブリのための効率的なアライナー。スプライスなしでリードをアラインメントします。ヌクレオチド

*配列の種類:タンパク質またはヌクレオチド


モチーフの発見

名前説明シーケンスタイプ*
月経前緊張症モチーフの探索と発見両方
FMMモチーフの検索と発見(エンリッチドモチーフ検索の入力として、正と負の配列も取得可能)ヌクレオチド
ブロックBLOCKSデータベースからのギャップのないモチーフの同定両方
eMOTIF短いモチーフの抽出と識別両方
ギブスモチーフサンプラー統計的尤度による確率的モチーフ抽出両方
HMMTOP膜貫通ヘリックスとタンパク質のトポロジーの予測タンパク質
Iサイト局所構造モチーフライブラリタンパク質
Jコイルコイルドコイルロイシンジッパーの予測タンパク質
ミーム/マストモチーフの発見と検索両方
CUDAミームGPU クラスター向けの GPU アクセラレーション MEME (v4.4.0) アルゴリズム両方
ありがとう識別的モチーフの発見と探索両方
PHI-ブラストモチーフ検索およびアライメントツール両方
フィロスカンモチーフ検索ツールヌクレオチド
プラットScanPrositeで使用するためのパターン生成タンパク質
スキャンプロサイトMotifデータベース検索ツールタンパク質
テイレシアスモチーフ抽出とデータベース検索両方
玄武岩複数のモチーフと正規表現の検索両方

*配列の種類:タンパク質またはヌクレオチド


ベンチマーク

名前著者
PFAM 30.0 (2016)
スマート(2015)レトゥニック、コプリー、シュミット、チッカレッリ、ドークス、シュルツ、ポンティング、ボルク
バリベース3 (2015)トンプソン、プルニャック、ポチェッティーノ
オックスベンチ(2011)ラガバ、サール、オードリー、バーバー、バートン
ベンチマークコレクション(2009)エドガー
ホムストラッド(2005)水口
プレファブ 4.0 (2005)エドガー
SABマーク(2004)ヴァン・ウォーレ、ラスターズ、ウィンズ

アライメント閲覧者、編集者

アライメント可視化ソフトウェア一覧をご覧ください

ショートリード配列アライメント

名前説明ペアエンドオプションFASTQ品質を使用ギャップマルチスレッドライセンス参照
アリオック1台以上のGPU上で、Smith-Watermanギャップアライメントとマッピング品質を計算します。BS-seqアライメントをサポートします。1秒あたり10万~50万回の読み取り処理が可能です(データ、ハードウェア、および設定された感度によって異なります)。はいいいえはいはいフリー、BSD[33]2015
バラCUDABWA に基づくGPGPU 加速Burrows–Wheeler 変換(FM インデックス) ショート リード アライメント プログラムは、ギャップ オープニングと拡張によるインデルのアライメントをサポートします。はいいいえはいはい、POSIXスレッドCUDA無料、GPL
BBマップ短いkmerを用いてゲノムを迅速にインデックス化します。サイズやスキャフォールド数に制限はありません。Burrows–Wheelerアライナーよりも高い感度と特異性を持ち、同等かそれ以上の速度で実行できます。アフィン変換最適化されたグローバルアライメントを実行します。Smith-Watermanアライナーよりも遅いものの、より正確です。Illumina、454、PacBio、Sanger、Ion Torrentのデータに対応しています。スプライスアウェアで、長いインデルやRNA-seqを処理できます。Pure Javaで動作し、あらゆるプラットフォームで動作します。Joint Genome Instituteで使用されています。はいはいはいはいフリー、BSD2010
朝食事前の精度推定と明確な時間と精度のトレードオフを、参照配列のインデックス作成によってサポートします。インデックスを最適に圧縮します。数十億ものショートリードを処理できます。挿入、欠失、SNP、およびカラーエラー(ABI SOLiDカラースペースリードのマッピングが可能)に対応しています。完全なSmith Watermanアライメントを実行します。はい、POSIXスレッド無料、GPL[34]2009
ビッグBWABurrows–Wheeler Aligner -BWA をHadoopクラスター上で実行します。BWA-MEM、BWA-ALN、BWA-SW の各アルゴリズムをサポートし、ペアリードとシングルリードの両方で動作します。Hadoop クラスターで実行した場合、計算時間が大幅に短縮され、スケーラビリティとフォールトトレランスが向上します。はい低品質のベースのトリミングはいはい無料、GPL 3[35]2015
ブラステンBLAST のヌクレオチド アライメント プログラムは、短い読み取りに対しては遅く、正確ではなく、参照ゲノムではなく、配列データベース (EST、サンガー配列) を使用します。
ブラットJim Kent。初期アライメントステップで1つの不一致を処理できます。はい、クライアントサーバー学術的および非商用目的の使用のための独自フリーウェア[36]2002
ちょうネクタイBurrows-Wheeler変換を用いて、ゲノムの永続的かつ再利用可能なインデックスを作成します。ヒトゲノムの場合、メモリ使用量は1.3GBです。1CPU時間で2,500万件以上のIlluminaリードをアラインメントできます。MaqおよびSOAPのようなアラインメントポリシーをサポートします。はいはいいいえはい、POSIXスレッド自由、芸術的[37]2009
BWABurrows–Wheeler変換を用いてゲノムのインデックスを作成します。Bowtieよりも少し遅いですが、アライメント中に挿入欠失(indel)を許容します。はい低品質のベースのトリミングはいはい無料、GPL[38]2009
BWA-PSSM位置特異的スコアリングマトリックス(PSSM)を用いた確率的ショートリードアライナー。このアライナーは、リードの品質スコアと、古代DNA、PAR-CLIPデータ、あるいは偏ったヌクレオチド組成を持つゲノムなどで観察されるデータ固有のバイアスモデルを考慮できるという点で適応性が高い。[39]はいはいはいはい無料、GPL[39]2014
キャッシュX大量のショートリードシーケンスデータを定量化し、管理します。CASHXパイプラインには、組み合わせて使用​​することも、モジュールとして個別に使用することもできるツールセットが含まれています。このアルゴリズムは、リファレンスゲノムへのパーフェクトヒットを非常に正確に検出します。いいえ学術的および非商用目的の使用のための独自フリーウェア
集中豪雨Hadoop MapReduce を使用したショートリードマッピングはい、Hadoop MapReduce自由、芸術的
コドンコードアライナー高速アセンブリ、品質スコアに対応した正確なコンセンサス配列。コンティグ比較、Phred、Phrap、Bowtieに対応。数百の異なるクローンに対して個別のコンティグを作成することも、数千の配列を含む単一のコンティグを作成することもできます。はいはいはいはい独自商用
CUDA-ECGPU を使用したショートリードアライメントエラーの修正。はい、GPUが有効です
クショーBurrows-Wheeler変換に基づく大規模ゲノムに対するCUDA互換のショートリードアライナーはいはいいいえはい(GPU有効)無料、GPL[40]2012
クショー2最大完全一致シードに基づく、ギャップ付きショートリードおよびロングリードアライメント。このアライナーは、ベーススペース(Illumina、454、Ion Torrent、PacBioシーケンサーなど)とABI SOLiDカラースペースリードアライメントの両方をサポートします。はいいいえはいはい無料、GPL2014
CUSHAW2-GPUGPU アクセラレーション CUSHAW2 ショート リード アライナー。はいいいえはいはい無料、GPL
クーショー3ハイブリッドシーディングによる高感度かつ正確なベーススペースおよびカラースペースのショートリードアライメントはいいいえはいはい無料、GPL[41]2012
ドクターファストmrFASTやmrsFASTと同様にキャッシュの忘却性を実装し、メインメモリ/キャッシュメモリ転送を最小限に抑えるリードマッピングアライメントソフトウェアですが、SOLiDシーケンシングプラットフォーム(カラースペースリード)向けに設計されています。また、構造変異の検出を向上させるために、すべての可能なマップ位置を返します。はいはい、構造的変異のためはいいいえフリー、BSD
エランドIllumina によって実装されています。有限のリード長を持つギャップなしのアライメントが含まれます。
エルネNGSリードの正確なアライメントを実現する拡張ランダム化数値アライナー。亜硫酸水素塩処理されたリードもマッピング可能です。はい低品質のベースのトリミングはいマルチスレッドとMPI対応無料、GPL 3
ガススト大規模なDNAバンクに対して短いDNA配列のグローバルアラインメントを見つけるマルチスレッドCeCILLバージョン 2 ライセンス。[42]2011
宝石高品質なアライメントエンジン(置換およびインデルを含む網羅的なマッピング)。BWAやBowtie 1/2よりも正確で、数倍高速です。マッパー、スプリットマッパー、マッピング可能性など、多数の独立した生物学アプリケーションが提供されています。はいはいはいはい無料、GPL 3[43]2012
ジェナリス地図高精度でストレージフットプリントが小さい、超高速かつ包括的な NGS 読み取りアライナー。はい低品質のベースのトリミングはいはい独自商用
天才的なアセンブラシーケンス技術、読み取り長、任意のペアリング方向、ペアリングの任意のスペーサー サイズ、参照ゲノムの有無など、あらゆる組み合わせを処理できる、高速で正確なオーバーラップ アセンブラーです。はい独自商用
ジェンサーチNGSNGSデータを解析するための、ユーザーフレンドリーなGUIを備えた包括的なフレームワークです。独自の高品質アライメントアルゴリズムと、様々な公開アライナーをフレームワークに統合できるプラグイン機能を備えており、ショートリードのインポート、アライメント、バリアント検出、レポート生成が可能です。診断現場におけるリシーケンシングプロジェクト向けに設計されています。はいいいえはいはい独自商用
GMAPとGSNAP堅牢で高速なショートリードアライメント。GMAP:複数のインデルとスプライスを含む長いリード(上記の「ゲノミクス解析」の項目を参照)。GSNAP:リードごとに1つのインデルまたは最大2つのスプライスを含む短いリード。デジタル遺伝子発現、SNP、およびインデルジェノタイピングに有用。ジェネンテックのThomas Wu氏によって開発。Alpheusで国立ゲノム資源センター(NCGR)が使用。はいはいはいはい学術的および非商用目的の使用のための独自フリーウェア
GNUMAP次世代シーケンサー(特にSolexa-Illumina社製)から得られた配列データを、あらゆるサイズのゲノムに正確にギャップアライメントします。アダプタートリミング、SNPコール、バイサルファイトシーケンス解析が含まれます。はい、各塩基の4つの品質スコアすべてを含むIllumina *_int.txtおよび*_prb.txtファイルもサポートしていますマルチスレッドとMPI対応[44]2009
HIVE六角形ハッシュテーブルとブルームマトリックスを用いて、ゲノム上の潜在的な位置を生成・フィルタリングします。効率を高めるために、短いリード間の相互類似性を利用し、重複する非一意配列の再アライメントを回避します。BowtieやBWAよりも高速で、ウイルス、細菌、そしてより保守的な真核生物のアライメントにおいて、インデルや分岐に敏感なアライメントが可能です。はいはいはいはいHIVEデプロイメントインスタンスに登録された学術および非商用ユーザー向けの独自フリーウェア[45]2014
IMOSSpark 上のメタアライナーと Minimap2 の改良。単一ノード実行に対して線形スケーラビリティを備えた、Apache Spark プラットフォーム上のロングリード分散アライナーです。はいはいはい無料
アイザック1つのサーバーノードで利用可能なすべてのコンピューティング能力を最大限に活用するため、幅広いハードウェアアーキテクチャに拡張でき、ハードウェアの能力に応じてアライメントパフォーマンスが向上します。はいはいはいはい無料、GPL
最後適応型シードを使用し、反復配列の多い配列(ゲノムなど)をより効率的に処理します。例えば、反復ヒットに圧倒されることなく、反復マスキングなしでリードをゲノムにアラインメントできます。はいはいはいはい無料、GPL[46]2011
マックス各塩基の品質スコアを考慮したギャップのないアライメント。無料、GPL
ミスターファスト、ミスターファストギャップ付き(mrFAST)およびギャップなし(mrsFAST)アライメントソフトウェアは、キャッシュの忘却性を実装することでメインメモリ/キャッシュメモリの転送を最小限に抑えます。Illuminaシーケンシングプラットフォーム向けに設計されており、構造変異の検出を向上させるために、あらゆるマップ位置を返すことができます。はいはい、構造的変異のためはいいいえフリー、BSD
お母さんMOM または最大オリゴヌクレオチド マッピングは、短い読み取り内で最大の長さの一致をキャプチャするクエリ マッチング ツールです。はい
モザイク高速ギャップアライナーおよびリファレンスガイドアセンブラ。k-merハッシュスキームの結果をシードとするバンド型Smith-Watermanアルゴリズムを用いてリードをアラインメントします。非常に短いリードから非常に長いリードまで、幅広いリードサイズをサポートします。はい
MPスキャンフィルタリング戦略に基づく高速アライナー(インデックスなし、q-gram と後方非決定性DAWGマッチングを使用)[47]2009
ノボアライン&ノボアラインCSシングルエンドおよびペアエンドのIllumina GA I & II、ABIカラースペース、ION Torrentリードのギャップアライメント。アライメントの全ステップで塩基クオリティを活用し、高い感度と特異性を実現します。アダプタートリミング、塩基クオリティキャリブレーション、Bi-Seqアライメント、そしてリードごとに複数のアライメントを報告するオプションが含まれています。一般的なSNPを参照する際に曖昧なIUPACコードを使用することで、SNPリコール率を向上させ、アレルバイアスを排除できます。はいはいはいマルチスレッドおよびMPIバージョンは有料ライセンスで利用可能学術的および非商用目的向けの独自のフリーウェアシングルスレッドバージョン
ネクストジェネRoche Genome Sequencer FLX、Illumina GA/HiSeq、Life Technologies Applied BioSystems の SOLiD System、PacBio、および Ion Torrent プラットフォームからの次世代シーケンス データの分析を実行する生物学者向けに開発されました。はいはいはいはい独自商用
ネクストジェンマップ柔軟で高速なリードマッピングプログラム(BWAの2倍の速度)は、Stampyに匹敵するマッピング感度を実現します。内部的にはメモリ効率の高いインデックス構造(ハッシュテーブル)を使用し、リファレンスゲノムに存在する13塩基すべての位置を保存します。ペアワイズアライメントが必要なマッピング領域は、リードごとに動的に決定されます。高速SIMD命令(SSE)を使用することで、CPUでのアライメント計算を高速化します。利用可能な場合、アライメント計算はGPU(OpenCL/CUDAを使用)で行われ、実行時間をさらに20~50%短縮します。はいいいえはいはい、POSIX スレッド、OpenCL/ CUDA、SSE無料[48]2013
Omixon バリアントツールキットSNPおよびインデルを検出するための高感度・高精度ツールが含まれています。リファレンスゲノムから中程度の距離(配列差異最大30%)にあるNGSショートリードをマッピングするソリューションを提供します。リファレンスゲノムのサイズに制限はなく、高感度と相まって、バリアントツールキットはターゲットシーケンシングプロジェクトや診断に最適です。はいはいはいはい独自商用
PALマッパースプライスされたアライメントとスプライスされていないアライメントの両方を、高精度かつ効率的に計算します。機械学習戦略と、バンド型スミス・ウォーターマン型アルゴリズムに基づく高速マッピングを組み合わせることで、1CPUで1時間あたり約700万リードのアライメントを実現します。これは、当初提案されたQPALMAアプローチを改良したものです。はい無料、GPL
パルテックフロー生物学者およびバイオインフォマティクス研究者向け。Illumina、Life technologies Solid TM、Roche 454、Ion Torrentの生データ(品質情報の有無は問いません)から、シングルエンドおよびペアエンドリードのギャップなし、ギャップあり、スプライスジャンクションのアライメントをサポートします。FASTQ/Qualレベルおよびアライメントデータに対する強力な品質管理機能を備えています。追加機能として、生リードのトリミングとフィルタリング、SNPおよび挿入欠失の検出、mRNAおよびmicroRNAの定量、融合遺伝子の検出などがあります。はいはいはいマルチプロセッサコア、クライアントサーバーインストールが可能独自仕様商用、無料試用版
合格ゲノムをインデックス化し、事前に計算された単語のアライメントを用いてシードを拡張します。ベーススペース、カラースペース(SOLID)に対応し、ゲノムリードとスプライスされたRNA-seqリードのアライメントが可能です。はいはいはいはい学術的および非商用目的の使用のための独自フリーウェア
パーM周期的なシードを用いてゲノムをインデックス化し、最大4つのミスマッチまで感度の高いアライメントを迅速に見つけます。IlluminaおよびSOLiDのリードをマッピングできます。多くのマッピングプログラムとは異なり、リード長が長いほど速度が向上します。はい無料、GPL[49]
プライメックス調整可能なミスマッチ数まで感度の高いK-merルックアップテーブルを用いてゲノムをインデックスします。15~60bpの配列をゲノムにマッピングするのに最適です。いいえいいえはいいいえ、検索ごとに複数のプロセスがあります[1]2003
Qパルマ品質スコア、イントロン長、そして計算によるスプライスサイト予測を用いて、バイアスのないアライメントを実行できます。RNA-seq実験とゲノムの特性に合わせてトレーニングできます。スプライスサイト/イントロンの検出や遺伝子モデルの構築に役立ちます。(より高速なバージョンについては、PALMapperをご覧ください。)はい、クライアントサーバー無料、GPL 2
レイザーSリード長の制限はありません。ハミング距離または編集距離マッピングは、エラー率の設定が可能です。感度は設定可能かつ予測可能です(実行時間と感度のトレードオフ)。ペアエンドリードマッピングをサポートします。無料、LGPL
リアル、クリアルREALは、次世代シーケンシングで得られたショートリードをアライメントするための、効率的、正確、かつ高感度なツールです。このプログラムは、次世代Illumina/Solexa Genome Analyzerによって生成された膨大な量のシングルエンドリードを処理できます。cREALは、次世代シーケンシングで得られたショートリードを環状構造を持つゲノムにアライメントするための、REALのシンプルな拡張版です。はいはい無料、GPL
RMAPエラー確率情報(クオリティスコア)の有無にかかわらずリードをマッピングでき、ペアエンドリードまたはバイサルファイト処理されたリードマッピングをサポートします。リード長やミスマッチ数に制限はありません。はいはいはい無料、GPL 3
RNANGSリードの正確なアライメントのためのランダム化数値アライナはい低品質のベースのトリミングはいマルチスレッドとMPI対応無料、GPL 3
RTG調査員極めて高速で、高いインデルおよび置換数にも耐性があります。フルリードアライメントが含まれています。製品には、Illumina、Complete Genomics、Roche 454データの任意の組み合わせによる変異検出とメタゲノム解析のための包括的なパイプラインが含まれています。はいはい、変異体呼び出しの場合はいはい個人の研究者が使用するための独自のフリーウェア
セゲメル挿入、削除、不一致を処理可能。拡張サフィックス配列を使用はいいいえはいはい非商用利用のための独自のフリーウェア[50]2009
シーケンスマップ最大5つの置換と挿入・削除の混合、さまざまなチューニングオプションと入出力形式学術的および非商用目的の使用のための独自フリーウェア
シュレックサフィックスツリーデータ構造によるショートリードエラー訂正はい、Java
シュリンプバージョン2の参照ゲノムをインデックスします。マスクを使用して可能なキーを生成します。ABI SOLiDカラースペースリードをマッピングできます。はいはいはいはい、OpenMPフリー、[[BSDライセンスフリー、BSD派生

[51] [52]

2009-2011
スライダーSlider は、参照シーケンスまたは参照シーケンス セットへのアライメントの入力としてシーケンス ファイルの代わりに「確率」ファイルを使用する Illumina Sequence Analyzer 出力用のアプリケーションです。はいはいいいえいいえ[53] [54]2009-2010
SOAP、SOAP2、SOAP3、SOAP3-dpSOAP: 少数(1~3)のギャップとミスマッチに対して堅牢です。BLATよりも高速で、12文字のハッシュテーブルを使用します。SOAP2: 双方向BWTを使用して参照インデックスを構築し、最初のバージョンよりも大幅に高速化されています。SOAP3: GPUアクセラレーション版では、4ミスマッチアライメントを100万回の読み取りあたり数十秒で検出できます。SOAP3-dpもGPUアクセラレーションに対応しており、アフィンギャップペナルティスコアに基づいて任意の数のミスマッチとギャップをサポートします。はいいいえはい、SOAP3-dpはい、POSIX スレッド、SOAP3、SOAP3-dp にはCUDAをサポートする GPU が必要です。無料、GPL[55] [56]
ソックスABI SOLiDテクノロジー向け。ミスマッチ(またはカラーエラー)のあるリードのマッピング時間が大幅に増加します。Rabin-Karp文字列検索アルゴリズムの反復バージョンを使用します。はい無料、GPL
スパークBWAHadoop上で動作するApache SparkフレームワークにBurrows–Wheeler Aligner(BWA)を統合します。2016年10月のバージョン0.2では、BWA-MEM、BWA-backtrack、BWA-ALNの各アルゴリズムをサポートしています。これらはすべて、シングルリードとペアエンドリードで動作します。はい低品質のベースのトリミングはいはい無料、GPL 3[57]2016
SSAHA、SSAHA2少数の変異体に対して高速学術的および非商用目的の使用のための独自フリーウェア
スタンピーIlluminaリード用。特異性が高く、インデル、構造変異、または多数のSNPを含むリードに対して感度が高い。処理速度は遅いが、最初のアライメントパスにBWAを使用することで速度が劇的に向上する。はいはいはいいいえ学術的および非商用目的の使用のための独自フリーウェア[58]2010
IlluminaまたはABI SOLiDリード用。SAMネイティブ出力。エラーやインデル(0~15までは完全、それ以外は拡張サポート)の多いリードに対して高感度。スペースシード(シングルヒット)と非常に高速なSSE - SSE2 - AVX2 - AVX-512バンドアライメントフィルターを使用します。固定長リードのみを対象とし、それ以外の場合はSHRiMP2を推奨します。いいえはいはいはい、OpenMP無料[59]2010
下臥位、下臥位超高速かつ高精度なリードアライナー。SubreadはgDNA-seqとRNA-seqの両方のリードをマッピングできます。Subjuncはエクソン-エクソンジャンクションを検出し、RNA-seqリードをマッピングします。彼らはシード・アンド・ボートと呼ばれる新しいマッピングパラダイムを採用しています。はいはいはいはい無料、GPL 3
タイパンIllumina 読み取り用の De-novo アセンブラー学術的および非商用目的の使用のための独自フリーウェア
ウゲネBowtieとBWAの両方のビジュアルインターフェースと埋め込みアライナーはいはいはいはい無料、GPL
ベロシマッパーTimeLogic社のFPGAアクセラレーションによるリファレンス配列アライメントマッピングツール。BWAやBowtieなどのBurrows–Wheeler変換ベースのアルゴリズムよりも高速です。パフォーマンスの低下なく、最大7つのミスマッチおよび/またはインデルをサポートします。感度の高いSmith–Watermanギャップアライメントを生成します。はいはいはいはい独自商用
エクスプレスアラインFPGAベースのスライディングウィンドウ・ショートリード・アライナーは、ショートリード・アライメントの驚異的な並列性を活用します。チップ上のトランジスタ数に比例してパフォーマンスが向上します(つまり、アルゴリズムを変更することなく、ムーアの法則の各反復ごとにパフォーマンスが2倍になることが保証されています)。低消費電力はデータセンター機器に有効です。実行時間は予測可能です。現在のハードウェア上で動作するソフトウェア・スライディングウィンドウ・アライナーよりも価格性能比は優れていますが、現状ではソフトウェアBWTベースのアライナーほどではありません。多数のミスマッチ(2以上)に対応可能です。すべてのシードに対してすべてのヒット位置を検出します。シングルFPGAの実験版であり、マルチFPGAの製品版への開発が必要です。学術的および非商用目的の使用のための独自フリーウェア
ズーム15~240bpのリードに対し、実質的なミスマッチを含む100%の感度を実現。非常に高速。挿入と欠失に対応。IlluminaおよびSOLiD機器で動作しますが、454では動作しません。はい (GUI)、いいえ (CLI)独自商用[60]

参照

参考文献

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (1990年10月). 「基本的なローカルアライメント検索ツール」. J​​ournal of Molecular Biology . 215 (3): 403–10 . doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.{{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
  2. ^ HPC-BLAST コードリポジトリ https://github.com/UTennessee-JICS/HPC-BLAST
  3. ^ Angermüller, C.; Biegert, A.; Söding, J. (2012年12月). 「文脈特異的なアミノ酸置換確率の識別的モデリング」.バイオインフォマティクス. 28 (24): 3240–7 . doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID  23080114.
  4. ^ Buchfink, Xie and Huson (2015). 「DIAMONDを用いた高速かつ高感度なタンパク質アライメント」Nature Methods 12 (1): 59– 60. doi : 10.1038/nmeth.3176. PMID  25402007. S2CID  5346781.
  5. ^ B Buchfink、K Reuter、HG Drost (2021). 「DIAMONDを用いた生命樹スケールでの高感度タンパク質アラインメント」Nature Methods . 18 (4): 366– 368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID  33828273. 
  6. ^ リチャード・ダービン、ショーン・R・エディ、アンダース・クロー、グレアム・ミッチソン編 (1998). 『生物学的配列解析:タンパク質と核酸の確率モデル』ケンブリッジ大学出版局(英国). ISBN 978-0-521-62971-3[ページが必要]
  7. ^ Söding J (2005年4月). 「HMM-HMM比較によるタンパク質相同性検出」.バイオインフォマティクス. 21 (7): 951–60 . doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID  15531603.
  8. ^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). 「HHblits:HMM-HMMアライメントによる超高速反復タンパク質配列探索」. Nature Methods . 9 (2): 173– 175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN  1548-7105. PMID  22198341. S2CID  205420247.
  9. ^ Hauswedell H, Singer J, Reinert K (2014-09-01). 「Lambda: 大規模生物学的データのためのローカルアライナー」. Bioinformatics . 30 (17): 349– 355. doi :10.1093/bioinformatics/btu439. PMC 4147892. PMID  25161219 . 
  10. ^ Steinegger, Martin; Soeding, Johannes (2017-10-16). 「MMseqs2は、大規模データセットの解析において高感度なタンパク質配列検索を可能にする」 . Nature Biotechnology . 35 (11): 1026– 1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID  29035372. S2CID  402352.
  11. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). 「OSWALD: Altera FPGA 上で動作する OpenCL Smith–Waterman による大規模タンパク質データベース」. International Journal of High Performance Computing Applications . 32 (3): 337– 350. doi :10.1177/1094342016654215. hdl : 11336/48798 . ISSN  1094-3420. S2CID  212680914.
  12. ^ Altschul SF, Madden TL, Schäffer AA, et al. (1997年9月). 「Gapped BLASTとPSI-BLAST:新世代のタンパク質データベース検索プログラム」. Nucleic Acids Research . 25 (17): 3389– 402. doi :10.1093/nar/25.17.3389. PMC 146917. PMID 9254694  . 
  13. ^ Li W, McWilliam H, Goujon M, et al. (2012年6月). 「PSI-Search: 反復HOE縮小プロファイルSSEARCH検索」.バイオインフォマティクス. 28 (12): 1650– 1651. doi :10.1093/bioinformatics/bts240. PMC 337186 ​​9. PMID  22539666. 
  14. ^ Oehmen, C.; Nieplocha, J. (2006年8月). 「ScalaBLAST: 高性能データ集約型バイオインフォマティクス解析のためのスケーラブルなBLAST実装」. IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740– 749. doi :10.1109/TPDS.2006.112. S2CID  11122366.
  15. ^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: 配列アライメントおよびモデリングソフトウェアシステム. 技術レポート UCSC-CRL-99-11 (レポート). カリフォルニア大学サンタクルーズ校.
  16. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). 「IntelのマルチコアおよびメニーコアアーキテクチャにおけるSWIMM: Smith–Waterman実装のエネルギーを考慮したパフォーマンス分析」. Concurrency and Computation: Practice and Experience . 27 (18): 5517– 5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN  1532-0634. S2CID  42945406.
  17. ^ ルッチ、エンツォ;ガルシア、カルロス。ボテラ、ギレルモ。デ・ジュスティ、アルマンド。ナイウフ、マルセロ。プリエト=マティアス、マヌエル(2015-12-25)。 「SWIMM 2.0: AVX-512 ベクトル拡張に基づく Intel のマルチコアおよびメニーコア アーキテクチャ上の拡張 Smith-Waterman」。並列プログラミングの国際ジャーナル47 (2): 296–317土井:10.1007/s10766-018-0585-7。ISSN  1573-7640。S2CID  49670113。
  18. ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). 「BLASTZを用いたヒト-マウスアライメント」. Genome Research . 13 (1): 103– 107. doi :10.1101/gr.809403. PMC 430961. PMID  12529312 . {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
  19. ^ Harris RS (2007).ゲノムDNAのペアワイズアライメントの改良(論文).
  20. ^ Sandes, Edans F. de O.; de Melo, Alba Cristina MA (2013年5月). 「GPUを用いたメガベース生物学的配列のSmith-Watermanアライメントの取得と最適化」. IEEE Transactions on Parallel and Distributed Systems . 24 (5): 1009– 1021. doi :10.1109/TPDS.2012.194.
  21. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年5月). CUDAlign 3.0: 大規模GPUクラスターにおける並列生物学的配列比較. Cluster, Cloud and Grid Computing (CCGrid), 2014 第14回IEEE/ACM国際シンポジウム. p. 160. doi :10.1109/CCGrid.2014.18. hdl : 2117/24766 .
  22. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年8月).複数の異種GPUを用いた細粒度並列メガベースシーケンス比較. 第19回ACM SIGPLAN並列プログラミングの原理と実践シンポジウムの議事録. pp.  383– 384. doi :10.1145/2555243.2555280. hdl : 2117/23094 .
  23. ^ Chivian, D; Baker, D (2006). 「パラメトリックアライメントアンサンブル生成を用いたコンセンサスおよびエネルギーベースのモデル選択によるホモロジーモデリング」. Nucleic Acids Research . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247. PMID  16971460 . 
  24. ^ Girdea, M; Noe, L; Kucherov, G (2010年1月). 「フレームシフト変異が存在する場合の遠距離タンパク質相同性発見のためのバックトランスレーション」.分子生物学アルゴリズム. 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327. PMID  20047662 . 
  25. ^ Ma, B.; Tromp, J.; Li, M. (2002). 「PatternHunter:より高速で高感度な相同性検索」.バイオインフォマティクス. 18 (3): 440– 445. doi : 10.1093/bioinformatics/18.3.440 . PMID  11934743.
  26. ^ Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). 「Patternhunter II:高感度かつ高速な相同性検索」. Journal of Bioinformatics and Computational Biology . 2 (3): 417– 439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID  15359419. 
  27. ^ ガスフィールド、ダン (1997).文字列、木、シーケンスのアルゴリズム. ケンブリッジ大学出版局. ISBN 978-0-521-58519-4
  28. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). 「SWIFOLD: 長いDNA配列のためのOpenCLを用いたFPGAによるSmith-Waterman実装」. BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597. PMID  30458766 . 
  29. ^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. FPGA上でOpenCLを用いた長鎖DNA配列のSmith-Watermanアライメントの高速化. 第5回国際バイオインフォマティクスおよびバイオメディカルエンジニアリング研究会議. pp.  500– 511. doi :10.1007/978-3-319-56154-7_45.
  30. ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). 「与えられた長さにおけるすべてのイプシロンマッチを見つけるための効率的なq-Gramフィルタ」. Journal of Computational Biology . 13 (2): 296– 308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID  16597241. {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
  31. ^ Noe L, Kucherov G; Kucherov (2005). 「YASS:DNA類似性検索の感度向上」. Nucleic Acids Research . 33 (suppl_2): W540 – W543 . doi :10.1093/nar/gki478. PMC 1160238. PMID  15980530 .  
  32. ^ プラタス、ディオゴ;シルバ、ホルヘ (2020)。 「SARS-CoV-2の永続的な最小配列」。バイオインフォマティクス36 (21): 5129–5132土井: 10.1093/bioinformatics/btaa686PMC 7559010PMID  32730589。 
  33. ^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). 「Arioc: GPUアクセラレーションによるシード・アンド・エクステンド探索空間の高スループットリードアライメント」. PeerJ . 3 e808. doi : 10.7717/peerj.808 . PMC 4358639. PMID  25780763 . 
  34. ^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). 「BFAST: 大規模ゲノム再配列のためのアライメントツール」. PLOS ONE . 4 (11) e7767. Bibcode :2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639. PMID  19907642 . 
  35. ^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). 「BigBWA:ビッグデータ技術へのBurrows–Wheelerアライナーのアプローチ」. Bioinformatics . 31 (24): 4003–5 . doi : 10.1093/bioinformatics/btv506 . PMID  26323715.
  36. ^ Kent, WJ (2002). BLAT---BLASTに似たアライメントツール」.ゲノム研究. 12 (4): 656– 664. doi :10.1101/gr.229202. ISSN  1088-9051. PMC 187518. PMID  11932250. 
  37. ^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). 「ヒトゲノムに対する短いDNA配列の超高速かつメモリ効率の高いアライメント」. Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN  1465-6906. PMC 2690996. PMID 19261174  . 
  38. ^ Li, H.; Durbin, R. (2009). 「Burrows–Wheeler変換を用いた高速かつ正確なショートリードアライメント」.バイオインフォマティクス. 25 (14): 1754– 1760. doi :10.1093/bioinformatics/btp324. ISSN  1367-4803. PMC 2705234. PMID 19451168  . 
  39. ^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). 「位置特異的スコアリングマトリックスを用いたショートリードの適応型確率マッピング」BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN  1471-2105. PMC 4021105 . PMID  24717095. 
  40. ^ Liu, Y.; Schmidt, B.; Maskell, DL (2012). 「CUSHAW: Burrows–Wheeler変換に基づく大規模ゲノムに対するCUDA互換のショートリードアライナー」. Bioinformatics . 28 (14): 1830– 1837. doi : 10.1093/bioinformatics/bts276 . ISSN  1367-4803. PMID  22576173.
  41. ^ Liu, Y.; Schmidt, B. (2012). 「最大完全一致シードに基づくロングリードアライメント」.バイオインフォマティクス. 28 (18): i318 – i324 . doi :10.1093/bioinformatics/bts414. ISSN  1367-4803. PMC 3436841. PMID 22962447  .  
  42. ^ Rizk, Guillaume; Lavenier, Dominique (2010). 「GASSST: グローバルアライメント短鎖検索ツール」.バイオインフォマティクス. 26 (20): 2534– 2540. doi :10.1093/bioinformatics/btq485. PMC 2951093. PMID  20739310 . 
  43. ^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). 「GEMマッパー:濾過による高速、正確、かつ汎用性の高いアライメント」. Nature Methods . 9 (12): 1185– 1188. doi :10.1038/nmeth.2221. ISSN  1548-7091. PMID  23103880. S2CID  2004416.
  44. ^ Clement, NL; Snell, Q.; Clement, MJ; Hollenhorst, PC; Purwar, J.; Graves, BJ; Cairns, BR; Johnson, WE (2009). 「GNUMAPアルゴリズム:次世代シーケンシングによるオリゴヌクレオチドの偏りのない確率的マッピング」. Bioinformatics . 26 (1): 38– 45. doi :10.1093/bioinformatics/btp614. ISSN  1367-4803. PMC 6276904. PMID 19861355  . 
  45. ^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). 「HIVE-Hexagon: 次世代シーケンシングデータ解析のための高性能並列化配列アライメント」. PLOS ONE . 9 (6): 1754– 1760. Bibcode :2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384. PMID 24918764  . 
  46. ^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). 「適応型種子がゲノム配列比較を抑制する」. Genome Research . 21 (3): 487– 493. doi :10.1101/gr.113985.110. PMC 3044862. PMID  21209072 . 
  47. ^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). 「Mpscan: ゲノムにおける複数リードの高速ローカリゼーション」. Algorithms in Bioinformatics . Lecture Notes in Computer Science. Vol. 5724. pp.  246– 260. Bibcode :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN  978-3-642-04240-9. S2CID  17187140。
  48. ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). 「NextGenMap:高度に多型的なゲノムにおける高速かつ正確なリードマッピング」. Bioinformatics . 29 (21): 2790– 2791. doi : 10.1093/bioinformatics/btt468 . PMID  23975764.
  49. ^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). 「PerM: 周期的フルセンシティブ空間シードを用いた短いシーケンスリードの効率的なマッピング」.バイオインフォマティクス. 25 (19): 2514– 2521. doi :10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096  . 
  50. ^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). 「インデックス構造を用いたミスマッチ、挿入、欠失を伴う短い配列の高速マッピング」. PLOS Computational Biology . 5 (9) e1000502. Bibcode :2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN  1553-7358. PMC 2730575. PMID 19750212  . 
  51. ^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). 「SHRiMP: 短い色空間リードの正確なマッピング」. PLOS Computational Biology . 5 (5) e1000386. Bibcode :2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294. PMID  19461883 . 
  52. ^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). 「SHRiMP2: 高感度かつ実用的なショートリードマッピング」.バイオインフォマティクス. 27 (7): 1011– 1012. doi : 10.1093/bioinformatics/btr046 . PMID  21278192.
  53. ^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). 「スライダー – 短いシーケンスリードのアライメントとSNP検出における確率情報の最大活用」.バイオインフォマティクス. 25 (1): 6– 13. doi :10.1093/bioinformatics/btn565. PMC 2638935. PMID  18974170 . 
  54. ^ Malhis, Nawar; Jones, Steven JM (2010). 「浅いカバレッジにおけるイルミナデータを用いた高品質SNPコーリング」バイオインフォマティクス26 (8): 1029– 1035. doi :10.1093/bioinformatics/btq092. PMID  20190250.
  55. ^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). 「SOAP: ショートオリゴヌクレオチドアライメントプログラム」.バイオインフォマティクス. 24 (5): 713– 714. doi : 10.1093/bioinformatics/btn025 . ISSN  1367-4803. PMID  18227114.
  56. ^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). 「SOAP2:ショートリードアライメントのための改良型超高速ツール」.バイオインフォマティクス. 25 (15): 1966– 1967. doi :10.1093/bioinformatics/btp336. ISSN  1367-4803. PMID  19497933.
  57. ^ アブイン、ホセ M.;ピチェル、フアン C.ペナ、トマス F.アミーゴ、ホルヘ (2016-05-16)。 「SparkBWA: ハイスループット DNA シーケンス データのアライメントの高速化」。プロスワン11 (5) e0155461。Bibcode :2016PLoSO..1155461A。土井10.1371/journal.pone.0155461ISSN  1932-6203。PMC 4868289PMID  27182962。 
  58. ^ Lunter, G.; Goodson, M. (2010). 「Stampy: Illuminaシーケンスリードの高感度かつ高速マッピングのための統計アルゴリズム」. Genome Research . 21 (6): 936– 939. doi :10.1101/gr.111120.110. ISSN  1088-9051. PMC 3106326. PMID  20980556 . 
  59. ^ Noe, L.; Girdea, M.; Kucherov, G. (2010). 「SOLiDリードマッピングのための効率的な空間シードの設計」. Advances in Bioinformatics . 2010 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID  20936175 . 
  60. ^ Lin, H.; Zhang, Z.; Zhang, MQ; Ma, B.; Li, M. (2008). 「ZOOM! 膨大なオリゴをマッピング」.バイオインフォマティクス. 24 (21): 2431– 2437. doi :10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737  . 
「https://en.wikipedia.org/w/index.php?title=List_of_sequence_alignment_software&oldid=1322404500」から取得