配列アライメントソフトウェアのリスト

この配列アライメントソフトウェアのリストは、ペアワイズ配列アライメントおよび多重配列アライメントに使用されるソフトウェアツールとウェブポータルをまとめたものです。タンパク質の構造アライメントについては、構造アライメントソフトウェアをご覧ください。

データベース検索のみ

名前	説明	シーケンスタイプ*	著者	年
ブラスト	高速k-tupleヒューリスティックによる局所探索（基本的な局所アライメント探索ツール）	両方	アルトシュル SF、ギッシュ W、ミラー W、マイヤーズ EW、リップマン DJ ^[1]	1990
HPC-BLAST	NCBI準拠のマルチノードおよびマルチコアBLASTラッパー。最新バージョンのBLASTに同梱されているこのラッパーは、多数のノードと各ノード内に多数のコアを持つ最新のハイブリッドアーキテクチャ上でアルゴリズムの並列化を容易にします。^[2]	タンパク質	Burdyshaw CE、Sawyer S、Horton MD、Brook RG、Rekapalli B	2017
CS-ブラスト	配列コンテキスト特異的BLASTは、BLAST、FASTA、SSEARCHよりも感度が高い。位置特異的反復版CSI-BLASTはPSI-BLASTよりも感度が高い。	タンパク質	アンガーミュラー C、ビーガート A、ソーディング J ^[3]	2013
CUDASW++	複数の共有ホスト GPU 向けの GPU アクセラレーション Smith Waterman アルゴリズム	タンパク質	Liu Y、Maskell DL、Schmidt B	2009/2010
ダイヤモンド	二重インデックスに基づくBLASTXおよびBLASTPアライナー	タンパク質	Buchfink B、Xie C、Huson DH、Reuter K、Drost HG ^[4]^[5]	2015/2021
ファスタ	高速なk組ヒューリスティックによる局所探索。BLASTよりも遅いが感度が高い。	両方
GGSEARCH、GLSEARCH	統計によるグローバル:グローバル (GG)、グローバル:ローカル (GL) の整合	タンパク質
ゲノムマジシャン	NGS データの超高速ローカル DNA 配列モチーフ検索およびペアワイズアライメント用のソフトウェア (FASTA、FASTQ)。	DNA	ヘッパーレ D (www.sequentix.de)	2020
ジェヌーグル	Genoogleは、DNAおよびタンパク質配列の検索にインデックス作成と並列処理技術を使用しています。Javaで開発され、オープンソースです。	両方	アルブレヒト F	2015
ハマー	PSI-BLASTよりも感度の高いプロファイル隠れマルコフモデルによる局所的および全体的検索	両方	ダービン R、エディ SR、クロー A、ミッチソン G ^[6]	1998
HHスイート	プロファイル隠れマルコフモデルのペアワイズ比較;非常に感度が高い	タンパク質	ゼーディング J ^[7]^[8]	2005/2012
イスラエル国防軍	逆文書頻度	両方
地獄の	プロフィールSCFG検索	RNA	エディS
クラスト	高性能汎用配列類似性検索ツール	両方		2009/2014
ラムダ	BLAST と互換性がありながら、はるかに高速な高性能ローカルアライナー。SAM/BAM をサポート	タンパク質	ハンネス・ハウスウェデル、ヨッヘン・シンガー、クヌート・ライナート^[9]	2014
MMseqs2	膨大な配列セットを検索・クラスタリングするためのソフトウェアスイート。BLASTやPSI-BLASTと同等の感度を持ちながら、桁違いに高速です。	タンパク質	シュタイネッガー M、ミルディータ M、ガリエス C、セーディング J ^[10]	2017
検索	超高速配列解析ツール	両方	Edgar, RC (2010). 「BLASTよりも桁違いに高速な検索とクラスタリング」バイオインフォマティクス26 ( 19): 2460– 2461. doi : 10.1093/bioinformatics/btq461 . PMID 20709691.出版物	2010
オズワルド	OpenCL Smith-Waterman氏による大規模タンパク質データベース向けAltera FPGAについて	タンパク質	ルッチ E、ガルシア C、ボテラ G、デジュスティ A、ナイウフ M、プリエトマティアス M ^[11]	2016
パラセール	SIMD並列化を用いた高速スミス・ウォーターマン探索	両方	デイリーJ	2015
サイブラスト	位置特異的反復BLAST、位置特異的スコアリング行列による局所探索、BLASTよりもはるかに感度が高い	タンパク質	アルトシュール SF、マッデン TL、シェーファー AA、チャン J、チャン Z、ミラー W、リップマン DJ ^[12]	1997
PSI検索	Smith-Waterman 検索アルゴリズムとPSI-BLASTプロファイル構築戦略を組み合わせて、遠縁のタンパク質配列を見つけ、相同過剰拡張エラーを防止します。	タンパク質	リー・W、マクウィリアム・H、グージョン・M、カウリー・A、ロペス・R、ピアソン・WR ^[13]	2012
R&R	Retrieve and Relate (R&R) は、DNA、RNA、タンパク質の配列を並行して検索できる、高性能かつ高感度なマルチデータベース検索エンジンです。	両方		2019
スカラブラスト	高度に並列化されたスケーラブルなBLAST	両方	オエメンら^[14]	2011
セキラブ	NCBI-BLASTの結果から得られた配列アライメントデータを主要な配列解析サーバー/サービスにリンクし、プロファイリングする	ヌクレオチド、ペプチド		2010
サム	PSI-BLASTよりも感度の高いプロファイル隠れマルコフモデルによる局所的および全体的検索	両方	カルプラスK、クロッグA ^[15]	1999
検索	Smith-Waterman検索はFASTAよりも遅いが感度が高い	両方
スワフィ語	スミス・ウォーターマンタンパク質データベース検索を高速化するために、新興のインテル Xeon Phi を採用した初の並列化アルゴリズム	タンパク質	Liu YとSchmidt B	2014
スワフィ-LS	インテル Xeon Phi クラスターを活用した初の並列 Smith-Waterman アルゴリズムにより長い DNA 配列のアラインメントを高速化	DNA	Liu Y、Tran TT、Lauenroth F、Schmidt B	2014
水泳	Intel マルチコアおよびメニーコアアーキテクチャ向けの Smith-Waterman 実装	タンパク質	ルッチ E、ガルシア C、ボテラ G、デジュスティ A、ナイウフ M、プリエトマティアス M ^[16]	2015
スイム2.0	AVX-512ベクトル拡張に基づくIntelのマルチコアおよびメニーコアアーキテクチャ上の強化されたSmith-Waterman	タンパク質	ルッチ E、ガルシア C、ボテラ G、デジュスティ A、ナイウフ M、プリエトマティアス M ^[17]	2018
スワイプ	SIMD並列化を用いた高速スミス・ウォーターマン探索	両方	ログネスT	2011

*配列の種類:タンパク質またはヌクレオチド

ペアワイズアライメント

名前	説明	シーケンスタイプ*	アライメントタイプ**	著者	年
アカナ	高速ヒューリスティックアンカーベースのペアワイズアライメント	両方	両方	ファン、ウンバッハ、リー	2005
アラインミー	膜タンパク質配列のアライメント	タンパク質	両方	M. スタム、K. カフィゾフ、R. スターリッツビヒラー、LR フォレスト	2013
オールアライン	32MBまでのDNA、RNA、タンパク質分子について、サイズK以上のすべての配列をアラインメントします。類似のアラインメントはグループ化され、解析に使用されます。繰り返し配列は自動フィルターでフィルタリングされます。	両方	地元	E. ワクテル	2017
バイオコンダクターバイオストリングス::ペアワイズアライメント	動的計画法	両方	両方 + 両端無料	P.アボユン	2008
バイオパールdpAlign	動的計画法	両方	両方 + 両端無料	YMチャン	2003
ブラスト、ラスト	シードパターンマッチング	ヌクレオチド	地元	シュワルツら^[18]^[19]	2004年、2009年
コドンコードアライナー	複数のアルゴリズムを使用した高速なペアワイズおよびマルチシーケンスアライメント。	ヌクレオチド	両方	コドンコード株式会社	2003-2025
CUDAlign	単一または複数の GPU で無制限のサイズの DNA 配列アライメント	ヌクレオチド	ローカル、セミグローバル、グローバル	E.サンデス^[20]^[21]^[22]	2011-2015
DNAドット	Webベースのドットプロットツール	ヌクレオチド	グローバル	R. ボーエン	1998
ドットレット	Javaベースのドットプロットツール	両方	グローバル	M. パグニとT. ジュニエ	1998
ごちそう	記述的進化モデルを用いた事後的局所拡張	ヌクレオチド	地元	AKフデックとDGブラウン	2010
ゲノムコンパイラゲノムコンパイラ	クロマトグラムファイル (.ab1、.scf) をテンプレートシーケンスに対して整列させ、エラーを見つけて即座に修正します。	ヌクレオチド	地元	ゲノムコンパイラ株式会社	2014
G-PAS	バックトラッキングを備えた GPU ベースの動的プログラミング	両方	ローカル、セミグローバル、グローバル	W. Frohmberg、M. Kierzynka 他	2011
ギャップミス	1つのギャップを持つペアワイズ配列アライメントは	両方	セミグローバル	K. フルーシオス、T. フルーリ、CS イリオプロス、K. パーク、SP ピシス、G. ティシュラー	2012
ゲノムマジシャン	NGS データの超高速ローカル DNA 配列モチーフ検索およびペアワイズアライメント用のソフトウェア (FASTA、FASTQ)。	DNA	ローカル、セミグローバル、グローバル	ヘッパーレ D (www.sequentix.de)	2020
GGSEARCH、GLSEARCH	統計によるグローバル:グローバル (GG)、グローバル:ローカル (GL) の整合	タンパク質	クエリ内のグローバル	W. ピアソン	2007
Jアライナー	Smith-WatermanのJava オープンソース実装	両方	地元	A. ムスタファ	2005
K*シンク	二次構造、構造保存、構造由来の配列プロファイル、コンセンサスアライメントスコアを含むタンパク質配列と構造のアライメント	タンパク質	両方	D.チビアンとD.ベイカー^[23]	2003
ラライン	重複しない複数の局所類似性（SIMと同じアルゴリズム）	両方	局所的に重複しない	W. ピアソン	1991年（アルゴリズム）
北西方向	標準の Needleman-Wunsch 動的プログラミングアルゴリズム	タンパク質	グローバル	Y・チャン	2012
マッチャー	ウォーターマン・エッガート局所アラインメント（LALIGNに基づく）	両方	地元	I. ロングデン（W. ピアソンより改変）	1999
マカリグ2	インデル進化の明示的なモデル	DNA	グローバル	J. Wang他	2006
MegAlign Pro（レーザージーン分子生物学）	MUSCLE、Mauve、MAFFT、Clustal Omega、Jotun Hein、Wilbur-Lipman、Martinez Needleman-Wunsch、Lipman-Pearson、Dotplot 分析などのペアワイズおよびマルチシーケンスアライメントアルゴリズムを使用して、DNA、RNA、タンパク質、または DNA + タンパク質シーケンスをアライメントするソフトウェア。	両方	両方	DNAスター	1993-2016
MUMmer	サフィックスツリーベース	ヌクレオチド	グローバル	S. Kurtz他	2004
針	Needleman-Wunsch動的プログラミング	両方	セミグローバル	A. ブレズビー	1999
ンギラ	対数およびアフィンギャップコストとインデル進化の明示的モデル	両方	グローバル	R.カートライト	2007
北西	Needleman-Wunsch動的プログラミング	両方	グローバル	ACRマーティン	1990-2015
パラセール	SSE、AVX2 向け C/C++/Python/Java SIMD 動的プログラミングライブラリ	両方	グローバル、エンズフリー、ローカル	J.デイリー	2015
パス	タンパク質逆翻訳グラフにおけるスミス・ウォーターマン（タンパク質レベルでのフレームシフトの検出）	タンパク質	地元	M. Gîrdeaら^[24]	2009
パターンハンター	シードパターンマッチング	ヌクレオチド	地元	B. Maら^[25]^[26]	2002～2004年
ProbA（propAとも呼ばれる）	動的計画法による確率的分割関数サンプリング	両方	グローバル	U. ミュックシュタイン	2002
ピモル	「align」コマンドは配列を整列させて構造に適用します	タンパク質	グローバル（選択による）	WLデラノ	2007
評判	サフィックスツリーベース	ヌクレオチド	地元	S. Kurtz他	2001
サーベルトゥース	予測された接続プロファイルを使用したアライメント	タンパク質	グローバル	F. タイヒェルト、J. ミニング、U. バストーラ、M. ポルト	2009
薩摩	並列全ゲノムシンテニーアライメント	DNA	地元	MG Grabherrら	2010
シークアルン	さまざまな動的計画法	両方	ローカルかグローバルか	MSウォーターマンとP.ハーディ	1996
SIM、ギャップ、ナップ、ラップ	ギャップ処理を変えた場合の局所類似性	両方	ローカルかグローバルか	X. 黄とW. ミラー	1990-6
シム	局所的な類似性	両方	地元	X. 黄とW. ミラー	1991
SPA: スーパーペアワイズアライメント	高速ペアワイズグローバルアライメント	ヌクレオチド	グローバル	シェン、ヤン、ヤオ、ファン	2002
検索	統計による局所（スミス・ウォーターマン）アライメント	タンパク質	地元	W. ピアソン	1981年（アルゴリズム）
シーケンススタジオ	^[27]の様々なアルゴリズムを実演するJavaアプレット	一般的な配列	ローカルとグローバル	A.メスカウスカス	1997年（参考図書）
スイフォールド	長い DNA 配列のための Intel FPGA と OpenCL による Smith-Waterman アクセラレーション	ヌクレオチド	地元	E.ルッチ^[28]^[29]	2017-2018
SWIFTスーツ	高速ローカルアライメント検索	DNA	地元	K.ラスムッセン、^[30] W.ゲルラッハ	2005年、2008年
担架	メモリ最適化ニードルマン・ヴンシュ動的計画法	両方	グローバル	I. Longden（G. MyersとW. Millerの論文を改変）	1999
トランアライン	タンパク質アラインメントに基づいて核酸配列をアラインメントする	ヌクレオチド	該当なし	G. ウィリアムズ（B. ピアソンより改変）	2002
ウゲネ	SSE/CUDA 用オープンソース Smith-Waterman、サフィックス配列ベースのリピートファインダーとドットプロット	両方	両方	ユニプロ	2010
水	スミス・ウォーターマン動的計画法	両方	地元	A. ブレズビー	1999
単語マッチ	k組のペアワイズマッチ	両方	該当なし	I. ロングデン	1998
ヤス	シードパターンマッチング	ヌクレオチド	地元	L.ノエとG.クチェロフ^[31]	2004

*配列の種類:タンパク質またはヌクレオチド **アライメントの種類:ローカルまたはグローバル

多重配列アライメント

名前	説明	シーケンスタイプ*	アライメントタイプ**	著者	年	ライセンス
ABA	A-Bruijnアライメント	タンパク質	グローバル	B.Raphaelら	2004	教育、研究、非営利団体向けのプロプライエタリ、フリーウェア
エール	手動調整、ソフトウェアによる支援	ヌクレオチド	地元	J. ブランディとK. フォーゲル	1994年（最新版2007年）	無料、GPL 2
オールアライン	最大32MBのDNA、RNA、タンパク質分子について、サイズK以上、MSA、または単一分子内のすべての配列をアラインメントします。類似のアラインメントはグループ化され、解析に使用されます。自動繰り返し配列フィルターも搭載されています。	両方	地元	E. ワクテル	2017	無料
AMAP	配列アニーリング	両方	グローバル	A. シュワルツとL. パクター	2006
バリフィ	ツリー+マルチアライメント; 確率ベイズ; 結合推定	両方 + コドン	グローバル	BD レデリングスと MA スチャード	2005年（最新バージョン2018年）	無料、GPL
基地ごとに	統合解析ツールを備えた Java ベースの多重配列アライメントエディタ	両方	ローカルかグローバルか	R. Brodie他	2004	独自仕様、フリーウェア、登録が必要
カオス、ダイアライン	反復的なアライメント	両方	ローカル（推奨）	M. ブルドノとB. モルゲンシュテルン	2003
クラスタル	プログレッシブアライメント	両方	ローカルかグローバルか	トンプソンら	1994	無料、LGPL
コドンコードアライナー	マルチアライメント; Muscle、Clustal、Phrapをサポート	ヌクレオチド	ローカルかグローバルか	P. Richterich他	2003（最新バージョン2024）
コンパス	複数のタンパク質配列アライメントの比較と統計的有意性の評価	タンパク質	グローバル	RI Sadreyev他	2009
解読	漸進的反復アライメント	両方	グローバル	エリック・S・ライト	2014	無料、GPL
DIALIGN-TX および DIALIGN-T	セグメントベースの方法	両方	ローカル（推奨）またはグローバル	ARスブラマニアン	2005年（最新バージョン2008年）
DNAアライメント	種内アラインメントのためのセグメントベースの方法	両方	ローカル（推奨）またはグローバル	A.ローエル	2005年（最新バージョン2008年）
DNAベース配列アセンブラ	マルチアライメント、完全自動配列アライメント、自動曖昧性修正、内部ベースコーラー、コマンドラインシーケンスアライメント	ヌクレオチド	ローカルかグローバルか	ヘラクル・バイオソフトSRL	2006年（最新バージョン2018年）	商用（一部のモジュールはフリーウェア）
DNAダイナモ	MUSCLE、Clustal、Smith-WatermanによるDNAとタンパク質の多重アラインメント	両方	ローカルかグローバルか	DNAダイナモ	2004年（最新バージョン2017年）
エドナ	DNA結合部位のエネルギーベースの多重配列アライメント	ヌクレオチド	ローカルかグローバルか	サラマ、RA. 他	2013
ファムサ	非常に大規模なタンパク質ファミリー（数十万のメンバー）の漸進的アラインメント	タンパク質	グローバル	Deorowiczら	2016	無料、GPL 3
FSA	配列アニーリング	両方	グローバル	RKブラッドリー他	2008
天才的な	プログレッシブ反復アライメント; ClustalWプラグイン	両方	ローカルかグローバルか	AJ ドラモンド他	2005年（最新バージョン2017年）
ガイダンス	多重配列アライメントの品質管理とフィルタリング	両方	ローカルかグローバルか	O. ペン他	2010年（最新バージョン2015年）
カリン	プログレッシブアライメント	両方	グローバル	T.ラスマン	2005
マクセ	プログレッシブ反復アライメント。フレームシフトと終止コドンを考慮したコーディング配列の多重アライメント。	ヌクレオチド	グローバル	V. Ranwez他	2011（最新バージョン、v2.07 2023）
マフト	漸進的反復アライメント	両方	ローカルかグローバルか	加藤健一他	2005	フリー、BSD
マーナ	RNAのマルチアライメント	RNA	地元	S. Siebertら	2005
マビッド	プログレッシブアライメント	両方	グローバル	N. ブレイとL. パクター	2004
MegAlign Pro（レーザージーン分子生物学）	MUSCLE、Mauve、MAFFT、Clustal Omega、Jotun Hein、Wilbur-Lipman、Martinez Needleman-Wunsch、Lipman-Pearson、Dotplot 分析などのペアワイズおよびマルチシーケンスアライメントアルゴリズムを使用して、DNA、RNA、タンパク質、または DNA + タンパク質シーケンスをアライメントするソフトウェア。	両方	ローカルかグローバルか	DNAスター	1993-2023
MSA	動的計画法	両方	ローカルかグローバルか	DJ Lipman他	1989年（1995年改訂）
MSAProbs	動的計画法	タンパク質	グローバル	Y. リュー、B. シュミット、D. マスケル	2010
マルチリン	動的計画法-クラスタリング	両方	ローカルかグローバルか	F. コルペット	1988
マルチLAGAN	プログレッシブダイナミックプログラミングアライメント	両方	グローバル	M. Brudno他	2003
筋	プログレッシブ反復アライメント（v3）、確率的/一貫性（v5）	両方	ローカルかグローバルか	R. エドガー	2004	パブリックドメイン
オパール	漸進的反復アライメント	両方	ローカルかグローバルか	T. ウィーラーとJ. ケセチオグル	2007 (最新安定版 2013、最新ベータ版 2016)
ピーカン	確率的一貫性	DNA	グローバル	B. Patenら	2008
フィロ	比較ゲノミクスにおける多重アライメントを解決するためのヒューマンコンピューティングフレームワーク	ヌクレオチド	ローカルかグローバルか	マギル大学バイオインフォマティクス	2010
PMファストR	プログレッシブ構造を考慮したアライメント	RNA	グローバル	D. デブラシオ、J ブラウンド、S チャン	2009
プラリネ	プレプロファイリングと二次構造予測による漸進的反復一貫性相同性拡張アライメント	タンパク質	グローバル	J. ヘリンガ	1999年（最新版2009年）
ピクXAA	非漸進的、最大期待精度アライメント	両方	グローバル	SME SahraeianとBJ Yoon	2010
委任状	半順序/隠れマルコフモデル	タンパク質	ローカルかグローバルか	C. リー	2002
プロバライン	確率論的/パーティション関数の確率との一貫性	タンパク質	グローバル	ロシャンとリヴセイ	2006	無料、パブリックドメイン
問題点	確率論/一貫性	タンパク質	ローカルかグローバルか	C. Doら	2005	無料、パブリックドメイン
プロマル3D	プログレッシブアライメント/隠れマルコフモデル/二次構造/3D構造	タンパク質	グローバル	J. Peiら	2008
PRRN/PRRP	反復的な調整（特に改良）	タンパク質	ローカルかグローバルか	Y. Totoki (O. Gotoh に基づく)	1991年以降
PSアライン	アライメント保存非ヒューリスティック	両方	ローカルかグローバルか	SH Sze、Y. Lu、Q. Yang。	2006
レブトランス	タンパク質のアライメントを DNA に逆翻訳することで、DNA とタンパク質のアライメントを組み合わせます。	DNA/タンパク質（特殊）	ローカルかグローバルか	ヴェルナーソンとペダーセン	2003（最新バージョン2005）
サガ	遺伝的アルゴリズムによる配列アライメント	タンパク質	ローカルかグローバルか	C. ノートルダム他	1996年（新版1998年）
サム	隠れマルコフモデル	タンパク質	ローカルかグローバルか	A. Kroghら	1994年（最新版は2002年）
シール	手動調整	両方	地元	A. ランボー	2002
スタットアライン	ベイズ法によるアラインメントと系統発生の共推定（MCMC）	両方	グローバル	A. Novak他	2008
ステムロック	多重アライメントと二次構造予測	RNA	ローカルかグローバルか	I. ホームズ	2005	無料、GPL 3（DART の一部）
Tコーヒー	より敏感なプログレッシブアライメント	両方	ローカルかグローバルか	C. ノートルダム他	2000年（最新バージョンは2008年）	無料、GPL 2
ウゲネ	MUSCLE、KAlign、Clustal、MAFFTプラグインによる多重アライメントをサポート	両方	ローカルかグローバルか	UGENEチーム	2010年（最新バージョン2020年）	無料、GPL 2
ベクターフレンズ	VectorFriends Aligner、MUSCLEプラグイン、Clustal Wプラグイン	両方	ローカルかグローバルか	バイオフレンズチーム	2013	学術目的でのみ利用可能な、独自のフリーウェア
GLProbs	適応型ペア隠れマルコフモデルに基づくアプローチ	タンパク質	グローバル	Y. Yeら	2013

*配列の種類:タンパク質またはヌクレオチド。**アライメントの種類:ローカルまたはグローバル

ゲノミクス解析

名前	説明	シーケンスタイプ*
イーグル^[32]	ゲノムデータ中の相対的に欠落している単語を見つける超高速ツール	ヌクレオチド
ACT（アルテミス比較ツール）	シンテニーと比較ゲノミクス	ヌクレオチド
熱心な	全ゲノムを用いたペアワイズグローバルアライメント	ヌクレオチド
ブラット	cDNA 配列をゲノムにアラインメントします。	ヌクレオチド
解読	6フレーム翻訳を用いた再配置ゲノムのアライメント	ヌクレオチド
対空砲	ファジー全ゲノムアライメントと解析	ヌクレオチド
GMAP	cDNA配列をゲノムにアライメントします。スプライス部位の接合部を高精度で特定します。	ヌクレオチド
スプライン	cDNA配列をゲノムにアライメントします。スプライス部位の接合部を高精度に特定します。遺伝子重複を認識し、分離することができます。	ヌクレオチド
モーブ	再編成されたゲノムの多重アライメント	ヌクレオチド
MGA	多重ゲノムアライナー	ヌクレオチド
ムーラン	ゲノム長配列の局所多重アライメント	ヌクレオチド
マルチズ	ゲノムの多重アライメント	ヌクレオチド
PLAST-ncRNA	パーティション関数のローカルアラインメントによるゲノム中のncRNAの検索	ヌクレオチド
セケローム	主要なサーバー/サービスによる配列アライメントデータのプロファイリング	ヌクレオチド、ペプチド
セキラブ	NCBI-BLASTの結果から主要なサーバーサービスを使用して配列アライメントデータをプロファイリングする	ヌクレオチド、ペプチド
シャッフル-LAGAN	完成したゲノム領域のペアワイズグローバルアライメント	ヌクレオチド
SIBsim4、シム4	イントロンを考慮して、発現したDNA配列をゲノム配列と整合させるように設計されたプログラム	ヌクレオチド
スラム	遺伝子の発見、アライメント、注釈（ヒトとマウスの相同性の同定）	ヌクレオチド
SRPRISM	明示的な保証のあるアセンブリのための効率的なアライナー。スプライスなしでリードをアラインメントします。	ヌクレオチド

*配列の種類:タンパク質またはヌクレオチド

モチーフの発見

名前	説明	シーケンスタイプ*
月経前緊張症	モチーフの探索と発見	両方
FMM	モチーフの検索と発見（エンリッチドモチーフ検索の入力として、正と負の配列も取得可能）	ヌクレオチド
ブロック	BLOCKSデータベースからのギャップのないモチーフの同定	両方
eMOTIF	短いモチーフの抽出と識別	両方
ギブスモチーフサンプラー	統計的尤度による確率的モチーフ抽出	両方
HMMTOP	膜貫通ヘリックスとタンパク質のトポロジーの予測	タンパク質
Iサイト	局所構造モチーフライブラリ	タンパク質
Jコイル	コイルドコイルとロイシンジッパーの予測	タンパク質
ミーム/マスト	モチーフの発見と検索	両方
CUDAミーム	GPU クラスター向けの GPU アクセラレーション MEME (v4.4.0) アルゴリズム	両方
ありがとう	識別的モチーフの発見と探索	両方
PHI-ブラスト	モチーフ検索およびアライメントツール	両方
フィロスカン	モチーフ検索ツール	ヌクレオチド
プラット	ScanPrositeで使用するためのパターン生成	タンパク質
スキャンプロサイト	Motifデータベース検索ツール	タンパク質
テイレシアス	モチーフ抽出とデータベース検索	両方
玄武岩	複数のモチーフと正規表現の検索	両方

*配列の種類:タンパク質またはヌクレオチド

ベンチマーク

名前	著者
PFAM 30.0 (2016)
スマート（2015）	レトゥニック、コプリー、シュミット、チッカレッリ、ドークス、シュルツ、ポンティング、ボルク
バリベース3 (2015)	トンプソン、プルニャック、ポチェッティーノ
オックスベンチ（2011）	ラガバ、サール、オードリー、バーバー、バートン
ベンチマークコレクション（2009）	エドガー
ホムストラッド（2005）	水口
プレファブ 4.0 (2005)	エドガー
SABマーク（2004）	ヴァン・ウォーレ、ラスターズ、ウィンズ

アライメント閲覧者、編集者

アライメント可視化ソフトウェア一覧をご覧ください。

ショートリード配列アライメント

名前	説明	ペアエンドオプション	FASTQ品質を使用	ギャップ	マルチスレッド	ライセンス	参照	年
アリオック	1台以上のGPU上で、Smith-Watermanギャップアライメントとマッピング品質を計算します。BS-seqアライメントをサポートします。1秒あたり10万～50万回の読み取り処理が可能です（データ、ハードウェア、および設定された感度によって異なります）。	はい	いいえ	はい	はい	フリー、BSD	^[33]	2015
バラCUDA	BWA に基づくGPGPU 加速Burrows–Wheeler 変換(FM インデックス) ショートリードアライメントプログラムは、ギャップオープニングと拡張によるインデルのアライメントをサポートします。	はい	いいえ	はい	はい、POSIXスレッドとCUDA	無料、GPL
BBマップ	短いkmerを用いてゲノムを迅速にインデックス化します。サイズやスキャフォールド数に制限はありません。Burrows–Wheelerアライナーよりも高い感度と特異性を持ち、同等かそれ以上の速度で実行できます。アフィン変換最適化されたグローバルアライメントを実行します。Smith-Watermanアライナーよりも遅いものの、より正確です。Illumina、454、PacBio、Sanger、Ion Torrentのデータに対応しています。スプライスアウェアで、長いインデルやRNA-seqを処理できます。Pure Javaで動作し、あらゆるプラットフォームで動作します。Joint Genome Instituteで使用されています。	はい	はい	はい	はい	フリー、BSD		2010
朝食	事前の精度推定と明確な時間と精度のトレードオフを、参照配列のインデックス作成によってサポートします。インデックスを最適に圧縮します。数十億ものショートリードを処理できます。挿入、欠失、SNP、およびカラーエラー（ABI SOLiDカラースペースリードのマッピングが可能）に対応しています。完全なSmith Watermanアライメントを実行します。				はい、POSIXスレッド	無料、GPL	^[34]	2009
ビッグBWA	Burrows–Wheeler Aligner -BWA をHadoopクラスター上で実行します。BWA-MEM、BWA-ALN、BWA-SW の各アルゴリズムをサポートし、ペアリードとシングルリードの両方で動作します。Hadoop クラスターで実行した場合、計算時間が大幅に短縮され、スケーラビリティとフォールトトレランスが向上します。	はい	低品質のベースのトリミング	はい	はい	無料、GPL 3	^[35]	2015
ブラステン	BLAST のヌクレオチドアライメントプログラムは、短い読み取りに対しては遅く、正確ではなく、参照ゲノムではなく、配列データベース (EST、サンガー配列) を使用します。
ブラット	Jim Kent作。初期アライメントステップで1つの不一致を処理できます。				はい、クライアントサーバー	学術的および非商用目的の使用のための独自のフリーウェア	^[36]	2002
ちょうネクタイ	Burrows-Wheeler変換を用いて、ゲノムの永続的かつ再利用可能なインデックスを作成します。ヒトゲノムの場合、メモリ使用量は1.3GBです。1CPU時間で2,500万件以上のIlluminaリードをアラインメントできます。MaqおよびSOAPのようなアラインメントポリシーをサポートします。	はい	はい	いいえ	はい、POSIXスレッド	自由、芸術的	^[37]	2009
BWA	Burrows–Wheeler変換を用いてゲノムのインデックスを作成します。Bowtieよりも少し遅いですが、アライメント中に挿入欠失（indel）を許容します。	はい	低品質のベースのトリミング	はい	はい	無料、GPL	^[38]	2009
BWA-PSSM	位置特異的スコアリングマトリックス（PSSM）を用いた確率的ショートリードアライナー。このアライナーは、リードの品質スコアと、古代DNA、PAR-CLIPデータ、あるいは偏ったヌクレオチド組成を持つゲノムなどで観察されるデータ固有のバイアスモデルを考慮できるという点で適応性が高い。^[39]	はい	はい	はい	はい	無料、GPL	^[39]	2014
キャッシュX	大量のショートリードシーケンスデータを定量化し、管理します。CASHXパイプラインには、組み合わせて使用することも、モジュールとして個別に使用することもできるツールセットが含まれています。このアルゴリズムは、リファレンスゲノムへのパーフェクトヒットを非常に正確に検出します。				いいえ	学術的および非商用目的の使用のための独自のフリーウェア
集中豪雨	Hadoop MapReduce を使用したショートリードマッピング				はい、Hadoop MapReduce	自由、芸術的
コドンコードアライナー	高速アセンブリ、品質スコアに対応した正確なコンセンサス配列。コンティグ比較、Phred、Phrap、Bowtieに対応。数百の異なるクローンに対して個別のコンティグを作成することも、数千の配列を含む単一のコンティグを作成することもできます。	はい	はい	はい	はい	独自、商用
CUDA-EC	GPU を使用したショートリードアライメントエラーの修正。				はい、GPUが有効です
クショー	Burrows-Wheeler変換に基づく大規模ゲノムに対するCUDA互換のショートリードアライナー	はい	はい	いいえ	はい（GPU有効）	無料、GPL	^[40]	2012
クショー2	最大完全一致シードに基づく、ギャップ付きショートリードおよびロングリードアライメント。このアライナーは、ベーススペース（Illumina、454、Ion Torrent、PacBioシーケンサーなど）とABI SOLiDカラースペースリードアライメントの両方をサポートします。	はい	いいえ	はい	はい	無料、GPL		2014
CUSHAW2-GPU	GPU アクセラレーション CUSHAW2 ショートリードアライナー。	はい	いいえ	はい	はい	無料、GPL
クーショー3	ハイブリッドシーディングによる高感度かつ正確なベーススペースおよびカラースペースのショートリードアライメント	はい	いいえ	はい	はい	無料、GPL	^[41]	2012
ドクターファスト	mrFASTやmrsFASTと同様にキャッシュの忘却性を実装し、メインメモリ/キャッシュメモリ転送を最小限に抑えるリードマッピングアライメントソフトウェアですが、SOLiDシーケンシングプラットフォーム（カラースペースリード）向けに設計されています。また、構造変異の検出を向上させるために、すべての可能なマップ位置を返します。	はい	はい、構造的変異のため	はい	いいえ	フリー、BSD
エランド	Illumina によって実装されています。有限のリード長を持つギャップなしのアライメントが含まれます。
エルネ	NGSリードの正確なアライメントを実現する拡張ランダム化数値アライナー。亜硫酸水素塩処理されたリードもマッピング可能です。	はい	低品質のベースのトリミング	はい	マルチスレッドとMPI対応	無料、GPL 3
ガススト	大規模なDNAバンクに対して短いDNA配列のグローバルアラインメントを見つける				マルチスレッド	CeCILLバージョン 2 ライセンス。	^[42]	2011
宝石	高品質なアライメントエンジン（置換およびインデルを含む網羅的なマッピング）。BWAやBowtie 1/2よりも正確で、数倍高速です。マッパー、スプリットマッパー、マッピング可能性など、多数の独立した生物学アプリケーションが提供されています。	はい	はい	はい	はい	無料、GPL 3	^[43]	2012
ジェナリス地図	高精度でストレージフットプリントが小さい、超高速かつ包括的な NGS 読み取りアライナー。	はい	低品質のベースのトリミング	はい	はい	独自、商用
天才的なアセンブラ	シーケンス技術、読み取り長、任意のペアリング方向、ペアリングの任意のスペーサーサイズ、参照ゲノムの有無など、あらゆる組み合わせを処理できる、高速で正確なオーバーラップアセンブラーです。				はい	独自、商用
ジェンサーチNGS	NGSデータを解析するための、ユーザーフレンドリーなGUIを備えた包括的なフレームワークです。独自の高品質アライメントアルゴリズムと、様々な公開アライナーをフレームワークに統合できるプラグイン機能を備えており、ショートリードのインポート、アライメント、バリアント検出、レポート生成が可能です。診断現場におけるリシーケンシングプロジェクト向けに設計されています。	はい	いいえ	はい	はい	独自、商用
GMAPとGSNAP	堅牢で高速なショートリードアライメント。GMAP：複数のインデルとスプライスを含む長いリード（上記の「ゲノミクス解析」の項目を参照）。GSNAP：リードごとに1つのインデルまたは最大2つのスプライスを含む短いリード。デジタル遺伝子発現、SNP、およびインデルジェノタイピングに有用。ジェネンテックのThomas Wu氏によって開発。Alpheusで国立ゲノム資源センター（NCGR）が使用。	はい	はい	はい	はい	学術的および非商用目的の使用のための独自のフリーウェア
GNUMAP	次世代シーケンサー（特にSolexa-Illumina社製）から得られた配列データを、あらゆるサイズのゲノムに正確にギャップアライメントします。アダプタートリミング、SNPコール、バイサルファイトシーケンス解析が含まれます。		はい、各塩基の4つの品質スコアすべてを含むIllumina _int.txtおよび_prb.txtファイルもサポートしています		マルチスレッドとMPI対応		^[44]	2009
HIVE六角形	ハッシュテーブルとブルームマトリックスを用いて、ゲノム上の潜在的な位置を生成・フィルタリングします。効率を高めるために、短いリード間の相互類似性を利用し、重複する非一意配列の再アライメントを回避します。BowtieやBWAよりも高速で、ウイルス、細菌、そしてより保守的な真核生物のアライメントにおいて、インデルや分岐に敏感なアライメントが可能です。	はい	はい	はい	はい	HIVEデプロイメントインスタンスに登録された学術および非商用ユーザー向けの独自のフリーウェア	^[45]	2014
IMOS	Spark 上のメタアライナーと Minimap2 の改良。単一ノード実行に対して線形スケーラビリティを備えた、Apache Spark プラットフォーム上のロングリード分散アライナーです。		はい	はい	はい	無料
アイザック	1つのサーバーノードで利用可能なすべてのコンピューティング能力を最大限に活用するため、幅広いハードウェアアーキテクチャに拡張でき、ハードウェアの能力に応じてアライメントパフォーマンスが向上します。	はい	はい	はい	はい	無料、GPL
最後	適応型シードを使用し、反復配列の多い配列（ゲノムなど）をより効率的に処理します。例えば、反復ヒットに圧倒されることなく、反復マスキングなしでリードをゲノムにアラインメントできます。	はい	はい	はい	はい	無料、GPL	^[46]	2011
マックス	各塩基の品質スコアを考慮したギャップのないアライメント。					無料、GPL
ミスターファスト、ミスターファスト	ギャップ付き（mrFAST）およびギャップなし（mrsFAST）アライメントソフトウェアは、キャッシュの忘却性を実装することでメインメモリ/キャッシュメモリの転送を最小限に抑えます。Illuminaシーケンシングプラットフォーム向けに設計されており、構造変異の検出を向上させるために、あらゆるマップ位置を返すことができます。	はい	はい、構造的変異のため	はい	いいえ	フリー、BSD
お母さん	MOM または最大オリゴヌクレオチドマッピングは、短い読み取り内で最大の長さの一致をキャプチャするクエリマッチングツールです。				はい
モザイク	高速ギャップアライナーおよびリファレンスガイドアセンブラ。k-merハッシュスキームの結果をシードとするバンド型Smith-Watermanアルゴリズムを用いてリードをアラインメントします。非常に短いリードから非常に長いリードまで、幅広いリードサイズをサポートします。				はい
MPスキャン	フィルタリング戦略に基づく高速アライナー（インデックスなし、q-gram と後方非決定性DAWGマッチングを使用）						^[47]	2009
ノボアライン＆ノボアラインCS	シングルエンドおよびペアエンドのIllumina GA I & II、ABIカラースペース、ION Torrentリードのギャップアライメント。アライメントの全ステップで塩基クオリティを活用し、高い感度と特異性を実現します。アダプタートリミング、塩基クオリティキャリブレーション、Bi-Seqアライメント、そしてリードごとに複数のアライメントを報告するオプションが含まれています。一般的なSNPを参照する際に曖昧なIUPACコードを使用することで、SNPリコール率を向上させ、アレルバイアスを排除できます。	はい	はい	はい	マルチスレッドおよびMPIバージョンは有料ライセンスで利用可能	学術的および非商用目的向けの、独自のフリーウェアシングルスレッドバージョン
ネクストジェネ	Roche Genome Sequencer FLX、Illumina GA/HiSeq、Life Technologies Applied BioSystems の SOLiD System、PacBio、および Ion Torrent プラットフォームからの次世代シーケンスデータの分析を実行する生物学者向けに開発されました。	はい	はい	はい	はい	独自、商用
ネクストジェンマップ	柔軟で高速なリードマッピングプログラム（BWAの2倍の速度）は、Stampyに匹敵するマッピング感度を実現します。内部的にはメモリ効率の高いインデックス構造（ハッシュテーブル）を使用し、リファレンスゲノムに存在する13塩基すべての位置を保存します。ペアワイズアライメントが必要なマッピング領域は、リードごとに動的に決定されます。高速SIMD命令（SSE）を使用することで、CPUでのアライメント計算を高速化します。利用可能な場合、アライメント計算はGPU（OpenCL/CUDAを使用）で行われ、実行時間をさらに20～50%短縮します。	はい	いいえ	はい	はい、POSIX スレッド、OpenCL/ CUDA、SSE	無料	^[48]	2013
Omixon バリアントツールキット	SNPおよびインデルを検出するための高感度・高精度ツールが含まれています。リファレンスゲノムから中程度の距離（配列差異最大30%）にあるNGSショートリードをマッピングするソリューションを提供します。リファレンスゲノムのサイズに制限はなく、高感度と相まって、バリアントツールキットはターゲットシーケンシングプロジェクトや診断に最適です。	はい	はい	はい	はい	独自、商用
PALマッパー	スプライスされたアライメントとスプライスされていないアライメントの両方を、高精度かつ効率的に計算します。機械学習戦略と、バンド型スミス・ウォーターマン型アルゴリズムに基づく高速マッピングを組み合わせることで、1CPUで1時間あたり約700万リードのアライメントを実現します。これは、当初提案されたQPALMAアプローチを改良したものです。				はい	無料、GPL
パルテックフロー	生物学者およびバイオインフォマティクス研究者向け。Illumina、Life technologies Solid TM、Roche 454、Ion Torrentの生データ（品質情報の有無は問いません）から、シングルエンドおよびペアエンドリードのギャップなし、ギャップあり、スプライスジャンクションのアライメントをサポートします。FASTQ/Qualレベルおよびアライメントデータに対する強力な品質管理機能を備えています。追加機能として、生リードのトリミングとフィルタリング、SNPおよび挿入欠失の検出、mRNAおよびmicroRNAの定量、融合遺伝子の検出などがあります。	はい	はい	はい	マルチプロセッサコア、クライアントサーバーインストールが可能	独自仕様、商用、無料試用版
合格	ゲノムをインデックス化し、事前に計算された単語のアライメントを用いてシードを拡張します。ベーススペース、カラースペース（SOLID）に対応し、ゲノムリードとスプライスされたRNA-seqリードのアライメントが可能です。	はい	はい	はい	はい	学術的および非商用目的の使用のための独自のフリーウェア
パーM	周期的なシードを用いてゲノムをインデックス化し、最大4つのミスマッチまで感度の高いアライメントを迅速に見つけます。IlluminaおよびSOLiDのリードをマッピングできます。多くのマッピングプログラムとは異なり、リード長が長いほど速度が向上します。				はい	無料、GPL	^[49]
プライメックス	調整可能なミスマッチ数まで感度の高いK-merルックアップテーブルを用いてゲノムをインデックスします。15～60bpの配列をゲノムにマッピングするのに最適です。	いいえ	いいえ	はい	いいえ、検索ごとに複数のプロセスがあります		[1]	2003
Qパルマ	品質スコア、イントロン長、そして計算によるスプライスサイト予測を用いて、バイアスのないアライメントを実行できます。RNA-seq実験とゲノムの特性に合わせてトレーニングできます。スプライスサイト／イントロンの検出や遺伝子モデルの構築に役立ちます。（より高速なバージョンについては、PALMapperをご覧ください。）				はい、クライアントサーバー	無料、GPL 2
レイザーS	リード長の制限はありません。ハミング距離または編集距離マッピングは、エラー率の設定が可能です。感度は設定可能かつ予測可能です（実行時間と感度のトレードオフ）。ペアエンドリードマッピングをサポートします。					無料、LGPL
リアル、クリアル	REALは、次世代シーケンシングで得られたショートリードをアライメントするための、効率的、正確、かつ高感度なツールです。このプログラムは、次世代Illumina/Solexa Genome Analyzerによって生成された膨大な量のシングルエンドリードを処理できます。cREALは、次世代シーケンシングで得られたショートリードを環状構造を持つゲノムにアライメントするための、REALのシンプルな拡張版です。		はい		はい	無料、GPL
RMAP	エラー確率情報（クオリティスコア）の有無にかかわらずリードをマッピングでき、ペアエンドリードまたはバイサルファイト処理されたリードマッピングをサポートします。リード長やミスマッチ数に制限はありません。	はい	はい	はい		無料、GPL 3
RNA	NGSリードの正確なアライメントのためのランダム化数値アライナ	はい	低品質のベースのトリミング	はい	マルチスレッドとMPI対応	無料、GPL 3
RTG調査員	極めて高速で、高いインデルおよび置換数にも耐性があります。フルリードアライメントが含まれています。製品には、Illumina、Complete Genomics、Roche 454データの任意の組み合わせによる変異検出とメタゲノム解析のための包括的なパイプラインが含まれています。	はい	はい、変異体呼び出しの場合	はい	はい	個人の研究者が使用するための独自のフリーウェア
セゲメル	挿入、削除、不一致を処理可能。拡張サフィックス配列を使用	はい	いいえ	はい	はい	非商用利用のための独自のフリーウェア	^[50]	2009
シーケンスマップ	最大5つの置換と挿入・削除の混合、さまざまなチューニングオプションと入出力形式					学術的および非商用目的の使用のための独自のフリーウェア
シュレック	サフィックスツリーデータ構造によるショートリードエラー訂正				はい、Java
シュリンプ	バージョン2の参照ゲノムをインデックスします。マスクを使用して可能なキーを生成します。ABI SOLiDカラースペースリードをマッピングできます。	はい	はい	はい	はい、OpenMP	フリー、[[BSDライセンス	フリー、BSD派生	^[51]^[52]	2009-2011
スライダー	Slider は、参照シーケンスまたは参照シーケンスセットへのアライメントの入力としてシーケンスファイルの代わりに「確率」ファイルを使用する Illumina Sequence Analyzer 出力用のアプリケーションです。	はい	はい	いいえ	いいえ		^[53]^[54]	2009-2010
SOAP、SOAP2、SOAP3、SOAP3-dp	SOAP: 少数（1～3）のギャップとミスマッチに対して堅牢です。BLATよりも高速で、12文字のハッシュテーブルを使用します。SOAP2: 双方向BWTを使用して参照インデックスを構築し、最初のバージョンよりも大幅に高速化されています。SOAP3: GPUアクセラレーション版では、4ミスマッチアライメントを100万回の読み取りあたり数十秒で検出できます。SOAP3-dpもGPUアクセラレーションに対応しており、アフィンギャップペナルティスコアに基づいて任意の数のミスマッチとギャップをサポートします。	はい	いいえ	はい、SOAP3-dp	はい、POSIX スレッド、SOAP3、SOAP3-dp にはCUDAをサポートする GPU が必要です。	無料、GPL	^[55]^[56]
ソックス	ABI SOLiDテクノロジー向け。ミスマッチ（またはカラーエラー）のあるリードのマッピング時間が大幅に増加します。Rabin-Karp文字列検索アルゴリズムの反復バージョンを使用します。				はい	無料、GPL
スパークBWA	Hadoop上で動作するApache Sparkフレームワークに Burrows–Wheeler Aligner（BWA）を統合します。2016年10月のバージョン0.2では、BWA-MEM、BWA-backtrack、BWA-ALNの各アルゴリズムをサポートしています。これらはすべて、シングルリードとペアエンドリードで動作します。	はい	低品質のベースのトリミング	はい	はい	無料、GPL 3	^[57]	2016
SSAHA、SSAHA2	少数の変異体に対して高速					学術的および非商用目的の使用のための独自のフリーウェア
スタンピー	Illuminaリード用。特異性が高く、インデル、構造変異、または多数のSNPを含むリードに対して感度が高い。処理速度は遅いが、最初のアライメントパスにBWAを使用することで速度が劇的に向上する。	はい	はい	はい	いいえ	学術的および非商用目的の使用のための独自のフリーウェア	^[58]	2010
嵐	IlluminaまたはABI SOLiDリード用。SAMネイティブ出力。エラーやインデル（0～15までは完全、それ以外は拡張サポート）の多いリードに対して高感度。スペースシード（シングルヒット）と非常に高速なSSE - SSE2 - AVX2 - AVX-512バンドアライメントフィルターを使用します。固定長リードのみを対象とし、それ以外の場合はSHRiMP2を推奨します。	いいえ	はい	はい	はい、OpenMP	無料	^[59]	2010
下臥位、下臥位	超高速かつ高精度なリードアライナー。SubreadはgDNA-seqとRNA-seqの両方のリードをマッピングできます。Subjuncはエクソン-エクソンジャンクションを検出し、RNA-seqリードをマッピングします。彼らはシード・アンド・ボートと呼ばれる新しいマッピングパラダイムを採用しています。	はい	はい	はい	はい	無料、GPL 3
タイパン	Illumina 読み取り用の De-novo アセンブラー					学術的および非商用目的の使用のための独自のフリーウェア
ウゲネ	BowtieとBWAの両方のビジュアルインターフェースと埋め込みアライナー	はい	はい	はい	はい	無料、GPL
ベロシマッパー	TimeLogic社のFPGAアクセラレーションによるリファレンス配列アライメントマッピングツール。BWAやBowtieなどのBurrows–Wheeler変換ベースのアルゴリズムよりも高速です。パフォーマンスの低下なく、最大7つのミスマッチおよび／またはインデルをサポートします。感度の高いSmith–Watermanギャップアライメントを生成します。	はい	はい	はい	はい	独自、商用
エクスプレスアライン	FPGAベースのスライディングウィンドウ・ショートリード・アライナーは、ショートリード・アライメントの驚異的な並列性を活用します。チップ上のトランジスタ数に比例してパフォーマンスが向上します（つまり、アルゴリズムを変更することなく、ムーアの法則の各反復ごとにパフォーマンスが2倍になることが保証されています）。低消費電力はデータセンター機器に有効です。実行時間は予測可能です。現在のハードウェア上で動作するソフトウェア・スライディングウィンドウ・アライナーよりも価格性能比は優れていますが、現状ではソフトウェアBWTベースのアライナーほどではありません。多数のミスマッチ（2以上）に対応可能です。すべてのシードに対してすべてのヒット位置を検出します。シングルFPGAの実験版であり、マルチFPGAの製品版への開発が必要です。					学術的および非商用目的の使用のための独自のフリーウェア
ズーム	15～240bpのリードに対し、実質的なミスマッチを含む100%の感度を実現。非常に高速。挿入と欠失に対応。IlluminaおよびSOLiD機器で動作しますが、454では動作しません。				はい (GUI)、いいえ (CLI)	独自、商用	^[60]

参照

オープンソースのバイオインフォマティクスソフトウェアのリスト

参考文献

^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (1990年10月). 「基本的なローカルアライメント検索ツール」. Journal of Molecular Biology . 215 (3): 403–10 . doi :10.1016/S0022-2836(05)80360-2. PMID 2231712. S2CID 14441902.{{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
^ HPC-BLAST コードリポジトリ https://github.com/UTennessee-JICS/HPC-BLAST
^ Angermüller, C.; Biegert, A.; Söding, J. (2012年12月). 「文脈特異的なアミノ酸置換確率の識別的モデリング」.バイオインフォマティクス. 28 (24): 3240–7 . doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID 23080114.
^ Buchfink, Xie and Huson (2015). 「DIAMONDを用いた高速かつ高感度なタンパク質アライメント」Nature Methods 12 (1): 59– 60. doi : 10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
^ B Buchfink、K Reuter、HG Drost (2021). 「DIAMONDを用いた生命樹スケールでの高感度タンパク質アラインメント」Nature Methods . 18 (4): 366– 368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID 33828273.
^ リチャード・ダービン、ショーン・R・エディ、アンダース・クロー、グレアム・ミッチソン編 (1998). 『生物学的配列解析：タンパク質と核酸の確率モデル』ケンブリッジ大学出版局（英国）. ISBN 978-0-521-62971-3。^{[ページが必要]}
^ Söding J (2005年4月). 「HMM-HMM比較によるタンパク質相同性検出」.バイオインフォマティクス. 21 (7): 951–60 . doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID 15531603.
^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). 「HHblits：HMM-HMMアライメントによる超高速反復タンパク質配列探索」. Nature Methods . 9 (2): 173– 175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN 1548-7105. PMID 22198341. S2CID 205420247.
^ Hauswedell H, Singer J, Reinert K (2014-09-01). 「Lambda: 大規模生物学的データのためのローカルアライナー」. Bioinformatics . 30 (17): 349– 355. doi :10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219 .
^ Steinegger, Martin; Soeding, Johannes (2017-10-16). 「MMseqs2は、大規模データセットの解析において高感度なタンパク質配列検索を可能にする」 . Nature Biotechnology . 35 (11): 1026– 1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID 29035372. S2CID 402352.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). 「OSWALD: Altera FPGA 上で動作する OpenCL Smith–Waterman による大規模タンパク質データベース」. International Journal of High Performance Computing Applications . 32 (3): 337– 350. doi :10.1177/1094342016654215. hdl : 11336/48798 . ISSN 1094-3420. S2CID 212680914.
^ Altschul SF, Madden TL, Schäffer AA, et al. (1997年9月). 「Gapped BLASTとPSI-BLAST：新世代のタンパク質データベース検索プログラム」. Nucleic Acids Research . 25 (17): 3389– 402. doi :10.1093/nar/25.17.3389. PMC 146917. PMID 9254694 .
^ Li W, McWilliam H, Goujon M, et al. (2012年6月). 「PSI-Search: 反復HOE縮小プロファイルSSEARCH検索」.バイオインフォマティクス. 28 (12): 1650– 1651. doi :10.1093/bioinformatics/bts240. PMC 337186 9. PMID 22539666.
^ Oehmen, C.; Nieplocha, J. (2006年8月). 「ScalaBLAST: 高性能データ集約型バイオインフォマティクス解析のためのスケーラブルなBLAST実装」. IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740– 749. doi :10.1109/TPDS.2006.112. S2CID 11122366.
^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: 配列アライメントおよびモデリングソフトウェアシステム. 技術レポート UCSC-CRL-99-11 (レポート). カリフォルニア大学サンタクルーズ校.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). 「IntelのマルチコアおよびメニーコアアーキテクチャにおけるSWIMM: Smith–Waterman実装のエネルギーを考慮したパフォーマンス分析」. Concurrency and Computation: Practice and Experience . 27 (18): 5517– 5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN 1532-0634. S2CID 42945406.
^ ルッチ、エンツォ;ガルシア、カルロス。ボテラ、ギレルモ。デ・ジュスティ、アルマンド。ナイウフ、マルセロ。プリエト＝マティアス、マヌエル（2015-12-25）。「SWIMM 2.0: AVX-512 ベクトル拡張に基づく Intel のマルチコアおよびメニーコアアーキテクチャ上の拡張 Smith-Waterman」。並列プログラミングの国際ジャーナル。47 (2): 296–317。土井:10.1007/s10766-018-0585-7。ISSN 1573-7640。S2CID 49670113。
^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). 「BLASTZを用いたヒト-マウスアライメント」. Genome Research . 13 (1): 103– 107. doi :10.1101/gr.809403. PMC 430961. PMID 12529312 . {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
^ Harris RS (2007).ゲノムDNAのペアワイズアライメントの改良（論文）.
^ Sandes, Edans F. de O.; de Melo, Alba Cristina MA (2013年5月). 「GPUを用いたメガベース生物学的配列のSmith-Watermanアライメントの取得と最適化」. IEEE Transactions on Parallel and Distributed Systems . 24 (5): 1009– 1021. doi :10.1109/TPDS.2012.194.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年5月). CUDAlign 3.0: 大規模GPUクラスターにおける並列生物学的配列比較. Cluster, Cloud and Grid Computing (CCGrid), 2014 第14回IEEE/ACM国際シンポジウム. p. 160. doi :10.1109/CCGrid.2014.18. hdl : 2117/24766 .
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年8月).複数の異種GPUを用いた細粒度並列メガベースシーケンス比較. 第19回ACM SIGPLAN並列プログラミングの原理と実践シンポジウムの議事録. pp. 383– 384. doi :10.1145/2555243.2555280. hdl : 2117/23094 .
^ Chivian, D; Baker, D (2006). 「パラメトリックアライメントアンサンブル生成を用いたコンセンサスおよびエネルギーベースのモデル選択によるホモロジーモデリング」. Nucleic Acids Research . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247. PMID 16971460 .
^ Girdea, M; Noe, L; Kucherov, G (2010年1月). 「フレームシフト変異が存在する場合の遠距離タンパク質相同性発見のためのバックトランスレーション」.分子生物学アルゴリズム. 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327. PMID 20047662 .
^ Ma, B.; Tromp, J.; Li, M. (2002). 「PatternHunter：より高速で高感度な相同性検索」.バイオインフォマティクス. 18 (3): 440– 445. doi : 10.1093/bioinformatics/18.3.440 . PMID 11934743.
^ Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). 「Patternhunter II：高感度かつ高速な相同性検索」. Journal of Bioinformatics and Computational Biology . 2 (3): 417– 439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID 15359419.
^ ガスフィールド、ダン (1997).文字列、木、シーケンスのアルゴリズム. ケンブリッジ大学出版局. ISBN 978-0-521-58519-4。
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). 「SWIFOLD: 長いDNA配列のためのOpenCLを用いたFPGAによるSmith-Waterman実装」. BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597. PMID 30458766 .
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. FPGA上でOpenCLを用いた長鎖DNA配列のSmith-Watermanアライメントの高速化. 第5回国際バイオインフォマティクスおよびバイオメディカルエンジニアリング研究会議. pp. 500– 511. doi :10.1007/978-3-319-56154-7_45.
^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). 「与えられた長さにおけるすべてのイプシロンマッチを見つけるための効率的なq-Gramフィルタ」. Journal of Computational Biology . 13 (2): 296– 308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID 16597241. {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)
^ Noe L, Kucherov G; Kucherov (2005). 「YASS：DNA類似性検索の感度向上」. Nucleic Acids Research . 33 (suppl_2): W540 – W543 . doi :10.1093/nar/gki478. PMC 1160238. PMID 15980530 .
^ プラタス、ディオゴ;シルバ、ホルヘ (2020)。「SARS-CoV-2の永続的な最小配列」。バイオインフォマティクス。36 (21): 5129–5132。土井: 10.1093/bioinformatics/btaa686。PMC 7559010。PMID 32730589。
^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). 「Arioc: GPUアクセラレーションによるシード・アンド・エクステンド探索空間の高スループットリードアライメント」. PeerJ . 3 e808. doi : 10.7717/peerj.808 . PMC 4358639. PMID 25780763 .
^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). 「BFAST: 大規模ゲノム再配列のためのアライメントツール」. PLOS ONE . 4 (11) e7767. Bibcode :2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639. PMID 19907642 .
^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). 「BigBWA：ビッグデータ技術へのBurrows–Wheelerアライナーのアプローチ」. Bioinformatics . 31 (24): 4003–5 . doi : 10.1093/bioinformatics/btv506 . PMID 26323715.
^ Kent, WJ (2002). 「BLAT---BLASTに似たアライメントツール」.ゲノム研究. 12 (4): 656– 664. doi :10.1101/gr.229202. ISSN 1088-9051. PMC 187518. PMID 11932250.
^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). 「ヒトゲノムに対する短いDNA配列の超高速かつメモリ効率の高いアライメント」. Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN 1465-6906. PMC 2690996. PMID 19261174 .
^ Li, H.; Durbin, R. (2009). 「Burrows–Wheeler変換を用いた高速かつ正確なショートリードアライメント」.バイオインフォマティクス. 25 (14): 1754– 1760. doi :10.1093/bioinformatics/btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168 .
^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). 「位置特異的スコアリングマトリックスを用いたショートリードの適応型確率マッピング」BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN 1471-2105. PMC 4021105 . PMID 24717095.
^ Liu, Y.; Schmidt, B.; Maskell, DL (2012). 「CUSHAW: Burrows–Wheeler変換に基づく大規模ゲノムに対するCUDA互換のショートリードアライナー」. Bioinformatics . 28 (14): 1830– 1837. doi : 10.1093/bioinformatics/bts276 . ISSN 1367-4803. PMID 22576173.
^ Liu, Y.; Schmidt, B. (2012). 「最大完全一致シードに基づくロングリードアライメント」.バイオインフォマティクス. 28 (18): i318 – i324 . doi :10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447 .
^ Rizk, Guillaume; Lavenier, Dominique (2010). 「GASSST: グローバルアライメント短鎖検索ツール」.バイオインフォマティクス. 26 (20): 2534– 2540. doi :10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310 .
^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). 「GEMマッパー：濾過による高速、正確、かつ汎用性の高いアライメント」. Nature Methods . 9 (12): 1185– 1188. doi :10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
^ Clement, NL; Snell, Q.; Clement, MJ; Hollenhorst, PC; Purwar, J.; Graves, BJ; Cairns, BR; Johnson, WE (2009). 「GNUMAPアルゴリズム：次世代シーケンシングによるオリゴヌクレオチドの偏りのない確率的マッピング」. Bioinformatics . 26 (1): 38– 45. doi :10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355 .
^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). 「HIVE-Hexagon: 次世代シーケンシングデータ解析のための高性能並列化配列アライメント」. PLOS ONE . 9 (6): 1754– 1760. Bibcode :2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384. PMID 24918764 .
^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). 「適応型種子がゲノム配列比較を抑制する」. Genome Research . 21 (3): 487– 493. doi :10.1101/gr.113985.110. PMC 3044862. PMID 21209072 .
^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). 「Mpscan: ゲノムにおける複数リードの高速ローカリゼーション」. Algorithms in Bioinformatics . Lecture Notes in Computer Science. Vol. 5724. pp. 246– 260. Bibcode :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9. S2CID 17187140。
^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). 「NextGenMap：高度に多型的なゲノムにおける高速かつ正確なリードマッピング」. Bioinformatics . 29 (21): 2790– 2791. doi : 10.1093/bioinformatics/btt468 . PMID 23975764.
^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). 「PerM: 周期的フルセンシティブ空間シードを用いた短いシーケンスリードの効率的なマッピング」.バイオインフォマティクス. 25 (19): 2514– 2521. doi :10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096 .
^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). 「インデックス構造を用いたミスマッチ、挿入、欠失を伴う短い配列の高速マッピング」. PLOS Computational Biology . 5 (9) e1000502. Bibcode :2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN 1553-7358. PMC 2730575. PMID 19750212 .
^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). 「SHRiMP: 短い色空間リードの正確なマッピング」. PLOS Computational Biology . 5 (5) e1000386. Bibcode :2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294. PMID 19461883 .
^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). 「SHRiMP2: 高感度かつ実用的なショートリードマッピング」.バイオインフォマティクス. 27 (7): 1011– 1012. doi : 10.1093/bioinformatics/btr046 . PMID 21278192.
^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). 「スライダー – 短いシーケンスリードのアライメントとSNP検出における確率情報の最大活用」.バイオインフォマティクス. 25 (1): 6– 13. doi :10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170 .
^ Malhis, Nawar; Jones, Steven JM (2010). 「浅いカバレッジにおけるイルミナデータを用いた高品質SNPコーリング」バイオインフォマティクス26 (8): 1029– 1035. doi :10.1093/bioinformatics/btq092. PMID 20190250.
^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). 「SOAP: ショートオリゴヌクレオチドアライメントプログラム」.バイオインフォマティクス. 24 (5): 713– 714. doi : 10.1093/bioinformatics/btn025 . ISSN 1367-4803. PMID 18227114.
^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). 「SOAP2：ショートリードアライメントのための改良型超高速ツール」.バイオインフォマティクス. 25 (15): 1966– 1967. doi :10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
^ アブイン、ホセ M.;ピチェル、フアン C.ペナ、トマス F.アミーゴ、ホルヘ (2016-05-16)。「SparkBWA: ハイスループット DNA シーケンスデータのアライメントの高速化」。プロスワン。11 (5) e0155461。Bibcode :2016PLoSO..1155461A。土井：10.1371/journal.pone.0155461。ISSN 1932-6203。PMC 4868289。PMID 27182962。
^ Lunter, G.; Goodson, M. (2010). 「Stampy: Illuminaシーケンスリードの高感度かつ高速マッピングのための統計アルゴリズム」. Genome Research . 21 (6): 936– 939. doi :10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556 .
^ Noe, L.; Girdea, M.; Kucherov, G. (2010). 「SOLiDリードマッピングのための効率的な空間シードの設計」. Advances in Bioinformatics . 2010 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID 20936175 .
^ Lin, H.; Zhang, Z.; Zhang, MQ; Ma, B.; Li, M. (2008). 「ZOOM! 膨大なオリゴをマッピング」.バイオインフォマティクス. 24 (21): 2431– 2437. doi :10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737 .

[1] Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (1990年10月). 「基本的なローカルアライメント検索ツール」. Journal of Molecular Biology . 215 (3): 403–10 . doi :10.1016/S0022-2836(05)80360-2. PMID 2231712. S2CID 14441902.{{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)

[2] HPC-BLAST コードリポジトリ https://github.com/UTennessee-JICS/HPC-BLAST

[3] Angermüller, C.; Biegert, A.; Söding, J. (2012年12月). 「文脈特異的なアミノ酸置換確率の識別的モデリング」.バイオインフォマティクス. 28 (24): 3240–7 . doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID 23080114.

[4] Buchfink, Xie and Huson (2015). 「DIAMONDを用いた高速かつ高感度なタンパク質アライメント」Nature Methods 12 (1): 59– 60. doi : 10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.

[5] B Buchfink、K Reuter、HG Drost (2021). 「DIAMONDを用いた生命樹スケールでの高感度タンパク質アラインメント」Nature Methods . 18 (4): 366– 368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID 33828273.

[6] リチャード・ダービン、ショーン・R・エディ、アンダース・クロー、グレアム・ミッチソン編 (1998). 『生物学的配列解析：タンパク質と核酸の確率モデル』ケンブリッジ大学出版局（英国）. ISBN 978-0-521-62971-3。^{[ページが必要]}

[7] Söding J (2005年4月). 「HMM-HMM比較によるタンパク質相同性検出」.バイオインフォマティクス. 21 (7): 951–60 . doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID 15531603.

[8] Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (2011-12-25). 「HHblits：HMM-HMMアライメントによる超高速反復タンパク質配列探索」. Nature Methods . 9 (2): 173– 175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN 1548-7105. PMID 22198341. S2CID 205420247.

[9] Hauswedell H, Singer J, Reinert K (2014-09-01). 「Lambda: 大規模生物学的データのためのローカルアライナー」. Bioinformatics . 30 (17): 349– 355. doi :10.1093/bioinformatics/btu439. PMC 4147892. PMID 25161219 .

[10] Steinegger, Martin; Soeding, Johannes (2017-10-16). 「MMseqs2は、大規模データセットの解析において高感度なタンパク質配列検索を可能にする」 . Nature Biotechnology . 35 (11): 1026– 1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID 29035372. S2CID 402352.

[11] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (2016-06-30). 「OSWALD: Altera FPGA 上で動作する OpenCL Smith–Waterman による大規模タンパク質データベース」. International Journal of High Performance Computing Applications . 32 (3): 337– 350. doi :10.1177/1094342016654215. hdl : 11336/48798 . ISSN 1094-3420. S2CID 212680914.

[12] Altschul SF, Madden TL, Schäffer AA, et al. (1997年9月). 「Gapped BLASTとPSI-BLAST：新世代のタンパク質データベース検索プログラム」. Nucleic Acids Research . 25 (17): 3389– 402. doi :10.1093/nar/25.17.3389. PMC 146917. PMID 9254694 .

[13] Li W, McWilliam H, Goujon M, et al. (2012年6月). 「PSI-Search: 反復HOE縮小プロファイルSSEARCH検索」.バイオインフォマティクス. 28 (12): 1650– 1651. doi :10.1093/bioinformatics/bts240. PMC 337186 9. PMID 22539666.

[14] Oehmen, C.; Nieplocha, J. (2006年8月). 「ScalaBLAST: 高性能データ集約型バイオインフォマティクス解析のためのスケーラブルなBLAST実装」. IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740– 749. doi :10.1109/TPDS.2006.112. S2CID 11122366.

[15] Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: 配列アライメントおよびモデリングソフトウェアシステム. 技術レポート UCSC-CRL-99-11 (レポート). カリフォルニア大学サンタクルーズ校.

[16] Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). 「IntelのマルチコアおよびメニーコアアーキテクチャにおけるSWIMM: Smith–Waterman実装のエネルギーを考慮したパフォーマンス分析」. Concurrency and Computation: Practice and Experience . 27 (18): 5517– 5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN 1532-0634. S2CID 42945406.

[17] ルッチ、エンツォ;ガルシア、カルロス。ボテラ、ギレルモ。デ・ジュスティ、アルマンド。ナイウフ、マルセロ。プリエト＝マティアス、マヌエル（2015-12-25）。「SWIMM 2.0: AVX-512 ベクトル拡張に基づく Intel のマルチコアおよびメニーコアアーキテクチャ上の拡張 Smith-Waterman」。並列プログラミングの国際ジャーナル。47 (2): 296–317。土井:10.1007/s10766-018-0585-7。ISSN 1573-7640。S2CID 49670113。

[18] Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). 「BLASTZを用いたヒト-マウスアライメント」. Genome Research . 13 (1): 103– 107. doi :10.1101/gr.809403. PMC 430961. PMID 12529312 . {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)

[19] Harris RS (2007).ゲノムDNAのペアワイズアライメントの改良（論文）.

[20] Sandes, Edans F. de O.; de Melo, Alba Cristina MA (2013年5月). 「GPUを用いたメガベース生物学的配列のSmith-Watermanアライメントの取得と最適化」. IEEE Transactions on Parallel and Distributed Systems . 24 (5): 1009– 1021. doi :10.1109/TPDS.2012.194.

[21] Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年5月). CUDAlign 3.0: 大規模GPUクラスターにおける並列生物学的配列比較. Cluster, Cloud and Grid Computing (CCGrid), 2014 第14回IEEE/ACM国際シンポジウム. p. 160. doi :10.1109/CCGrid.2014.18. hdl : 2117/24766 .

[22] Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (2014年8月).複数の異種GPUを用いた細粒度並列メガベースシーケンス比較. 第19回ACM SIGPLAN並列プログラミングの原理と実践シンポジウムの議事録. pp. 383– 384. doi :10.1145/2555243.2555280. hdl : 2117/23094 .

[23] Chivian, D; Baker, D (2006). 「パラメトリックアライメントアンサンブル生成を用いたコンセンサスおよびエネルギーベースのモデル選択によるホモロジーモデリング」. Nucleic Acids Research . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247. PMID 16971460 .

[24] Girdea, M; Noe, L; Kucherov, G (2010年1月). 「フレームシフト変異が存在する場合の遠距離タンパク質相同性発見のためのバックトランスレーション」.分子生物学アルゴリズム. 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327. PMID 20047662 .

[25] Ma, B.; Tromp, J.; Li, M. (2002). 「PatternHunter：より高速で高感度な相同性検索」.バイオインフォマティクス. 18 (3): 440– 445. doi : 10.1093/bioinformatics/18.3.440 . PMID 11934743.

[26] Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). 「Patternhunter II：高感度かつ高速な相同性検索」. Journal of Bioinformatics and Computational Biology . 2 (3): 417– 439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID 15359419.

[27] ガスフィールド、ダン (1997).文字列、木、シーケンスのアルゴリズム. ケンブリッジ大学出版局. ISBN 978-0-521-58519-4。

[28] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). 「SWIFOLD: 長いDNA配列のためのOpenCLを用いたFPGAによるSmith-Waterman実装」. BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597. PMID 30458766 .

[29] Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. FPGA上でOpenCLを用いた長鎖DNA配列のSmith-Watermanアライメントの高速化. 第5回国際バイオインフォマティクスおよびバイオメディカルエンジニアリング研究会議. pp. 500– 511. doi :10.1007/978-3-319-56154-7_45.

[30] Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). 「与えられた長さにおけるすべてのイプシロンマッチを見つけるための効率的なq-Gramフィルタ」. Journal of Computational Biology . 13 (2): 296– 308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID 16597241. {{cite journal}}: CS1 maint: 複数の名前: 著者リスト (リンク)

[31] Noe L, Kucherov G; Kucherov (2005). 「YASS：DNA類似性検索の感度向上」. Nucleic Acids Research . 33 (suppl_2): W540 – W543 . doi :10.1093/nar/gki478. PMC 1160238. PMID 15980530 .

[Pratas2020-32] プラタス、ディオゴ;シルバ、ホルヘ (2020)。「SARS-CoV-2の永続的な最小配列」。バイオインフォマティクス。36 (21): 5129–5132。土井: 10.1093/bioinformatics/btaa686。PMC 7559010。PMID 32730589。

[WiltonEtAl2015-33] Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). 「Arioc: GPUアクセラレーションによるシード・アンド・エクステンド探索空間の高スループットリードアライメント」. PeerJ . 3 e808. doi : 10.7717/peerj.808 . PMC 4358639. PMID 25780763 .

[HomerMerrimanNelson2009-34] Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). 「BFAST: 大規模ゲノム再配列のためのアライメントツール」. PLOS ONE . 4 (11) e7767. Bibcode :2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639. PMID 19907642 .

[Abuin2015-35] Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). 「BigBWA：ビッグデータ技術へのBurrows–Wheelerアライナーのアプローチ」. Bioinformatics . 31 (24): 4003–5 . doi : 10.1093/bioinformatics/btv506 . PMID 26323715.

[Kent2002-36] ^ Kent, WJ (2002). 「BLAT---BLASTに似たアライメントツール」.ゲノム研究. 12 (4): 656– 664. doi :10.1101/gr.229202. ISSN 1088-9051. PMC 187518. PMID 11932250.

[LangmeadTrapnell2009-37] Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). 「ヒトゲノムに対する短いDNA配列の超高速かつメモリ効率の高いアライメント」. Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN 1465-6906. PMC 2690996. PMID 19261174 .

[LiDurbin2009-38] Li, H.; Durbin, R. (2009). 「Burrows–Wheeler変換を用いた高速かつ正確なショートリードアライメント」.バイオインフォマティクス. 25 (14): 1754– 1760. doi :10.1093/bioinformatics/btp324. ISSN 1367-4803. PMC 2705234. PMID 19451168 .

[KerpedjievFrellsen2014-39] Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). 「位置特異的スコアリングマトリックスを用いたショートリードの適応型確率マッピング」BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN 1471-2105. PMC 4021105 . PMID 24717095.

[LiuSchmidt2012a-40] Liu, Y.; Schmidt, B.; Maskell, DL (2012). 「CUSHAW: Burrows–Wheeler変換に基づく大規模ゲノムに対するCUDA互換のショートリードアライナー」. Bioinformatics . 28 (14): 1830– 1837. doi : 10.1093/bioinformatics/bts276 . ISSN 1367-4803. PMID 22576173.

[LiuSchmidt2012b-41] Liu, Y.; Schmidt, B. (2012). 「最大完全一致シードに基づくロングリードアライメント」.バイオインフォマティクス. 28 (18): i318 – i324 . doi :10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841. PMID 22962447 .

[RizkLavenier2012-42] Rizk, Guillaume; Lavenier, Dominique (2010). 「GASSST: グローバルアライメント短鎖検索ツール」.バイオインフォマティクス. 26 (20): 2534– 2540. doi :10.1093/bioinformatics/btq485. PMC 2951093. PMID 20739310 .

[Marco-SolaSammeth2012-43] Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). 「GEMマッパー：濾過による高速、正確、かつ汎用性の高いアライメント」. Nature Methods . 9 (12): 1185– 1188. doi :10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.

[ClementSnell2009-44] Clement, NL; Snell, Q.; Clement, MJ; Hollenhorst, PC; Purwar, J.; Graves, BJ; Cairns, BR; Johnson, WE (2009). 「GNUMAPアルゴリズム：次世代シーケンシングによるオリゴヌクレオチドの偏りのない確率的マッピング」. Bioinformatics . 26 (1): 38– 45. doi :10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904. PMID 19861355 .

[VSimonyan2014-45] Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). 「HIVE-Hexagon: 次世代シーケンシングデータ解析のための高性能並列化配列アライメント」. PLOS ONE . 9 (6): 1754– 1760. Bibcode :2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384. PMID 24918764 .

[46] Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). 「適応型種子がゲノム配列比較を抑制する」. Genome Research . 21 (3): 487– 493. doi :10.1101/gr.113985.110. PMC 3044862. PMID 21209072 .

[RivalsEtAl2009-47] Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). 「Mpscan: ゲノムにおける複数リードの高速ローカリゼーション」. Algorithms in Bioinformatics . Lecture Notes in Computer Science. Vol. 5724. pp. 246– 260. Bibcode :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9. S2CID 17187140。

[SedlazeckReschenederVonHaeseler2013-48] Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). 「NextGenMap：高度に多型的なゲノムにおける高速かつ正確なリードマッピング」. Bioinformatics . 29 (21): 2790– 2791. doi : 10.1093/bioinformatics/btt468 . PMID 23975764.

[ChenSouaiaiaChen2009-49] Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). 「PerM: 周期的フルセンシティブ空間シードを用いた短いシーケンスリードの効率的なマッピング」.バイオインフォマティクス. 25 (19): 2514– 2521. doi :10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096 .

[SearlsHoffmann2009-50] Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). 「インデックス構造を用いたミスマッチ、挿入、欠失を伴う短い配列の高速マッピング」. PLOS Computational Biology . 5 (9) e1000502. Bibcode :2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN 1553-7358. PMC 2730575. PMID 19750212 .

[RumbleLacrouteDalcaFiumeSidowBrudno2009-51] Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). 「SHRiMP: 短い色空間リードの正確なマッピング」. PLOS Computational Biology . 5 (5) e1000386. Bibcode :2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294. PMID 19461883 .

[DavidDzambaListerIlieBrudno2011-52] David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). 「SHRiMP2: 高感度かつ実用的なショートリードマッピング」.バイオインフォマティクス. 27 (7): 1011– 1012. doi : 10.1093/bioinformatics/btr046 . PMID 21278192.

[MalhisButterfieldEsterJones2009-53] Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). 「スライダー – 短いシーケンスリードのアライメントとSNP検出における確率情報の最大活用」.バイオインフォマティクス. 25 (1): 6– 13. doi :10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170 .

[MalhisJones2010-54] Malhis, Nawar; Jones, Steven JM (2010). 「浅いカバレッジにおけるイルミナデータを用いた高品質SNPコーリング」バイオインフォマティクス26 (8): 1029– 1035. doi :10.1093/bioinformatics/btq092. PMID 20190250.

[LiLi2008-55] Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). 「SOAP: ショートオリゴヌクレオチドアライメントプログラム」.バイオインフォマティクス. 24 (5): 713– 714. doi : 10.1093/bioinformatics/btn025 . ISSN 1367-4803. PMID 18227114.

[LiYu2009-56] Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). 「SOAP2：ショートリードアライメントのための改良型超高速ツール」.バイオインフォマティクス. 25 (15): 1966– 1967. doi :10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.

[57] アブイン、ホセ M.;ピチェル、フアン C.ペナ、トマス F.アミーゴ、ホルヘ (2016-05-16)。「SparkBWA: ハイスループット DNA シーケンスデータのアライメントの高速化」。プロスワン。11 (5) e0155461。Bibcode :2016PLoSO..1155461A。土井：10.1371/journal.pone.0155461。ISSN 1932-6203。PMC 4868289。PMID 27182962。

[LunterGoodson2010-58] Lunter, G.; Goodson, M. (2010). 「Stampy: Illuminaシーケンスリードの高感度かつ高速マッピングのための統計アルゴリズム」. Genome Research . 21 (6): 936– 939. doi :10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326. PMID 20980556 .

[NoeGirdeaKucherov2010-59] Noe, L.; Girdea, M.; Kucherov, G. (2010). 「SOLiDリードマッピングのための効率的な空間シードの設計」. Advances in Bioinformatics . 2010 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID 20936175 .

[LinZhangZhangMaLi2008-60] Lin, H.; Zhang, Z.; Zhang, MQ; Ma, B.; Li, M. (2008). 「ZOOM! 膨大なオリゴをマッピング」.バイオインフォマティクス. 24 (21): 2431– 2437. doi :10.1093/bioinformatics/btn416. PMC 2732274. PMID 18684737 .