NCBI BLASTのインストール

NCBI BLASTをインストールします。

1. NCBI BLAST

ftp://ftp.ncbi.nih.gov/blast/executables/からMacOSX用のバイナリーをダウンロードします。私は、blast-2.2.16-universal-macosx.tar.gzを落としました。
/bio/blast/というディレクトリーを作って、その中に展開したファイルを全部入れます。(好きなディレクトリーを作って構いません。)
ディレクトリーを作るには認証が必要となりますが、Terminalからディレクトリーを作るにはsudoで、GUIからは「認証」で、パスワードを入れれば実行可能です。


自分のホームディレクトリーで、環境設定します。
.ncbircを作成し、以下の内容を書き込みます。


[NCBI]
Data=/bio/blast/data
[BLAST]
BLASTDB=/bio/blast/db


.cshrcを開き、パスの追加をします。


set path=($path /bio/blast/bin)

2. NCBI BLAST用のデータベース

NCBI BLAST用のデータベースをダウンロードします。ftp://ftp.ncbi.nih.gov/blast/db/からダウンロードできます。(追記:ヒューマンゲノムセンターhttp://www.hgc.jp/japanese/のミラーからダウンロードした方が早いです。)
ftp://ftp.ncbi.nih.gov/blast/db/FASTA/から、目的のファイルをダウンロードします。
ダウンロードして展開したら、/bio/blast/db/にファイルを置いて、ファイルをフォーマットします。
/bio/blast/db/は作業しやすいように書き込み可能にしておきました。


% formatdb -i データベース名 -p T -o T


オプションは、アミノ酸配列の場合は[-p T -o T]で、塩基配列の場合は[-p F -o T]となります。
すでにフォーマットされたファイルをダウンロードすることもできます。update_blastdb.plを使うと便利です。
/bio/blast/bin/にupdate_blastdb.plを置き、実行可能モードにしておきます。/bio/blast/db/に移動してから、


% update_blastdb.pl データベース名
% tar zxvf データベース名.tar.gz


で、ダウンロード、展開すると、フォーマットされたデータベースが出来ます。


% update_blastdb.pl -showall


で、データベースの一覧を見ることができます。
pdbaaは、違うフォーマットのようだったのでftpFASTAファイルを落として自分でフォーマットしました。
nrはnr.00だけダウンロードされてnr.01がダウンロードされなかったので、ftpから落としました。

3. 実行テスト

pdbaa(PDBに登録されているタンパク質のアミノ酸配列)をダウンロード+フォーマットしてテストしてみました。
検索用の配列として、TNFの配列を使います。


>TNFa
mstesmirdv elaeealpkk tggpqgsrrc lflslfsfli vagattlfcl lhfgvigpqr
eefprdlsli splaqavrss srtpsdkpva hvvanpqaeg qlqwlnrran allangvelr
dnqlvvpseg lyliysqvlf kgqgcpsthv llthtisria vsyqtkvnll saikspcqre
tpegaeakpw yepiylggvf qlekgdrlsa einrpdyldf aesgqvyfgi ial


test.fasに配列をコピーしておきます。


% blastall -p blastp -d pdbaa -i test.fas -o test.out


無事に動きました。test.outに結果が出力されます。