NCBI BLASTのインストール
NCBI BLASTをインストールします。
1. NCBI BLAST
ftp://ftp.ncbi.nih.gov/blast/executables/からMacOSX用のバイナリーをダウンロードします。私は、blast-2.2.16-universal-macosx.tar.gzを落としました。
/bio/blast/というディレクトリーを作って、その中に展開したファイルを全部入れます。(好きなディレクトリーを作って構いません。)
ディレクトリーを作るには認証が必要となりますが、Terminalからディレクトリーを作るにはsudoで、GUIからは「認証」で、パスワードを入れれば実行可能です。
自分のホームディレクトリーで、環境設定します。
.ncbircを作成し、以下の内容を書き込みます。
[NCBI]
Data=/bio/blast/data
[BLAST]
BLASTDB=/bio/blast/db
.cshrcを開き、パスの追加をします。
set path=($path /bio/blast/bin)
2. NCBI BLAST用のデータベース
NCBI BLAST用のデータベースをダウンロードします。ftp://ftp.ncbi.nih.gov/blast/db/からダウンロードできます。(追記:ヒューマンゲノムセンターhttp://www.hgc.jp/japanese/のミラーからダウンロードした方が早いです。)
ftp://ftp.ncbi.nih.gov/blast/db/FASTA/から、目的のファイルをダウンロードします。
ダウンロードして展開したら、/bio/blast/db/にファイルを置いて、ファイルをフォーマットします。
/bio/blast/db/は作業しやすいように書き込み可能にしておきました。
% formatdb -i データベース名 -p T -o T
オプションは、アミノ酸配列の場合は[-p T -o T]で、塩基配列の場合は[-p F -o T]となります。
すでにフォーマットされたファイルをダウンロードすることもできます。update_blastdb.plを使うと便利です。
/bio/blast/bin/にupdate_blastdb.plを置き、実行可能モードにしておきます。/bio/blast/db/に移動してから、
% update_blastdb.pl データベース名
% tar zxvf データベース名.tar.gz
で、ダウンロード、展開すると、フォーマットされたデータベースが出来ます。
% update_blastdb.pl -showall
で、データベースの一覧を見ることができます。
pdbaaは、違うフォーマットのようだったのでftpでFASTAファイルを落として自分でフォーマットしました。
nrはnr.00だけダウンロードされてnr.01がダウンロードされなかったので、ftpから落としました。
3. 実行テスト
pdbaa(PDBに登録されているタンパク質のアミノ酸配列)をダウンロード+フォーマットしてテストしてみました。
検索用の配列として、TNFの配列を使います。
>TNFa
mstesmirdv elaeealpkk tggpqgsrrc lflslfsfli vagattlfcl lhfgvigpqr
eefprdlsli splaqavrss srtpsdkpva hvvanpqaeg qlqwlnrran allangvelr
dnqlvvpseg lyliysqvlf kgqgcpsthv llthtisria vsyqtkvnll saikspcqre
tpegaeakpw yepiylggvf qlekgdrlsa einrpdyldf aesgqvyfgi ial
test.fasに配列をコピーしておきます。
% blastall -p blastp -d pdbaa -i test.fas -o test.out
無事に動きました。test.outに結果が出力されます。