RepeatMasker

RepeatMasker

ゲノム配列の反復配列マスキングの定番ソフトウェア。手法は単純で反復配列のデータベースに対して、cross_match(Smith-Waterman-Gotoh algolism)、WU-BLAST(blast algolism)、あるいは
DeCypherで相同性検索をし、ヒットした部分をマスクする。
上記3つのソフトウェアのいずれかが入っていなければ動かない。
WU-BLASTのインストール方法は、WU-BLAST参照。(cross_matchの方が感度は高いが、WU-BLASTの方が速度が速くメモリ容量も少ないので、私はWU-BLASTを使用しています。MacBookProではcross_matchを使うとメモリー不足でエラーが出た。)

無料でRepeatMasker Home Pageから入手できる。

2007/06/26時点でのファイル名は、
RepeatMasker-open-3-1-8.tar.gz (version 3.1.8)

解凍はダブルクリックか、
ターミナルから
$ gunzip blast2.macosx-x64.tar.Z
$ tar xvf blast2.macosx-x64.tar

解凍の後、フォルダに移動して、
$ perl ./configure

すると、スクリプトによる初期設定ができるので、
perlのパスと
相同性検索プログラム(cross_match/WU-BLAST/DeCypher)のパスを指定し、いずれかをDefaultにする。

続いて、Libraryに反復配列のデータベースを入れる必要がある。
データベースは、Repbaseを使用する。Repbaseの使用には登録が必要になるので、Free registrationの画面に必要事項を入力する。メールアドレスには大学・研究所等の発行するものを記入すること。非商用ユーザーは無料で使用できる。
下記のようなメールが返信されてくるので、所属する施設が非商用のものであることと自分の地位を書いて知らせる。学生の場合には、スタッフに頼むべきであろう。
Please confirm a non-profit status of your institution,
and that you are a faculty/permanent staff member who
can take responsibilities under the academic agreement,
or ask authorized person to send a confirmation from
his/her email address, on your behalf.
順調に進めば、メールでusernameとpasswordが送られてくるのでアクセスしてデータベースを取得する。

2007/06/26時点の最新版は、
repeatmaskerlibraries-20061006.tar.gz 

解凍して、フォルダ内のRepeatMaskerLib.emblをRepeatMaskerのLibrariesフォルダに移動する。

初回起動時にライブラリの設定が行われる。(Librariesに何も入っていないとエラーが出て使用できない。)


Citations

RepeatMasker

Repbase
  • Jurka, J., Kapitonov, V.V., Pavlicek, A., Klonowski, P., Kohany, O., Walichiewicz, J. (2005) Repbase Update, a database of eukaryotic repetitive elements. Cytogentic and Genome Research 110:462-467
最終更新:2007年06月26日 12:35
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。