LASTZ

  2016 年 1 月 6 日 改訂
LASTZ はゲノムアライメントを行うソフトウェアです.2 つの配列だけを比較する pairwise alignment を行います.2016 年 1 月の時点 (Ver. 1.03.73) では,頻繁にバージョンアップがなされています.正式リリースは Ver. 1.02.00 のようですが,改定を重ねているので最新版を使ったほうが良いと思います.

以前使われていた BLASTZ というソフトウェアをバージョンアップさせたプログラムのようです.マニュアルはこちらです.UCSC Ensembl でもゲノムアライメントに LASTZ を使っているようです.

Mailling list (Lastz-users Archives) はこちらです (メンバーになる必要があります).LASTZ の作者は Bob Harris さんです.Google 検索などでヒットする LASTZ の質問コーナーで,答えを書いていることがあります.
インストール

以下の手順でインストールを行います.

[junINOUEb:src]$ pwd
/Users/junINOUEb/lastz-distrib-1.02.00/src
[junINOUEb:src]$ make
[junINOUEb:src]$ make install
install -d /Users/junINOUEb/lastz-distrib/bin
install lastz /Users/junINOUEb/lastz-distrib/bin
install lastz_D /Users/junINOUEb/lastz-distrib/bin
[junINOUEb:src]$ test
[junINOUEb:src]$

lastz と lastz_d という二つのプログラムが作成されますが,両者はほぼ同じプログラムです.



Mac に Ver. 1.02.00 (Official version) をインストールしたら,以下のようなエラーが出ました.

[junINOUEpro:src]$ make
gcc -c -O3 -Wall -Wextra -Werror -D_FILE_OFFSET_BITS=64 -D_LARGEFILE_SOURCE -DVERSION_MAJOR="\"1"\" -DVERSION_MINOR="\"02"\" -DVERSION_SUBMINOR="\"00"\" -DREVISION_DATE="\"20100112"\" -DSUBVERSION_REV="\"1278:1279M"\" -Dscore_type=\'I\' lastz.c -o lastz.o
....
" -Dscore_type=\'I\' segment.c -o segment.o
segment.c:1330:10: error: comparison of array 'st->seg' equal to a null pointer is always false
[-Werror,-Wtautological-pointer-compare]
if (st->seg == NULL) return;
~~~~^~~ ~~~~
1 error generated.
make: *** [segment.o] Error 1

[junINOUEpro:src]$

マニュアルに従ってMakefile の 31 行目にある -Werror を取り除いたら,うまくインストールできました.-Werror が警告を発しているので,-Werror を取り除けば一応は動くみたいです.

# definedForAll = -Wall -Wextra -Werror -D_FILE_OFFSET_BITS=64 -D_LARGEFILE_SOURCE

= 以下のように変更 =>

# definedForAll = -Wall -Wextra -D_FILE_OFFSET_BITS=64 -D_LARGEFILE_SOURCE

こちら参考にしました.


多重アライメント
LASTZ で得られたペアワイズアライメントを,TBA というソフトウェアのパッケージで解析するようです.LASTZ の質問コーナ (May 2011) に,Whole genome alignment howto に書いてある多重アライメンント作成は UCSC が行っている方法とほぼ同じと書いてありました.

こちらも参照してください.
.2bit file
twoBit file は,ゲノムデータを軽くして保存する形式です.UCSC が開発したようです.こちら (Source & Utilities Downloads > Utilities - ...utilities directory: > ) から自分の PC にあったプログラムをダウンロードして用いて下さい.コンパイル済みのプログラムが配布されています.以下の例は,macOSX.i366 から faToTwoBit をダウンロードして使っています.

# 自分の PC のプロセッサを調べます.
[junINOUEb:Downloads]$ uname -p
i386
# ファイルに実行権限を与えます.
[junINOUEb:Downloads]$ chmod +x faToTwoBit  
# 動作確認してみます.
[junINOUEb:Downloads]$ ./faToTwoBit
faToTwoBit - Convert DNA from fasta to 2bit format
usage:
faToTwoBit in.fa [in2.fa in3.fa ...] out.2bit
options:
-noMask - Ignore lower-case masking in fa file.
-stripVersion - Strip off version number after . for genbank accessions.
-ignoreDups - only convert first sequence if there are duplicate sequence
- names. Use 'twoBitDup' to find duplicate sequences.



リンク
 
TwoBit Sequence Archives (UCSC)